신문은 선생님

[재미있는 과학] 숯이 된 폼페이 문서… 종이 질감 차이를 AI로 분석해 읽어

입력 : 2024.02.20 03:30

2000년 전 고문서 해독 AI

[재미있는 과학] 숯이 된 폼페이 문서… 종이 질감 차이를 AI로 분석해 읽어
손대지 않고도 책의 내용을 읽을 수 있는 마법이 있다고 가정해 볼게요. 친구들은 이 마법을 어떻게 쓸 것 같나요? 이는 마법이 아니라 실제로 구현 가능한 기술이랍니다. 그리고 과학자들은 이를 활용해 화산 폭발로 망가진 오래된 문서를 읽고 있습니다. 마법 같은 대회 '베수비오 챌린지' 이야기지요. 이곳에선 과연 어떤 일이 벌어지는 걸까요?

총 상금 10억원 걸고 '두루마리 해독 대회'

'베수비오 챌린지' 대회는 지난해 3월 시작됐어요. 주최 측은 고대 두루마리 문서를 촬영한 사진과 문서 조각을 공개하고, 그 안에 담긴 내용을 해독하면 상금으로 총 100만달러(약 13억3500만원)를 수여하겠다고 발표했어요. 이 대회엔 무려 전 세계 과학자 1500명이 참여하고 있답니다.

해독해야 하는 고대 두루마리 문서는 이탈리아 나폴리 지역에서 발굴됐어요. 지난 1752년 이곳에 살던 농부들이 땅속 20m 지점에서 유물을 발견했어요. 이 유물들은 지금으로부터 약 2000년 전인 서기 79년에 인근에 있던 베수비오 화산이 폭발하면서 묻혔던 것이죠. 첫 유물 발견 이후 본격적인 발굴 작업이 시작됐습니다. 여기서 문제의 두루마리 문서가 세상 밖으로 나오게 됐지요.

학자들은 두루마리 문서를 해독하면 폼페이 등 번성했던 고대 도시에 살던 사람들의 생활을 엿볼 수 있을 것으로 기대했어요. 폼페이는 베수비오 화산이 폭발하면서 뿜어져 나온 용암과 유독 가스, 화산재로 도시 전체가 일순간 잿더미가 돼 완전히 사라져 버렸기 때문에, 두루마리 문서가 당시 모습을 구체적으로 전해주길 바랐어요.

이 두루마리는 파피루스 종이로 만들어졌습니다. 당시 사람들은 나일강 주변에서 자라는 식물인 파피루스의 줄기를 종이로 사용했어요. 딱딱한 껍질 안에 있는 부드러운 줄기를 얇게 찢고, 가로 세로 두 겹으로 겹친 뒤, 건조시켜 기다란 종이를 만든 거예요. 여기에 글을 쓰고 돌돌 말아 보관했습니다. 마치 두루마리 휴지 같은 모양이죠.

그런데 오랫동안 두루마리에는 손조차 대지 못했어요. 두루마리는 고온의 화산재에 뒤덮이면서 직접적으로 불에 타지는 않았어요. 다만 화산재의 열에 오래 노출되면서 섬유로 이뤄진 파피루스 종이가 숯으로 변해버렸어요. 이를 '탄화'라고 해요. 탄화된 파피루스는 작은 힘에도 쉽게 부스러져요. 두루마리를 선뜻 펼쳐볼 수 없었어요.

전 세계 두뇌가 함께 방법 고민

과학자들은 이 문제를 해결하려면 과학기술을 이용해 직접 펼치지 않고도 안의 내용을 읽는 방법밖에 없다고 생각했어요. 미국 켄터키대 컴퓨터과학과의 브렌트 실즈 교수팀은 엑스레이와 고해상도 컴퓨터단층촬영(CT)으로 파피루스 두루마리를 찍었습니다. 그리고 두루마리 안쪽의 표면에 무언가 적힌 문자가 있다는 사실을 발견했어요. 하지만 종이들이 워낙 겹겹이 겹쳐 있어서 문자들이 제대로 보이지 않았고, 이를 해독하기엔 한계가 있었어요. 그래서 대회를 열기로 했습니다. '베수비오 챌린지'가 시작됩니다.

대회를 통해 처음으로 해독돼 밝혀진 글자는 '보라색'이었습니다. 해독에 성공한 주인공은 미국 네브래스카링컨대학교에서 컴퓨터과학을 전공하는 학생 류크 패리터였지요.

패리터는 문자를 해독하는 AI 프로그램을 개발했어요. 파피루스 종이에 잉크가 닿으면, 잉크가 스며들면서 미세하게 종이의 형태가 바뀐다는 점에 주목했지요. AI 프로그램이 이 차이점을 인식해 글씨 부분에 해당하는 잉크 부분을 읽어내도록 한 거예요.

그 결과 고대 그리스어 'πορφ ραc'를 찾아냈어요. '보라색'이라는 뜻을 가진 단어이지요. 전문가들은 이 단어를 통해 귀족들의 생활에 대한 내용이 담긴 문서라고 추정했어요. 당시 보라색은 귀족들만 쓸 수 있는 색이었거든요. 패리터는 이 성과를 인정받아 상금 4만달러를 받았어요.

이후 패리터와 같은 팀에 속한 독일 자유대학교의 컴퓨터공학과 대학원생인 유세프 네더가 두 단어를 추가로 해독하는 데 성공했어요. 유세프는 다른 AI 프로그램을 썼지만, 패리터가 읽은 부분을 데이터로 활용했어요. AI 프로그램은 패리터가 읽은 글자를 학습하고, 그 정보를 토대로 주변의 다른 글자를 찾은 거예요. 이 연구로 패리터가 읽은 부분을 더 선명하게 볼 수 있었고, '성취' '유사하다'라는 뜻의 그리스어 'ανυοντα'와 'ομοιων'를 발견했어요.

이렇듯 대회에 참가한 과학자들은 자신이 이용한 AI 프로그램, 학습 방식, 발견한 글자 등을 인터넷 사이트에 공개했어요. 다른 과학자들이 이 데이터를 활용해 개발할 수 있도록 한 거예요. 앞서 말했듯이 지난해 3월 시작한 대회에 벌써 과학자 1500여 명이 참여하고 있지요. 전 세계 과학자들의 두뇌가 모여 해독하는 방식을 점차 발전시키고, 이로 인해 불가능해 보였던 고대 문서를 완전히 새로운 방식으로 분석하고 있는 거랍니다.

진흙 글씨 해독하는 '진흙 전문' AI

베수비오 챌린지는 최근 우승팀을 발표했어요. 미국, 독일, 스위스 학생 3명으로 구성된 팀이에요. 이미 상금을 받은 적 있는 패리터와 유세프가 속해있지요. 이 팀은 AI 프로그램을 활용해 2000개 이상의 문자를 읽어서 네 구절을 해독하는 데 성공했어요. 두루마리 전체의 5%에 해당하는 양이었지요.

이 연구팀은 질감에 집중했습니다. 문서 표면에 글자가 갈라진 부분을 분석해 보니, 글자에 해당하는 부분이 진흙 질감과 비슷하다고 본 거예요. 이에 진흙 질감을 인지할 수 있는 AI 프로그램을 개발하고, 이를 통해 두루마리 표면을 읽었습니다.

무슨 내용이 쓰여 있었을까요? 음식과 음악, 삶의 즐거움에 대한 이야기였어요. '즐거움에 대한 일반적인 정의를 내릴 수 없다' '결핍이 풍족보다 행복하다고 믿지 않는다' '충족함 없이 사는 것이 자연스러운 일인가?"와 같은 내용이었지요. 전문가들은 폼페이 인근 도시인 헤르쿨라네움에 살았던 에피쿠로스 학파의 철학자가 쓴 내용이라고 봤어요. 나아가 이 대회의 결실을 통해 고대에 살던 사람들의 생활상은 물론, 당시의 문학 작품들에 대한 완전히 새로운 지식을 알 수 있을 것으로 기대하고 있습니다.

이윤선 과학 칼럼니스트 기획·구성=장근욱 기자