学生たちがチームを組み、AIを使って二千年前の文章を解読

Image of tomokota
Author
Image of Juan Pablo Flores

学生たちはGitHub Copilotを使ってイタリアのベスビオ山に埋もれた古文書を解読し、画期的な歴史的突破口を開きました。これは彼らの旅とその背後にあるテクノロジー、そしてコラボレーションの力を記した記事です。


リサーチ&コピーライティング:エミリー・エイカーズ

イタリアのベスビオ山の灰の下に何世紀にもわたって埋もれていたテキストを解読するという挑戦から始まったこのプロジェクトは、AIとGitHubのツールを使った歴史的大発見に早変わりしました。ユセフ・ネーダールーク・ファリタージュリアン・シリガーの3名の学生は、時差や国境を越えて協力し合い、二千年前の巻物の秘密を解き明かしました。彼らの研究は、AI、オープンソースコラボレーション、そして何世紀にもわたって科学者たちを困惑させてきた謎を解き明かそうとする意欲が強力に結びついた結果を示しています。

チャレンジについて

2023年3月、著名な技術者のグループが「ベスビオ・チャレンジ」というチャレンジを立ち上げました。二千年前の火山の噴火後に埋もれたヘルクラネウム・パピルスを解読するコンペティションです。炭化のため、これらの巻物は粉々にならない限り開くことができません。では、どうすればこれらの古文書に書かれているテキストにアクセスできるのでしょうか?

ケンタッキー大学のコンピュータサイエンス教授、ブレント・シールズ氏はNPRのサイモン・スコットとのインタビューの中で、巻物の仮想展開とこの分野における技術の進化について語りました。この技術自体は数十年前から存在していましたが、2015年にあるブレークスルーがあり、死海文書の巻物の読解に成功しました。科学者たちはトモグラフィーやX線を使用し、死海文書では成功したものの、ヘルクラネウムのテキストではうまくいきませんでした。「これらの巻物は仮想展開を適用するのが難しかっただけでなく、古代のインクは私たちがスキャンした際にすぐには現れなかったため、それを可視化するためにはAIベースのアプローチが必要でした」とシールズ氏は述べています。科学者たちがヘルクラネウム・パピルスのスキャンを取得すると、世界中の技術者たちがこれらのデータを分析し始めました。

仮想展開を使ってヘルクラネウムのテキストを復元する過程と、それがベスビオ・チャレンジの創設にどのようにつながったかについて、ブレント・シールズが語っています。

学生の皆さんの紹介

世界中の何百人ものエンジニアがこのプロジェクトに取り組んでいる中、優勝したグループがオンラインで出会い、全てオンラインで協力したことは驚くことではありません。ユセフ・ネーダー、ルーク・ファリター、ジュリアン・シリガーは、チャレンジのDiscordサーバーを通じてチームを組み、ベスビオ・チャレンジの下で取り組んだ他のプロジェクトについてチャットしました。ルークはファーストレター賞を受賞し、次点に選ばれたユセフに連絡を取りました。私たちはルークと話をすることはできませんでしたが、彼はこのネブラスカ大学リンカーン校のインタビューで、最初の文字を見つけたことに気づくまでの過程を語っています。

Still screenshot from a video of Luke.
ルークがベスビオ・チャレンジで最初の文字を発見したことに気づいた瞬間と、彼の経験について説明するのを聞くにはクリックしてください。

この時点で、ルークはセグメンテーションに取り組んでおり、ユセフはAI検出モデルを作成していました。その後間もなく、2人はジュリアンとチームを組み、GitHub Copilotを使ってセグメンテーションを自動化する画期的な方法を開発しました。

「無料のGitHub ProアカウントやVisual Studio CodeでのGitHub Copilotの利用など、学生としてGitHubを利用するメリットはたくさんあります。次の目標を達成するために必要なコードを1つ書くのですが、書きたいことが分かっていれば、自動補完ツールを使って速く書くことができました。とても時間の節約になりました。」

ユセフにも話を聞きました。

「私たちはそれぞれ異なるタイムゾーンにいて、時には意図的に作業時間を合わせるために深夜や早朝に作業しました。」「これも全て、チームが優勝できただけでなく、一緒に特別な思い出を作ることができたので、意味のあることでした。提出の前夜あたりに、ジュリアンから、嬉しいメッセージが届いたのを覚えています。彼のソフトウェアで約1600㎠の巻物が分割されたというのです。私たちはその夜は一晩中、巻物のタイトルを探していました。」

ユセフは、すべてがまとまり始めた朝をこう振り返りました。「私は希望を捨てかけていました。あらゆることを試しきっていたのです。ある朝、最後の実験をしていて、驚いたことにうまくいったのです。ある意味、この二千年前の巻物とのつながりを感じさせる部分がありました。巻物に書かれたこの古代の作家の文字をなぞり、インクの付着具合からどのような文字になるかを割り出す賢い方法を見つけることが必要でした。」

この3人の学生は、西暦1754年以降のすべてのパピロロジストの夢を実現しました。パピロロジストのジャンルカ・デル・マストロは、ケンタッキー州でファーストレター賞を受賞したルークとの出会いをこう振り返ります。「この若い学生と対面した時、もっと年上の人を想像していたので驚きました。情報技術の新しい世界に入り、若くても新しい発見をすることができるのだと実感させられました。」

チームは、優勝チームのコードをGitHubで誰でも見れるにしています。長年GitHubを使い、Student Developer Packのツールを活用してきたユセフとジュリアンは、チームの研究成果を共有する場所としてGitHubは最適だと感じました。「私たちのコードをGitHubに保管することは、コミュニティが継続的に構築し、コラボレーションや進歩を推し進めるために簡単にアクセスできるようにするため、唯一理にかなっていることでした。」とユセフは言いました。

挑戦を終えて

デル・マストロ博士のチームは、イタリアのナポリに巻物を直接見に行くフライトをスポンサーし、優勝した2人のチームメイトに会う機会を得ました。ユセフとジュリアンが実際に会うのはこれが初めてのことで、「インターネットで長い時間をかけて共同作業をしていたのに、実際に会うことができたのは非現実的な体験でした。」とユセフは語りました。ナポリ滞在中、2人はカンファレンスに出席し、そこで自分たちの仕事を評価してくれた教授たちに会うことができました。ユセフは、彼とジュリアン、ルークは今でも連絡を取り合っており、将来は一緒にプロジェクトに取り組めることを願っていると嬉しそうに語っています。

The winning team and others stand in front of a doorway in Naples, Italy, where the traveled to see the scrolls in person.
左から右へ:アヤ・エルゾヘイリ、ユセフ・ネーダー、ジュリアン・シリガー、マルツィア・ダンジェロ、クラウディオ・ヴェルガラ、ファブリツィオ・ディオッツィ、アレッシア・ラヴォランテ。
正面:ロッセッラ・ヴィラ

この経験は、様々な意味で人生を変えるものでした。3人の優勝者は過去の一部を発見するのに役立っただけでなく、そのうちの1人は自分の未来を見つけたのです。ジュリアンは、このチャレンジを通して、コードと歴史の交差点でなすべきすべての仕事に目を開かせてくれた多くの素晴らしい先生やメンターと出会ったと話しました。チャレンジを終えてから、彼はベスビオ・プロジェクトでフルタイムの仕事を引き受け、そこで巻物の解読や古代に関する新しい情報の習得に時間を費やしています。

「ユセフとルークと私はこの大賞を受賞しましたが、これは巻物を解読する継続的な努力のほんの一部にすぎません。2023年以前にも多くの人がこの研究に取り組んできたし、2024年にもまだ多くのことが残されています。」と語りました。

あなたは学生ですか、それとも先生ですか?GitHubのStudent Developer Packで始めましょう。

The post How students teamed up to decode 2,000-year-old texts using AI appeared first on The GitHub Blog.