21歲大學生揭開2000年前古卷之謎:用AI重現「消失的」文字

2023年10月16日15:38:04 科技 1278

2000 多年前「消失的」古卷文字,如今被 AI 重現了。

近日,一名 21 歲計算機科學專業的學生利用人工智慧(AI)技術在未打開的赫庫蘭尼姆古卷中發現了第一個單詞。

21歲大學生揭開2000年前古卷之謎:用AI重現「消失的」文字 - 天天要聞

他就是內布拉斯加大學林肯分校的 Luke Farritor,他開發了一種機器學習演算法,可以檢測捲起的紙莎草紙上的希臘字母,其中包括 πορphiυρας(porphyras),意思是「紫色」。

Luke 通過利用表面紋理的微妙、小範圍差異來訓練神經網路並突出墨水,成功破譯並讀取 4 平方厘米區域內的 10 多個字元,贏得了 4 萬美元的 First Letters 大獎。

21歲大學生揭開2000年前古卷之謎:用AI重現「消失的」文字 - 天天要聞

圖|Luke Farritor 的第一份提交材料

義大利那不勒斯大學的紙莎草學家、審查 Farritor 研究成果的學術委員會成員 Federica Nicolardi 表示:「當我看到第一張圖像時,我感到震驚,我實際上可以從捲軸的內部看到一些東西。」

赫庫蘭尼姆古卷是龐貝古城附近一座私人圖書館中收藏的古代捲軸,因公元 79 年維蘇威火山噴發而被掩埋並碳化。近 2000 年來,這座唯一倖存的古代圖書館一直被埋在地下 20 米厚的火山泥下。18 世紀,它們被挖掘出來,雖然在某種程度上得到了保存,但非常脆弱,如果處理不當就會變成灰塵

21歲大學生揭開2000年前古卷之謎:用AI重現「消失的」文字 - 天天要聞

如何閱讀無法打開的捲軸?數百年來,這個問題一直沒有答案。

2019 年,肯塔基大學 EduceLab 的 Brent Seales 教授在粒子加速器中對赫庫蘭尼姆古卷進行了成像,生成解析度高達 4 µm 的 3D CT 掃描。他的團隊還掃描並拍攝了帶有可見墨水的分離捲軸碎片,從而提供了地面真實數據集。Seales 教授的研究生 Stephen Parsons 致力於使用機器學習模型從 CT 掃描中檢測墨水,並在分離的碎片上取得了成功。

21歲大學生揭開2000年前古卷之謎:用AI重現「消失的」文字 - 天天要聞

圖|根據分離片段的真實數據訓練機器學習模型(來源:Stephen Parsons 的博士論文)

這一成功引起了科技企業家 Nat Friedman 和 Daniel Gross 的注意,他們發起了維蘇威火山挑戰賽以加速這一進展。他們於 2023 年 3 月發起了一場公開競賽,除了 70 萬美元的大獎外,還為開源工具和技術的開發頒發了幾個較小的獎項。

後來,一小群研究團隊開始使用最初由 EduceLab 構建並由社區改進的工具來繪製捲軸的 3D 結構。到今年七月,數百平方厘米的古卷被分割並被「幾乎壓平」。

八月初,前 JPL 初創公司創始人 Casey Handmer 寫了一篇博客文章,講述自己發現了一種看起來像墨水的「裂紋圖案」。Casey 是 2000 年來第一個在未打開的捲軸中發現墨水和一封信的人。

21歲大學生揭開2000年前古卷之謎:用AI重現「消失的」文字 - 天天要聞

圖|顯示墨水位置的注釋(來源:Casey 的博客文章)

Luke Farritor 是一名大學生,同時也是 SpaceX 暑期實習生,他從 Dwarkesh Patel 接受 Nat 的播客採訪中聽說了維蘇威火山挑戰賽。

他看到的 Casey 裂紋模式在 Discord 中被討論,並開始在深夜訓練關於裂紋模式的機器學習模型。隨著每一個新裂紋的發現,模型都會得到改進,在捲軸上就可以顯示出更多的裂紋。

Luke 發現了幾十個墨跡筆畫以及一些完整的字母,可以將其標記並用作訓練數據。不久之後,捲軸就露出了肉眼看不見的裂紋痕迹。很快,這些痕迹開始形成字母和實際單詞的暗示。

與此同時,另一位參賽者、柏林的埃及生物機器人研究生 Youssef Nader 則採取了不同的方法。受到 Casey 和 Luke 發現的激勵,他篩選了 Kaggle 上墨水檢測獎的獲獎作品,該獎的重點是改進 Stephen Parsons 在分離片段中的機器學習方法。他使用域轉移技術使這些模型適應捲軸:對捲軸數據進行無監督預訓練,然後對片段標籤進行微調。

他提交了「墨水檢測後續獎(Ink Detection Followup Prize)」的想法並獲得了一個小獎。幾周後,Youssef 向第一封信獎提交了自己的作品。他看到了 Luke 在 Twitter 和 Discord上分享的早期結果,並決定關注捲軸中的同一區域。

21歲大學生揭開2000年前古卷之謎:用AI重現「消失的」文字 - 天天要聞

圖|Youssef Nader 最終提交的材料

儘管完全沒有依賴 Casey 手動尋找裂紋的方法,但是通過 Kaggle 競賽的修改模型,他成功地找到了一些字母。然後,他在標籤數據中注釋了看起來像字母形狀的內容。

分割團隊和參賽者不斷取得進展,幾天前 Youssef 的模型生成了一張清晰度和尺寸令人震驚的新圖像(如下圖所示)。

21歲大學生揭開2000年前古卷之謎:用AI重現「消失的」文字 - 天天要聞

威尼斯卡福斯卡里大學的古希臘羅馬歷史學家 Thea Sommerschield 向《自然》雜誌解釋說,這一發現可能「徹底改變我們對古代歷史和文學的認識」。

科技分類資訊推薦

小米SU7交付超25萬台,雷軍:強大的產品力是高銷量的基礎 - 天天要聞

小米SU7交付超25萬台,雷軍:強大的產品力是高銷量的基礎

6月6日,@雷軍發文稱,小米SU7 已交付超過25萬台。強大的產品力是高銷量的基礎,還有出色的品質和質量。小米汽車將持續傾聽用戶的聲音、為用戶交付具有吸引力的、高品質的產品。(來源:@雷軍)更多精彩資訊請在應用市場下載「極目新聞」客戶端,未經授權請勿轉載,歡迎提供新聞線索,一經採納即付報酬。24小時報料熱線027...
劉文超不幸離世,終年54歲 - 天天要聞

劉文超不幸離世,終年54歲

編輯 | 餘暉6月6日,西子電梯科技有限公司發布訃告稱,公司董事長兼總經理劉文超於2025年6月2日在杭州不幸離世,終年54歲。據澎湃新聞此前報道,有消息稱劉文超於6月2日墜樓身亡,終年54歲。另據紅星新聞報道,警方已排除刑事案件。
昊鉑HL上市熱銷,44城合伙人加盟廣汽昊鉑 - 天天要聞

昊鉑HL上市熱銷,44城合伙人加盟廣汽昊鉑

5月21日,廣汽昊鉑在其燈塔工廠完成了一場行業矚目的「雙向奔赴」——40位城市合伙人達成合作意向簽約,將在全國44座核心城市開設經銷店,這一舉措標誌著廣汽昊鉑的渠道戰略布局已邁入全新階段。
曝iPadOS 26將帶來四大新功能:引入菜單欄 Siri AI升級 - 天天要聞

曝iPadOS 26將帶來四大新功能:引入菜單欄 Siri AI升級

【CNMO科技消息】據外媒報道,蘋果將在WWDC25大會上發布iPadOS 26,該系統將引入多項備受期待的升級。以下是目前曝光的四大核心功能:1. 菜單欄功能 據知情人士透露,iPadOS 26將引入類似Mac的菜單欄,用戶可通過連接Magic Keyboard自動調出該功能。雖然蘋果通常會為iPad定製功能,但此次菜單欄將保留Mac風格,同時針對觸控..
王自如離開格力後首發聲,感謝董明珠給自己鼓勵和幫助,回應「工資條」:清楚自己要什麼,工資條不重要 - 天天要聞

王自如離開格力後首發聲,感謝董明珠給自己鼓勵和幫助,回應「工資條」:清楚自己要什麼,工資條不重要

6月6日,王自如發布視頻,回應離開ZEALER、格力的原因,並宣布在AI領域二次創業。王自如發16分鐘視頻回憶自己的創業路,其中提到了退網原因,他表示,退網是為了要保守商業秘密不受干擾。王自如稱自己講述過往經歷並非想博同情或洗白,並提到了工資條,稱「如果真的想清楚了自己要什麼,我想可能工資條真的不那麼重要吧。」...
噓🤫「兩考」期間,天水人請開啟「靜音模式」! - 天天要聞

噓🤫「兩考」期間,天水人請開啟「靜音模式」!

「兩考」倒計時 天水為考生按下「靜音鍵」 一年一度的高考和中考即將到來為給廣大考生營造一個良好的應試和休息環境確保「兩考」順利進行天水市加強「兩考」期間雜訊污染監督管理工作開啟「靜音模式」為「兩考」保駕護航天水市住建局、天水市生態環境局、天水市公安局近日聯合印發了《關於加強「兩考」期間雜訊污染監督管理...
超聲波局部放電檢測裝置組成及原理 - 天天要聞

超聲波局部放電檢測裝置組成及原理

超聲波局部放電檢測基本原理電力設備內部產生局部放電信號的時候,會產生衝擊的振動及聲音。超聲波法(AEAcoustic Emission,又稱聲發射法)通過在設備腔體外壁上安裝超聲波感測器來測量局部放電信號。
王自如發視頻感謝董明珠雷軍,稱將再次創業,聚焦AI應用方向,「這件事確實來錢快」 - 天天要聞

王自如發視頻感謝董明珠雷軍,稱將再次創業,聚焦AI應用方向,「這件事確實來錢快」

紅星資本局6月6日消息,6月5日,王自如在其社交媒體賬號發文稱,「明天我想用15分鐘的時間帶大家了解我為什麼離開 ZEALER 、為什麼離開格力,以及我為什麼在AI領域選擇二次創業。 」此後,「王自如將回應離開格力」「王自如復更」「王自如二次創業」等話題登上微博熱搜。6月6日早10:00,王自如發布視頻,標題為《我又要創業...