21歲大學生揭開2000年前古卷之謎:用AI重現「消失的」文字

2023年10月16日15:38:04 科技 1278

2000 多年前「消失的」古卷文字,如今被 AI 重現了。

近日,一名 21 歲計算機科學專業的學生利用人工智能(AI)技術在未打開的赫庫蘭尼姆古卷中發現了第一個單詞。

21歲大學生揭開2000年前古卷之謎:用AI重現「消失的」文字 - 天天要聞

他就是內布拉斯加大學林肯分校的 Luke Farritor,他開發了一種機器學習算法,可以檢測捲起的紙莎草紙上的希臘字母,其中包括 πορphiυρας(porphyras),意思是「紫色」。

Luke 通過利用表面紋理的微妙、小範圍差異來訓練神經網絡並突出墨水,成功破譯並讀取 4 平方厘米區域內的 10 多個字符,贏得了 4 萬美元的 First Letters 大獎。

21歲大學生揭開2000年前古卷之謎:用AI重現「消失的」文字 - 天天要聞

圖|Luke Farritor 的第一份提交材料

意大利那不勒斯大學的紙莎草學家、審查 Farritor 研究成果的學術委員會成員 Federica Nicolardi 表示:「當我看到第一張圖像時,我感到震驚,我實際上可以從捲軸的內部看到一些東西。」

赫庫蘭尼姆古卷是龐貝古城附近一座私人圖書館中收藏的古代捲軸,因公元 79 年維蘇威火山噴發而被掩埋並碳化。近 2000 年來,這座唯一倖存的古代圖書館一直被埋在地下 20 米厚的火山泥下。18 世紀,它們被挖掘出來,雖然在某種程度上得到了保存,但非常脆弱,如果處理不當就會變成灰塵

21歲大學生揭開2000年前古卷之謎:用AI重現「消失的」文字 - 天天要聞

如何閱讀無法打開的捲軸?數百年來,這個問題一直沒有答案。

2019 年,肯塔基大學 EduceLab 的 Brent Seales 教授在粒子加速器中對赫庫蘭尼姆古卷進行了成像,生成分辨率高達 4 µm 的 3D CT 掃描。他的團隊還掃描並拍攝了帶有可見墨水的分離捲軸碎片,從而提供了地面真實數據集。Seales 教授的研究生 Stephen Parsons 致力於使用機器學習模型從 CT 掃描中檢測墨水,並在分離的碎片上取得了成功。

21歲大學生揭開2000年前古卷之謎:用AI重現「消失的」文字 - 天天要聞

圖|根據分離片段的真實數據訓練機器學習模型(來源:Stephen Parsons 的博士論文)

這一成功引起了科技企業家 Nat Friedman 和 Daniel Gross 的注意,他們發起了維蘇威火山挑戰賽以加速這一進展。他們於 2023 年 3 月發起了一場公開競賽,除了 70 萬美元的大獎外,還為開源工具和技術的開發頒發了幾個較小的獎項。

後來,一小群研究團隊開始使用最初由 EduceLab 構建並由社區改進的工具來繪製捲軸的 3D 結構。到今年七月,數百平方厘米的古卷被分割並被「幾乎壓平」。

八月初,前 JPL 初創公司創始人 Casey Handmer 寫了一篇博客文章,講述自己發現了一種看起來像墨水的「裂紋圖案」。Casey 是 2000 年來第一個在未打開的捲軸中發現墨水和一封信的人。

21歲大學生揭開2000年前古卷之謎:用AI重現「消失的」文字 - 天天要聞

圖|顯示墨水位置的注釋(來源:Casey 的博客文章)

Luke Farritor 是一名大學生,同時也是 SpaceX 暑期實習生,他從 Dwarkesh Patel 接受 Nat 的播客採訪中聽說了維蘇威火山挑戰賽。

他看到的 Casey 裂紋模式在 Discord 中被討論,並開始在深夜訓練關於裂紋模式的機器學習模型。隨着每一個新裂紋的發現,模型都會得到改進,在捲軸上就可以顯示出更多的裂紋。

Luke 發現了幾十個墨跡筆畫以及一些完整的字母,可以將其標記並用作訓練數據。不久之後,捲軸就露出了肉眼看不見的裂紋痕迹。很快,這些痕迹開始形成字母和實際單詞的暗示。

與此同時,另一位參賽者、柏林的埃及生物機械人研究生 Youssef Nader 則採取了不同的方法。受到 Casey 和 Luke 發現的激勵,他篩選了 Kaggle 上墨水檢測獎的獲獎作品,該獎的重點是改進 Stephen Parsons 在分離片段中的機器學習方法。他使用域轉移技術使這些模型適應捲軸:對捲軸數據進行無監督預訓練,然後對片段標籤進行微調。

他提交了「墨水檢測後續獎(Ink Detection Followup Prize)」的想法並獲得了一個小獎。幾周後,Youssef 向第一封信獎提交了自己的作品。他看到了 Luke 在 Twitter 和 Discord上分享的早期結果,並決定關注捲軸中的同一區域。

21歲大學生揭開2000年前古卷之謎:用AI重現「消失的」文字 - 天天要聞

圖|Youssef Nader 最終提交的材料

儘管完全沒有依賴 Casey 手動尋找裂紋的方法,但是通過 Kaggle 競賽的修改模型,他成功地找到了一些字母。然後,他在標籤數據中注釋了看起來像字母形狀的內容。

分割團隊和參賽者不斷取得進展,幾天前 Youssef 的模型生成了一張清晰度和尺寸令人震驚的新圖像(如下圖所示)。

21歲大學生揭開2000年前古卷之謎:用AI重現「消失的」文字 - 天天要聞

威尼斯卡福士卡里大學的古希臘羅馬歷史學家 Thea Sommerschield 向《自然》雜誌解釋說,這一發現可能「徹底改變我們對古代歷史和文學的認識」。

科技分類資訊推薦

從聊天機械人到協作夥伴:AI智能體如何重塑企業工作 - 天天要聞

從聊天機械人到協作夥伴:AI智能體如何重塑企業工作

Scott White至今仍對人工智能從新奇技術轉變為真正工作夥伴的速度感到驚嘆。僅僅一年多前,這位Anthropic公司Claude AI產品負責人目睹了早期AI編程工具甚至無法完成一行代碼的窘境。如今,儘管並非專業程序員,他卻能親自構建
小米 16 系列迎最新爆料,Pro 系列鏡頭模組大改,橫向延伸全尺寸設計 - 天天要聞

小米 16 系列迎最新爆料,Pro 系列鏡頭模組大改,橫向延伸全尺寸設計

近日,包括數碼閑聊站在內等多個消息源,就下一代旗艦新機紛紛進行了最新爆料,其中小米 16 系列也在近日迎來了最新消息。根據最新爆料來看,小米 16 系列將會在以往的標準版、Pro 版、Ultra 的基礎上新增一款 Pro Max 型號。但一一對應來看,新款的小米 16 Pro 即對標標準版 , 為大家熟悉的 6.3 英寸小尺寸旗艦機型。而 1...
魅族 22 系列手機本月到來,提供全新開模小尺寸旗艦版本 - 天天要聞

魅族 22 系列手機本月到來,提供全新開模小尺寸旗艦版本

伴隨着時間來到 7 月,各大手機廠商的新機更新計劃有所放緩,不過根據多方爆料來看,「小廠代表」 星紀魅族旗下的魅族 22 系列將會在本月與大家見面。目前魅族 22 系列仍然十分 「神秘」,欠缺主要的配置爆料與外觀圖片作為參考。但根據部分什麼爆料者的消息來看,魅族 22 系列將會全新開模,並提供小尺寸旗艦版本可供選擇...
vivo X300 Pro 更多細節曝光,大 R 角直面屏,新款大底主攝方案加持 - 天天要聞

vivo X300 Pro 更多細節曝光,大 R 角直面屏,新款大底主攝方案加持

今天數碼博主數碼閑聊站在與網友互動中,透露了一款搭載聯發科天璣 9500 的 「大杯」 工程機的最新進展。參考爆料內容與評論區互動來看,預計為 vivo X300 Pro。除搭載聯發科天璣 9500 外,據悉該機一大變化之處在於屏幕部分,根據最新消息來看將會搭載一塊大 R 角直屏,不再採用曲面屏或微曲面屏設計。而這也將成為下一代...
數據驅動,柔性智能建造平台助力高效管理 - 天天要聞

數據驅動,柔性智能建造平台助力高效管理

長沙晚報掌上長沙7月1日訊(全媒體記者 劉嘉)6月30日,由長沙市智能建造產業鏈推進辦公室與中建五局三公司聯合承辦的「創新驅動 智建未來」科技活動舉行。該活動不僅展示了長沙在智能建造領域的創新成果,也為行業高質量發展提供了可複製的實踐經驗。
以前不敢想,機械革命搭配出4959元的RTX5050本,還有2.5K屏 - 天天要聞

以前不敢想,機械革命搭配出4959元的RTX5050本,還有2.5K屏

最近RTX5050本開始大面積登場,很多消費者也想知道,廠商到底能搭配出什麼樣配置?結果機械革命沒有讓大家失望,搭配出一個6199元的新品,補貼後價格4959元,再一次刷新新顯卡筆記本的價格新低。同時,其配置還不是很潦草,還是很平衡的,讓我們來看看。這款本配置了R9 7845HX處理器,12核心,24線程,台積電5nm工藝,Zen4...
中國移動三大核心布局 助力南亞東南亞數字經濟新發展 - 天天要聞

中國移動三大核心布局 助力南亞東南亞數字經濟新發展

【來源:雲南網】6月30日,由雲南省人民政府和雲南省工業和信息化廳聯合舉辦的面向南亞東南亞數字合作推介會在北京舉行,中國移動副總經理陳懷達出席,中國移動數智化部副總經理陶濤發表主題為《建設跨境數據交易高速公路,服務數字信息大通道建設》的演講