21岁大学生揭开2000年前古卷之谜:用AI重现“消失的”文字

2023年10月16日15:38:04 科技 1278

2000 多年前“消失的”古卷文字,如今被 AI 重现了。

近日,一名 21 岁计算机科学专业的学生利用人工智能(AI)技术在未打开的赫库兰尼姆古卷中发现了第一个单词。

21岁大学生揭开2000年前古卷之谜:用AI重现“消失的”文字 - 天天要闻

他就是内布拉斯加大学林肯分校的 Luke Farritor,他开发了一种机器学习算法,可以检测卷起的纸莎草纸上的希腊字母,其中包括 πορphiυρας(porphyras),意思是“紫色”。

Luke 通过利用表面纹理的微妙、小范围差异来训练神经网络并突出墨水,成功破译并读取 4 平方厘米区域内的 10 多个字符,赢得了 4 万美元的 First Letters 大奖。

21岁大学生揭开2000年前古卷之谜:用AI重现“消失的”文字 - 天天要闻

图|Luke Farritor 的第一份提交材料

意大利那不勒斯大学的纸莎草学家、审查 Farritor 研究成果的学术委员会成员 Federica Nicolardi 表示:“当我看到第一张图像时,我感到震惊,我实际上可以从卷轴的内部看到一些东西。”

赫库兰尼姆古卷是庞贝古城附近一座私人图书馆中收藏的古代卷轴,因公元 79 年维苏威火山喷发而被掩埋并碳化。近 2000 年来,这座唯一幸存的古代图书馆一直被埋在地下 20 米厚的火山泥下。18 世纪,它们被挖掘出来,虽然在某种程度上得到了保存,但非常脆弱,如果处理不当就会变成灰尘

21岁大学生揭开2000年前古卷之谜:用AI重现“消失的”文字 - 天天要闻

如何阅读无法打开的卷轴?数百年来,这个问题一直没有答案。

2019 年,肯塔基大学 EduceLab 的 Brent Seales 教授在粒子加速器中对赫库兰尼姆古卷进行了成像,生成分辨率高达 4 µm 的 3D CT 扫描。他的团队还扫描并拍摄了带有可见墨水的分离卷轴碎片,从而提供了地面真实数据集。Seales 教授的研究生 Stephen Parsons 致力于使用机器学习模型从 CT 扫描中检测墨水,并在分离的碎片上取得了成功。

21岁大学生揭开2000年前古卷之谜:用AI重现“消失的”文字 - 天天要闻

图|根据分离片段的真实数据训练机器学习模型(来源:Stephen Parsons 的博士论文)

这一成功引起了科技企业家 Nat Friedman 和 Daniel Gross 的注意,他们发起了维苏威火山挑战赛以加速这一进展。他们于 2023 年 3 月发起了一场公开竞赛,除了 70 万美元的大奖外,还为开源工具和技术的开发颁发了几个较小的奖项。

后来,一小群研究团队开始使用最初由 EduceLab 构建并由社区改进的工具来绘制卷轴的 3D 结构。到今年七月,数百平方厘米的古卷被分割并被“几乎压平”。

八月初,前 JPL 初创公司创始人 Casey Handmer 写了一篇博客文章,讲述自己发现了一种看起来像墨水的“裂纹图案”。Casey 是 2000 年来第一个在未打开的卷轴中发现墨水和一封信的人。

21岁大学生揭开2000年前古卷之谜:用AI重现“消失的”文字 - 天天要闻

图|显示墨水位置的注释(来源:Casey 的博客文章)

Luke Farritor 是一名大学生,同时也是 SpaceX 暑期实习生,他从 Dwarkesh Patel 接受 Nat 的播客采访中听说了维苏威火山挑战赛。

他看到的 Casey 裂纹模式在 Discord 中被讨论,并开始在深夜训练关于裂纹模式的机器学习模型。随着每一个新裂纹的发现,模型都会得到改进,在卷轴上就可以显示出更多的裂纹。

Luke 发现了几十个墨迹笔画以及一些完整的字母,可以将其标记并用作训练数据。不久之后,卷轴就露出了肉眼看不见的裂纹痕迹。很快,这些痕迹开始形成字母和实际单词的暗示。

与此同时,另一位参赛者、柏林的埃及生物机器人研究生 Youssef Nader 则采取了不同的方法。受到 Casey 和 Luke 发现的激励,他筛选了 Kaggle 上墨水检测奖的获奖作品,该奖的重点是改进 Stephen Parsons 在分离片段中的机器学习方法。他使用域转移技术使这些模型适应卷轴:对卷轴数据进行无监督预训练,然后对片段标签进行微调。

他提交了“墨水检测后续奖(Ink Detection Followup Prize)”的想法并获得了一个小奖。几周后,Youssef 向第一封信奖提交了自己的作品。他看到了 Luke 在 Twitter 和 Discord上分享的早期结果,并决定关注卷轴中的同一区域。

21岁大学生揭开2000年前古卷之谜:用AI重现“消失的”文字 - 天天要闻

图|Youssef Nader 最终提交的材料

尽管完全没有依赖 Casey 手动寻找裂纹的方法,但是通过 Kaggle 竞赛的修改模型,他成功地找到了一些字母。然后,他在标签数据中注释了看起来像字母形状的内容。

分割团队和参赛者不断取得进展,几天前 Youssef 的模型生成了一张清晰度和尺寸令人震惊的新图像(如下图所示)。

21岁大学生揭开2000年前古卷之谜:用AI重现“消失的”文字 - 天天要闻

威尼斯卡大众卡里大学的古希腊罗马历史学家 Thea Sommerschield 向《自然》杂志解释说,这一发现可能“彻底改变我们对古代历史和文学的认识”。

科技分类资讯推荐

小米SU7交付超25万台,雷军:强大的产品力是高销量的基础 - 天天要闻

小米SU7交付超25万台,雷军:强大的产品力是高销量的基础

6月6日,@雷军发文称,小米SU7 已交付超过25万台。强大的产品力是高销量的基础,还有出色的品质和质量。小米汽车将持续倾听用户的声音、为用户交付具有吸引力的、高品质的产品。(来源:@雷军)更多精彩资讯请在应用市场下载“极目新闻”客户端,未经授权请勿转载,欢迎提供新闻线索,一经采纳即付报酬。24小时报料热线027...
刘文超不幸离世,终年54岁 - 天天要闻

刘文超不幸离世,终年54岁

编辑 | 余晖6月6日,西子电梯科技有限公司发布讣告称,公司董事长兼总经理刘文超于2025年6月2日在杭州不幸离世,终年54岁。据澎湃新闻此前报道,有消息称刘文超于6月2日坠楼身亡,终年54岁。另据红星新闻报道,警方已排除刑事案件。
昊铂HL上市热销,44城合伙人加盟广汽昊铂 - 天天要闻

昊铂HL上市热销,44城合伙人加盟广汽昊铂

5月21日,广汽昊铂在其灯塔工厂完成了一场行业瞩目的“双向奔赴”——40位城市合伙人达成合作意向签约,将在全国44座核心城市开设经销店,这一举措标志着广汽昊铂的渠道战略布局已迈入全新阶段。
曝iPadOS 26将带来四大新功能:引入菜单栏 Siri AI升级 - 天天要闻

曝iPadOS 26将带来四大新功能:引入菜单栏 Siri AI升级

【CNMO科技消息】据外媒报道,苹果将在WWDC25大会上发布iPadOS 26,该系统将引入多项备受期待的升级。以下是目前曝光的四大核心功能:1. 菜单栏功能 据知情人士透露,iPadOS 26将引入类似Mac的菜单栏,用户可通过连接Magic Keyboard自动调出该功能。虽然苹果通常会为iPad定制功能,但此次菜单栏将保留Mac风格,同时针对触控..
王自如离开格力后首发声,感谢董明珠给自己鼓励和帮助,回应“工资条”:清楚自己要什么,工资条不重要 - 天天要闻

王自如离开格力后首发声,感谢董明珠给自己鼓励和帮助,回应“工资条”:清楚自己要什么,工资条不重要

6月6日,王自如发布视频,回应离开ZEALER、格力的原因,并宣布在AI领域二次创业。王自如发16分钟视频回忆自己的创业路,其中提到了退网原因,他表示,退网是为了要保守商业秘密不受干扰。王自如称自己讲述过往经历并非想博同情或洗白,并提到了工资条,称“如果真的想清楚了自己要什么,我想可能工资条真的不那么重要吧。”...
嘘🤫“两考”期间,天水人请开启“静音模式”! - 天天要闻

嘘🤫“两考”期间,天水人请开启“静音模式”!

“两考”倒计时 天水为考生按下“静音键” 一年一度的高考和中考即将到来为给广大考生营造一个良好的应试和休息环境确保“两考”顺利进行天水市加强“两考”期间噪声污染监督管理工作开启“静音模式”为“两考”保驾护航天水市住建局、天水市生态环境局、天水市公安局近日联合印发了《关于加强“两考”期间噪声污染监督管理...
超声波局部放电检测装置组成及原理 - 天天要闻

超声波局部放电检测装置组成及原理

超声波局部放电检测基本原理电力设备内部产生局部放电信号的时候,会产生冲击的振动及声音。超声波法(AEAcoustic Emission,又称声发射法)通过在设备腔体外壁上安装超声波传感器来测量局部放电信号。
王自如发视频感谢董明珠雷军,称将再次创业,聚焦AI应用方向,“这件事确实来钱快” - 天天要闻

王自如发视频感谢董明珠雷军,称将再次创业,聚焦AI应用方向,“这件事确实来钱快”

红星资本局6月6日消息,6月5日,王自如在其社交媒体账号发文称,“明天我想用15分钟的时间带大家了解我为什么离开 ZEALER 、为什么离开格力,以及我为什么在AI领域选择二次创业。 ”此后,“王自如将回应离开格力”“王自如复更”“王自如二次创业”等话题登上微博热搜。6月6日早10:00,王自如发布视频,标题为《我又要创业...