
新智元报道
新智元报道
【新智元导读】科学家用AI重构《死海古卷》时间线,震撼圈内!最新研究显示,《但以理书》《传道书》部分古卷实际成书更早,甚至揭示了圣经作者线索。AI模型Enoch结合碳14定年与笔迹分析,首创AI定年方法,大幅超越传统古文字学。
就在刚刚,科学家用AI重新定义了《死海古卷》历史时间线!
许多卷轴其实比原先认为年代还要早很多,两卷《死海古卷》竟是《但以理书》的最早片段!
研究还显示,《传道书》很可能由无名作者在公元前三世纪完成,而非传统所称的所罗门王!
更爆炸的是,借助AI甚至可能有助于阐明《圣经》的作者归属问题。
来自格罗宁根大学、南丹麦大学、比萨大学和鲁汶大学的研究人员基于24份古卷样本的放射性碳定年数据,并通过机器学习的笔迹分析技术,创建了一套全新的AI程序——Enoch(以诺)。
结果震撼——根据发表在《PLoS ONE》期刊上的研究结果,许多古卷的年代比之前认为的更为久远!

论文地址:
https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0323185
「这就像一台时间机器」,论文作者兴奋地表示,Enoch首次让我们「亲眼看到」写《圣经》的人之手,也为其他古代文献提供了全新的研究路径。
谁能想到,AI竟能替我们重构两千年前的历史记忆?
多年来,研究死海古卷的学者们运用了多种方法来分析这些古老的羊皮纸卷:例如,X射线、多光谱成像、「虚拟展开」以及古文字学(即研究书写风格的特点)。
这些古卷被认为可以追溯到公元前三世纪至公元一世纪之间,但这些年代的判定主要依赖于古文字学分析,因为只有少数古卷上明确记载了日期。
然而,传统的古文字学方法本质上是主观的,并且依赖于特定学者的经验。
正如先前报道,这些古老的希伯来文本——总计约900份完整或残缺的古卷,曾被储存在陶罐里——最初是贝都因牧羊人在1946年至1947年间,于死海北部的多个洞穴中分散发现的。

诗篇卷(11Q5),死海古卷的972个文本之一,有一部分为希伯来文转录
据说,当时一个牧羊人在寻找走失的羊时,随手扔出一块石头,意外打碎了一个装有古卷的陶罐,从而促成了这一发现。
库姆兰约在公元73年被罗马人摧毁,历史学家认为,是艾赛尼派将这些古卷藏匿于洞穴中,来保护它们免遭损毁。
洞穴内天然的石灰岩环境和条件帮助这些古卷保存了数千年之久。

这并非首次将AI工具应用于分析死海古卷上的笔迹。
早在2020年,就有报道称AI被用于辅助分析《以赛亚书》大卷轴的笔迹。

由于《以赛亚书》卷轴的书写风格看起来相当统一,大多数学者曾认为它是由单一抄写员完成的。但也有人提出,这可能是两位风格相似的抄写员合作完成的作品,各自负责抄写了卷轴不同的两半部分。
2020年的分析结果显示,该文本确实很可能出自两位抄写员之手。
分析还表明,第二位抄写员的笔迹比第一位更具变化性,尽管两种风格非常相似,这暗示他们可能接受过共同的训练。

在此之前,团队曾提出过一个用于发掘数字化手稿中的墨迹笔迹模式的神经网络,可以从微观层面进行几何形状分析。
而Enoch正是由此发展而来。
研究人员认为,鉴于古卷的数据集规模较小,最明智的做法是不依赖预训练模型,而是「让可用数据自己说话」。

「Enoch强调训练手稿与测试手稿之间的共同特征和相似性匹配,而传统古文字学则侧重于那些被认为对风格发展具有指示意义的细微差异。而结合差异性匹配和自适应强化学习可以揭示隐藏的模式。」
从模型给出的结果来看,许多死海古卷的年代比先前仅基于古文字学的估计更为古老。
这一点对于解答诸如两种古老的犹太文字风格——「哈斯蒙尼式(Hasmonean)」和「希律式(Herodian)」——是何时发展起来的问题,应该具有重要意义。
前者曾被认为出现在公元前150年至50年之间,但研究人员相信哈斯蒙尼式可能出现得更早;希律式字体亦是如此。
因此,这两种字体可能自公元二世纪晚期就已共存,这挑战了此前认为它们直到公元前一世纪中期才相继出现或共存的普遍观点。
Enoch甚至可能有助于阐明《圣经》的作者归属问题。
例如,研究人员得出结论,其中两份古卷是已知最早的《但以理书》残片,该书被认为是由一位匿名作者在公元前160年左右完成定稿的。
而《传道书》则很可能是在公元前三世纪由一位匿名作者完成,而非传统认为的公元前十世纪的所罗门王。

对此,研究人员表示激动地表示:
借助Enoch工具,我们如同打开了一扇通往古代世界的新大门,它就像一台时间机器,让我们能够研究书写《圣经》的那些手迹,尤其是现在我们首次确定了两份《圣经》古卷残片确实源自其推测作者所处的时代!
「能在解决死海古卷的年代测定问题上迈出重要一步,并创造出一个可用于研究历史上其他年代部分确定的手稿收藏的新工具,这着实令人兴奋。」

本研究结合放射性碳14定年与AI模型分析,对死海古卷进行了系统年代测定。
研究人员对来自4个地点的30份手稿进行了碳14定年,这些手稿估计跨越了5个世纪——
其中25份来自库姆兰(Qumran)洞穴,1份来自马萨达(Masada),2份来自穆拉巴特(Murabba’at)洞穴,2份来自Nahal Hever洞穴。
本研究首次在对古卷进行碳14定年前,采用专门设计的化学处理方法——溶剂萃取法——来去除脂肪类物质。
在样本预处理前后,还应用了其他专门的分析化学方法,以证明脂质材料的总量低于一个不会显著扭曲碳14年代的阈值。
样本由两台加速器质谱仪(AMS)进行测定。
AMS结果产生了27个有效的碳14年代数据,改进并扩展了现有的经过碳14定年的死海古卷系列。
总的来说,碳14结果表明,无论是单个手稿的年代,还是所谓的「哈斯蒙尼」(Hasmonaean)和「希律」(Herodian)文字出现的年代,其年代范围都更早。
图1显示了公认的校准年代范围与传统古文字学估计值(蓝色和红色)之间的比较。

图1:三个信息来源的日期估计与日历日期概览
可以看到,只有两份手稿的年代范围指向了可能更晚的年代范围。大多数手稿的碳14结果证实了较早的哈斯蒙尼式手稿与较晚的希律风格手稿之间的基本区别,以及所谓的「古风」(Archaic)与哈斯蒙尼式手稿之间的区别。
然而,传统上被认为是哈斯蒙尼和希律时期的手稿,其碳14年代范围在时间线上的分布却大相径庭。
如图1(蓝色部分)所示,哈斯蒙尼式手稿都集中在时间线的一个较窄部分,而希律式手稿则更分散地分布在时间线上,从公元二世纪一直延伸回公元前二世纪。
样本4Q114是碳14结果中最重要的发现之一。该手稿保存了《但以理书》第8-11章,学者们根据文学-历史依据将其年代定在公元前160年代。
4Q114公认的校准年代范围为公元前230-160年,这与《圣经·但以理书》最后部分据推测的成书时期相重叠。
由于缺乏适用于古卷时期的大型通用、有代表性且带标签的数据集,研究人员应用了专门的模式识别和机器学习模型,仅使用相关的古卷数据来训练年代预测模型。
考虑到该主题的重要性,若采用基于外部材料的预训练深度迁移学习,可能会让古文字学家合理担忧:这些古卷的目标数据,与那些来源和时期(可能差异巨大)的训练数据之间,究竟存在何种关联。
研究人员使用了碳14样本中具有有效日期的24份手稿作为标记数据集,构成Enoch模型的主要训练集。
对于数据标签,研究人员使用OxCal v4.4.2来获取概率分布的原始数据点。这是因为碳14结果并非像带有日期的文献那样是单一日期,而是代表具有概率分布的年代范围。用于训练Enoch的碳14数据输入包括公认的校准年代范围的概率分布。

在出现双峰证据的情况下,研究人员在OxCal程序之外使用了一种贝叶斯方法,以限制每次校准产生的年代范围。
研究人员这样做是为了防止碳14双峰性传播到训练基于风格的预测器的下一个处理阶段。只有在出现双峰证据时,才在训练Enoch模型时使用了古文字学领域知识,因为它允许使用亥维赛(Heaviside)函数对OxCal给出的(双峰)概率分布进行二元分割,阶跃的位置设置在曲线上一个影响小且接近零的低概率点。
除了主要训练集之外,研究人员还创建了不同的训练数据组合,以进行比较分析并进一步检验模型的鲁棒性。

这些组合包括试验性地添加或删除4Q52、一些先前测试过的碳14样本、来自公元前五至四世纪和公元二世纪的带有日期的文献、以及来自公元前176年的马雷沙陶片(Maresha ostracon)。
研究人员通过三种方式进行了交叉验证:使用训练-验证集划分、通过手稿图像分割成训练-测试集、以及对训练数据点采用留一法(leave-one-out)。

在将Enoch模型应用于其他先前未定年的古卷之前,研究人员首先成功地在一个已知的中世纪宪章基准数据集MPS上进行了尝试 。
然后,研究人员将训练好的Enoch模型应用于来自约1000份死海古卷中的135份未见手稿,以探索现阶段基于风格的定年的可行性。
因此,Enoch模型产生了一种经验性评估,它将先前均匀的预期年代分布修改为曲线分布,使得某些年代对样本来说可能性更高,而另一些则可能性更低。
与用于碳14定年的OxCal程序类似,Enoch模型提供年代的概率以及相应的误差估计。与那些仅提供例如一个年代点作为答案的、更古老、更原始的方法相比,这是一种进步。
在分析研究人员的结果时,需要同时考虑(1)一个年代点的可能性和(2)该点估计的可靠性。这是首次公布的针对该手稿集合的年代估计结果。未来的研究,可以利用更多数据和改进的图像,旨在进一步验证和完善。

表1:Enoch模型分析手稿图像的一般流程
本文作者中的专家古文字学家评估了基于风格的年代预测,将预测归纳为两个主要类别:合理和不合理,后者又细分为年代偏早和年代偏晚。
如表2所示,根据古文字学家的评估,107份(79.3%)未定年手稿的定年结果是合理的,而28份不合理的预测(20.7%)则分为年代偏早(7.4%)和年代偏晚(13.3%)。

表2:针对Enoch模型为135份未定年手稿所做年代预测的古文字学事后评估
先前,研究人员证明了《以赛亚书》大卷是由两位抄写员完成的。
现在,Enoch模型显示,该手稿的两个部分之间没有时间差异,并非一部分比另一部分晚写很多。相反,据估计,两位抄写员是在同一时期各自抄写1QIsaa古卷的对应部分的。
图2显示,Enoch模型将两个部分的年代一致地定在公元前180-100年之间。

图2:Enoch对1QIsa卷两半部分的日期预测图

据研究人员所知,Enoch是第一个完整的基于机器学习的模型,它使用原始图像输入,利用碳14输出的概率分布,为手写手稿提供概率性年代预测,并通过古文字学输入进行补充,同时通过其可解释的设计确保透明度和可解释性。
此外,Enoch对多种定年方法的整合显著提高了证据来源的价值,并允许来自两种来源——物理(物质)和几何(基于形状)——的证据相互确认。
作为一个说明性例子,图3显示,Enoch能够为4Q319给出一个年代预测估计,该估计与4Q259公认的2σ校准范围相似。

图3:Enoch对4Q319卷的日期预测估计值
Enoch模型的优势在于它为古文字学提供了量化的客观性,通过在经验基础上提供有限数量的基于概率的选项——包括物理(碳14)和几何(基于形状的分析)证据——减少了该方法的主观性和隐性专家知识的作用,这些选项可以帮助古文字学家证实、完善或修改他们自己对单个手稿的估计。
此外,支撑Enoch的方法可用于其他部分定年的手稿收藏的年代预测。
最后,研究人员没有采用任何现成的模型,而是开发了一个鲁棒的模型,该模型能够(1)仅使用极少量的数据(即24个样本或数据点)预测年代,(2)处理不确定性,以及(3)提供可解释性。

在手稿分析中,Enoch不同于传统的古文字学方法。
Enoch强调训练手稿和测试手稿之间的共同特征和相似性匹配,而传统古文字学则侧重于被认为表明风格发展的细微差异。通过差异性匹配和自适应强化学习的结合,可以揭示隐藏的模式。
这种跨学科融合可能会丰富研究人员对文本内容、材料属性和历史背景的理解,从而增强对过去的解释。

新的碳14证据,或者随着新发现,一整批带有年代信息的手稿可以被添加到Enoch的训练数据中,以进一步完善和提高精度,持续提升准确性。
现在可以使用Enoch方法轻松计算每个新添加到死海古卷碳14参考集合中的手稿样本所带来的影响。
本研究的结果对所研究时期内阿拉姆语/希伯来语文字的发展以及个别手稿的年代提出了四点新见解。
首先,碳14年代范围和Enoch基于风格的估计总体上比以前的古文字学估计要早。
这些古卷的较早年代是现实的。哈斯蒙尼式手稿公认的2σ校准范围允许年代更早,可追溯到公元前二世纪上半叶,有时甚至稍早,而不仅仅是大约公元前150-50年。
没有令人信服的古文字学或历史原因排除这些较早年代作为「哈斯蒙尼式」文字可靠的时间标记。这也适用于4Q70及其「古风式」文字公认的2σ校准范围。
其次,「希律式」文字出现的时间比以前认为的要早。
这表明「哈斯蒙尼式」和「希律式」文字并非从公元前一世纪中叶起才开始过渡,而是在相当早的时期就并存了。
第三,这种新颖的古文字学方法得出了新的古卷年代断代,这影响了研究人员对古代犹地亚历史以及古卷背后人物的理解。
关于古卷背后的运动是起源于公元前二世纪还是公元前一世纪的假说,需要根据Enoch对哈斯蒙尼式手稿(如1QS和4Q163)给出的公元前二世纪的年代预测进行重新考虑,这些手稿包含被认为是该运动典型特征的文本。
学者们通常假设,从公元前二世纪中叶起,哈斯蒙尼王朝的崛起和扩张导致了识字率的提高,并促进了抄写与知识文化。
然而,本研究的结果证明,在这一时期之前就已经抄写了多份文学手稿。一个例子是4Q109,这是圣经《传道书》的一份抄本,学者们初步将其定年在公元前三世纪末,而Enoch给出的年代预测是公元前三世纪,接近于古风式手稿,如4Q52和4Q70——分别是圣经《撒母耳记》和《耶利米书》的抄本。
第四,本研究对4Q114的碳14结果以及Enoch对4Q109的年代预测,现在将这些残片确定为已知最早的、来自其推测作者时代的圣经书卷。
因此,本研究的结果打破了未经证实的历史假设和年代限制,并对默认模型的相对类型学的有效性提出了质疑。
这种相对类型学只能在有限制的情况下维持。
哈斯蒙尼式手稿在时间轴上的分布并未对默认的相对类型学产生重大影响,但希律式手稿较早的、公元前二世纪的年代范围对相对类型学提出了挑战。
(文:新智元)