3000多年前的文字,AI如何辅助破译?近日在武汉,华中科技大学未来技术学院团队正在用人工智能提供辅助破译我国最早文字的方法。
华中科技大学未来技术学院团队与安阳师范学院的甲骨文专家展开交流。
甲骨文是迄今为止我国发现的年代最早的成熟文字系统,是汉字的源头和中华优秀传统文化的根脉。自1899年甲骨文被发现,迄今已有不重复的单字约4500个,其中已破译约1600个,仍有约2/3的甲骨文等待破译。有学者曾说“释出一字,好比发现一颗新的行星”。
为何如此之难?中国文字博物馆文物征集部研究中心助理馆员刘浩此前表示,甲骨文有很多表意的成分,具有随机性,需要建立特别的规则去映射,难度很大。目前都还无法做到人工智能破译。
华中科技大学未来技术学院团队成员
今年,华中科技大学未来技术学院团队勇闯“无人区”。该学院大三学生管海粟介绍,经过多方走访调研和一年多攻关,团队成功构建了甲骨文开源数据集。这一数据集,分别包含了1600余类别甲骨文文字及众多未破译的甲骨文单字、13000余类别甲骨文演变阶段中产生的其他文字。
不仅如此,团队还训练模型OBSD,并开发出基于人工智能的多途径辅助破译系统Open-Oracle。经过几个月的训练和优化,模型逐渐掌握了古文字的演变规律,并能预测甲骨文文字图像在现代可能呈现的字形。
新质生产力的工具为甲骨文文字破译提供了可能的线索。团队导师、华中科技大学软件学院教授、机器视觉与智能系统湖北省工程研究中心主任白翔向长江日报记者介绍,目前来看,新工具可能具备“推演”出甲骨文新文字的潜力,这将有助于更好传承发展中华优秀传统文化的根脉。
中国社会科学院学部委员、古代史研究所研究员宋镇豪曾表示,作为世界上最古老的自源文字之一,汉字是唯一沿用至今的,对破解其他古文字也能起到重要借鉴意义。