环球创业频道导航栏_fororder_WechatIMG203

    滚动   |   环球快讯   |   环球专访   |   政策解读   |   会员页面   

首页 > 环球创业 > 正文
全球最大甲骨文多模态数据集宣布开源 助力甲骨文智能算法开发
2024-07-05 18:11:41来源:中央广电总台国际在线责编:韩东林

  7月5日,在世界人工智能大会上,“数字甲骨共创中心”宣布将全球最大的甲骨文多模态数据集正式开源。该数据集包含一万片甲骨的拓片、摹本,以及甲骨单字对应位置、对应字头、对应隶定字以及辞例分组、释读顺序等方面的数据。基于该数据集,研究人员可开发甲骨文检测、识别、摹本生成、字形匹配以及释读等方向的智能算法,助推甲骨文研究加速建设数字化和智能化。

全球最大甲骨文多模态数据集宣布开源 助力甲骨文智能算法开发_fororder_图片9

  据介绍,数字甲骨共创中心由安阳师范学院甲骨文信息处理教育部实验室、腾讯SSV数字文化实验室、腾讯优图实验室、中国社会科学院甲骨学殷商史研究中心、中国社会科学院考古研究所安阳工作站、厦门大学多媒体可信感知与高效计算教育部重点实验室、郑州大学汉字文明研究中心等单位共同发起建立,汇聚了来自中国社会科学院古代史研究所、英国剑桥大学、法国高等研究实践学院、日本立命馆大学、美国罗格斯大学、加州大学洛杉矶分校等高校和研究机构的专业科研力量。

  甲骨文是汉字源头,也是迄今为止所发现的中国年代最早的成熟文字系统,它记录了商代政治、经济、军事、文化等诸多方面的信息,展现了中华民族的智慧和创造力,为古文字研究和传承、中华文明探源以及中国上古史体系的构建提供了第一手史料。

  但甲骨文研究存在众多难点。甲骨自然损坏速度较快,保存、展示和利用难度大,且出土甲骨都分散收藏于国内外各地。同时,甲骨文研究的专业门槛较高,近7成已发现甲骨文尚未得到释读,考释效率亟待提升。近年来,随着人工智能技术的快速发展,探索AI与甲骨文研究的结合,成为了研究人员的解题思路。

  据介绍,AI相关技术的应用也为数据集的丰富性提供了有力支撑。例如,由腾讯优图实验室联合安阳团队开发的甲骨字检测模型,能够对甲骨片上的字进行初步标注;字形降噪与匹配模型则为检索提供了直接而有效的手段;此外,甲骨校重算法的运用,成功实现了拓片与大系摹本的配准,使得大系摹本可以直接辅助拓片的标注工作;同时双方联合打造的协同创新平台也显著提升了数据标注的效率。

  此外,数据集专业复查工作主要由甲骨文信息处理实验室的研究生担纲,工作过程中,他们将甲骨文知识和机器学习知识的专业知识充分融合,这也大大提升了数据集在AI算法研究场景下的可用性。

  值得一提的是,腾讯在其刚刚启动的探元计划2024项目中,联合数字甲骨共创中心,发布了甲骨文AI破译需求,并采取了揭榜挂帅的方式,诚邀有技术储备、有意愿参与共创,并且致力于AI助力甲骨文破译的科研机构加入,共同形成数字文化演示的解决方案,以助力甲骨文破译工作。经过最终遴选评审的合作伙伴将获得20万元资助,以携手共创甲骨文AI考释破译的新算法、新工具和新方法。  

  中国社会科学院学部委员宋镇豪表示,甲骨文是中华文明的重要瑰宝,甲骨文研究不仅对揭示中国上古信史有深远意义,还能为现代汉字由来和汉语研究提供标志性依据。通过AI技术的应用,我们有望加快甲骨文探析进程,解决长期困扰学界的疑难问题。希望更多的科研机构和专家学者加入到这一伟大事业中,共同拓展甲骨文研究工作新天地。

  安阳甲骨文信息处理教育部重点实验室负责人刘永革表示,甲骨文的研究对于中华文化的传承和发展具有重要意义。数字化和人工智能技术的蓬勃发展,为甲骨文的破译带来了新的可能性和机遇。我们期待与更多有志于此的科研团队合作,利用先进的技术手段,进一步挖掘和解读甲骨文中的丰富信息,促进历史文化的传承与创新发展。运用人工智能等数字技术,甲骨文考释工作在文法分析、释文翻译、辞例拟补、残字补全、辞例辅助缀合等方面的需求能够得到满足,这些技术还有广泛的潜在应用场景,包括古文字研究与考释、汉文字研学与普及教育、甲骨文展览及内容制作与传播等。

  厦门大学教授,国家杰出青年科学基金获得者纪荣嵘表示,甲骨文数字化及多模态甲骨文数据集的发布为甲骨文的研究和传承注入了新的活力,具有里程碑式的意义。这一创新举措不仅使得古老的甲骨文以精准的数字化形式得以保存,确保了文化瑰宝的永续流传,还通过多模态数据集的方式,集合了拓片、摹本,辞例分组、释读顺序等多重元素,为研究者构建了一个全面而深入的研究平台。全球最大的甲骨文多模态数据集的发布,必将极大地推动甲骨文的跨学科研究,让我们能更深入地探寻甲骨文产生和发展的历史脉络、文化内涵和社会背景。同时,为公众打开了一扇直观而生动的了解甲骨文的窗口,有力促进了中华优秀传统文化的传承与普及。

  腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声表示,人工智能正在给包括甲骨文研究在内的科研场景带来新能量,以前所未有的方式推动科研工作的发展。作为前沿技术的探索者,腾讯不断探索人工智能技术深度在产业场景中的应用,同时搭建开放的技术平台,推动技术普惠。此次联合数字甲骨共创中心开源全球最大甲骨文多模态数据集,我们期待与更多技术团队携手共进,共同探索人工智能技术在更多场景中的实际应用,为甲骨文研究提供更多助力。

  腾讯数字文化实验室负责人舒展表示,守护中华文脉,焕活汉字源头。用人工智能助力甲骨文“破译”和活化利用,将“甲骨文AI破译”纳入探元计划支持的创新探索型项目的定向命题。联合数字甲骨共创中心发布甲骨文AI破译需求,揭榜挂帅,期待诚邀与有技术储备、有志于参与共创有意愿共创并、致力于AI助力甲骨文破译的科研机构加入我们,共同探索并形成解决方案。经过严格遴选与评审的共创伙伴将获得资助,与我们携手共创甲骨文AI考释破译的新算法、新工具、新方法。

  近年来,腾讯持续探索数字科技与文化的深度融合,积极运用前沿数字科技帮助文化遗产保护传承。

  2022年,腾讯SSV数字文化实验室、腾讯优图实验室与安阳实验室、厦门大学首度携手共建甲骨文开放创新平台,该平台借助新一代数字科技助力甲骨文考释研究与传承活化,以可持续社会价值创新的方式实现“科技+甲骨文”的共创共益,融合智能化、网络化、数字化的科技理念实现甲骨文考释研究、展示传承、活化利用的模式转型升级。

  2024年,合作团队发布了“数字甲骨国际共创计划”,该计划依托“殷契文渊”研究平台和“了不起的甲骨文”活化平台及探元数字文化开放平台,邀请甲骨文相关收藏机构、研究机构、文化机构、教育机构和社会力量等共建共享、共创共益。(图/文 陈东)

最新推荐
新闻
文娱
体育
环创
城市
国际在线版权与信息产品内容销售的声明

1、“国际在线”由中国国际广播电台主办。经中国国际广播电台授权,国广国际在线网络(北京)有限公司独家负责“国际在线”网站的市场经营。

2、凡本网注明“来源:国际在线”的所有信息内容,未经书面授权,任何单位及个人不得转载、摘编、复制或利用其他方式使用。

3、“国际在线”自有版权信息(包括但不限于“国际在线专稿”、“国际在线消息”、“国际在线XX消息”“国际在线报道”“国际在线XX报道”等信息内容,但明确标注为第三方版权的内容除外)均由国广国际在线网络(北京)有限公司统一管理和销售。

已取得国广国际在线网络(北京)有限公司使用授权的被授权人,应严格在授权范围内使用,不得超范围使用,使用时应注明“来源:国际在线”。违反上述声明者,本网将追究其相关法律责任。

任何未与国广国际在线网络(北京)有限公司签订相关协议或未取得授权书的公司、媒体、网站和个人均无权销售、使用“国际在线”网站的自有版权信息产品。否则,国广国际在线网络(北京)有限公司将采取法律手段维护合法权益,因此产生的损失及为此所花费的全部费用(包括但不限于律师费、诉讼费、差旅费、公证费等)全部由侵权方承担。

4、凡本网注明“来源:XXX(非国际在线)”的作品,均转载自其它媒体,转载目的在于传递更多信息,丰富网络文化,此类稿件并不代表本网赞同其观点和对其真实性负责。

5、如因作品内容、版权和其他问题需要与本网联系的,请在该事由发生之日起30日内进行。