“行走河南·读懂中国”文明探源集中采访团近日走进河南省安阳市,来到安阳师范学院甲骨文信息处理实验室,切身感受到甲骨文智能化时代的神奇魅力。
据了解,该实验室把现代信息技术应用于甲骨文研究,凝练形成了“甲骨文大数据平台、甲骨文识别与字形分析、甲骨文语言计算、甲骨文与殷墟科技考古”四个研究方向。
“殷契文渊”是由安阳师范学院和中国社会科学院甲骨学殷商史研究中心合作建设的非营利性网站,为甲骨学研究提供大数据支持,是了解、学习、研究甲骨文的互联网窗口,破解了过去获取甲骨文研究资料难的瓶颈。
“因为甲骨片材质特殊,片多易碎,并且分布全球各地,语言信息多不完整。以前甲骨碎片都是靠记忆和手工来拼合,数据数字化以后,可利用人工智能图像技术进行自动缀合。”焦清局介绍说。
截至目前,安阳师范学院甲骨文信息处理实验室利用深度学习技术共缀合甲骨碎片41组,同时还发布了甲骨文的检测、识别、手写数据集,为计算机学者提供了检测、识别甲骨文标准的数据集。
除了“殷契文渊”网站,该实验室今年4月份还发布了面向大众的微信小程序“了不起的甲骨文”。该小程序通过故事性引入、游戏化互动、社交化分享等方式吸引公众了解甲骨文及汉字的演变,为甲骨文数字“焕活”提供了新的助力。
5月14日,甲骨文信息处理实验室主任刘永革介绍,甲骨文蕴含着丰富的造字智慧和文化价值,急需将冷门的文化资源转化成大家喜闻乐见并愿意参与的普惠文化服务;甲骨文活化利用的素材有限、手段传统、渠道不畅,急需系统化开展工作。
据介绍,当前已经出土的甲骨有15万至16万片,自然损坏速度较快,急需进行数据采集以实现在数字空间永久化保存;已经发现的约4500个甲骨字,其中约3000个尚未释读,甲骨文专家学者数量少,急需智能工具帮助提升字形匹配的搜索效率、推荐破译的相关线索。
值得关注的是,“了不起的甲骨文”小程序所使用的甲骨文高质量数据,正源自“殷契文渊”,打造出甲骨文的全信息模型。这样既可以为公众提供参与甲骨文传承活化的互动平台,也可以帮助专家学者进行甲骨文保护研究。
“我们把不同的甲骨图片进行对齐叠加,每个图层显示不同的信息。因为甲骨里面好多字很难看到,所以我们通过红外线摄影、光谱分析、微量元素分析产生不同的图层,让大众真正了解甲骨文,看看甲骨文究竟长什么样。”刘永革说。(完)
未经允许不得转载:87头条 » 甲骨文进入智能化时代 数字“焕活”冷门学科