廈門大學(xué)近日在其官方公眾號(hào)上公布了一項(xiàng)創(chuàng)新性的學(xué)術(shù)探索,旨在通過(guò)人工智能技術(shù),為古老的甲骨文考釋工作注入新的活力。據(jù)悉,該校的研究團(tuán)隊(duì)正著手利用AI多模態(tài)大模型,結(jié)合甲骨文的音韻、形態(tài)與意義,協(xié)助專家們更加高效地解讀這一有著三千多年歷史的文字。
甲骨文,亦稱“殷墟文字”,作為世界四大古文字之一,不僅是中華文明的重要瑰寶,也是現(xiàn)代漢字的源頭。然而,傳統(tǒng)的甲骨文考釋工作卻面臨著巨大的挑戰(zhàn),需要考古專家憑借深厚的知識(shí)積累和豐富的文獻(xiàn)閱讀,通過(guò)字形分析和辭例研究等方法,逐步破譯這些古老的文字。這一過(guò)程不僅耗時(shí)費(fèi)力,而且效率極低。
面對(duì)這一困境,廈門大學(xué)的研究團(tuán)隊(duì)決定借助近年來(lái)迅猛發(fā)展的AI技術(shù),利用深度學(xué)習(xí)模型的強(qiáng)大語(yǔ)義表示能力,為甲骨文考釋提供新的解決方案。針對(duì)甲骨文數(shù)據(jù)稀缺、圖像質(zhì)量參差不齊的問(wèn)題,團(tuán)隊(duì)系統(tǒng)整理了相關(guān)古文字?jǐn)?shù)據(jù),構(gòu)建了更大規(guī)模、更高質(zhì)量的甲骨文多模態(tài)數(shù)據(jù)集,并提出了基于多元信息輔助考釋模型的技術(shù)方案。
為了實(shí)現(xiàn)這一目標(biāo),團(tuán)隊(duì)設(shè)計(jì)了一系列與實(shí)際考釋過(guò)程密切相關(guān)的任務(wù)和評(píng)估方法,如跨字體圖像映射、跨字體IDS解碼以及甲骨字與現(xiàn)代字的對(duì)譯關(guān)系等。這些任務(wù)旨在有效訓(xùn)練多模態(tài)大模型,提升其對(duì)于甲骨文的理解和識(shí)別能力。
在AI技術(shù)的輔助下,團(tuán)隊(duì)利用其強(qiáng)大的跨模態(tài)理解能力,對(duì)甲骨文進(jìn)行更為深入的考釋。在大模型提供的語(yǔ)義嵌入基礎(chǔ)上,團(tuán)隊(duì)還計(jì)劃設(shè)計(jì)融合音、形、義、用多元信息的端到端甲骨文綜合考釋模型。這一模型將綜合利用字形結(jié)構(gòu)、語(yǔ)義關(guān)聯(lián)、同音通假和用法聚類分析等多種手段,開發(fā)一種更加輕便、高效的考釋系統(tǒng),以適應(yīng)資源有限的實(shí)際考釋場(chǎng)景。
可以預(yù)見(jiàn),隨著AI技術(shù)在甲骨文考釋領(lǐng)域的不斷應(yīng)用,這一古老而神秘的文字將有望得到更為全面、深入的解讀。廈門大學(xué)的這一創(chuàng)新嘗試,不僅為甲骨文的保護(hù)與傳承提供了新的可能,也為考古學(xué)、歷史學(xué)等相關(guān)領(lǐng)域的研究開辟了新的道路。