123,123

在遙遠(yuǎn)的三千年前，那時候的人們用他們粗糙的筆觸在龜甲和獸骨上記錄下了一筆古老的文字。這便是被譽(yù)為華夏文明瑰寶的甲骨文。如今，隨著科技的進(jìn)步，華中科技大學(xué)未來技術(shù)學(xué)院的團(tuán)隊(duì)正運(yùn)用人工智能技術(shù)，試圖揭開這些神秘文字背后的奧秘。利用AI破譯甲骨文

這個團(tuán)隊(duì)致力于探索如何將現(xiàn)代科技與古代文化相結(jié)合，利用大數(shù)據(jù)、機(jī)器學(xué)習(xí)等先進(jìn)手段來輔助甲骨文的解讀。甲骨文，作為我國已知最古老的成熟文字系統(tǒng)，不僅是構(gòu)成漢字的基礎(chǔ)，更是承載著中華民族豐富歷史記憶和深厚文化的源泉。自1899年甲骨文被首次發(fā)現(xiàn)以來，已有超過125年的歷史。至今，我們已經(jīng)辨識出大約4500個沒有重復(fù)的單字，其中約1600個字已經(jīng)得到破譯。然而，還有約三分之二的甲骨文仍深藏不露，等待著學(xué)者們?nèi)ネ诰蚱浔澈蟮臍v史故事和文化內(nèi)涵。

為什么這么難？中國國家圖書館館藏研究中心副主任劉浩曾說，甲骨文中含有大量的表意成份，而且是隨機(jī)性的，要按照特定的規(guī)律進(jìn)行對應(yīng)，這是一項(xiàng)非常困難的工作。就算是人工智能，也不可能破解。

今年，華中理工大學(xué)未來研究院的科研人員深入“無人區(qū)”，進(jìn)行了一年多的實(shí)地考察，并通過一年多的努力，建立起了甲骨文開放數(shù)據(jù)庫，其中包括1600多個甲骨文種類，以及大量尚未破譯的甲骨文單字，以及13000多個甲骨文演化過程中出現(xiàn)的其它文字。更重要的是，團(tuán)隊(duì)還訓(xùn)練模型OBSD，并且發(fā)展了一個基于人工智能的多路徑輔助解碼系統(tǒng)——Open-Oracle。在此基礎(chǔ)上，我們將逐步掌握甲骨文的演化模式，并對其未來可能出現(xiàn)的形態(tài)進(jìn)行預(yù)測。

本項(xiàng)目擬以甲骨文為研究對象，首先對甲骨文圖像進(jìn)行建模，使之經(jīng)過多個時期的演化，使之逐漸轉(zhuǎn)化為與當(dāng)代漢字相似的圖形；然后，采用彌散模型對其進(jìn)行校正，使之更接近于當(dāng)代漢字的書寫規(guī)則。

利用AI破譯甲骨文

在此期間，管海粟與團(tuán)隊(duì)其它成員開展了4項(xiàng)申請，其中包括：基于條件擴(kuò)散模型的甲骨卜辭識別方法；基于分類模型的甲骨卜辭分類方法與體系。與此同時，兩人還共同開發(fā)了一套基于人工智能技術(shù)的多路徑翻譯軟件——Open-Oracle，以滿足古代漢字愛好者及研究人員的需求。利用AI破譯甲骨文