大型的語言模型(LMS),比如gpt-3、gpt-4,或者谷歌的伯特,已經(jīng)成為人工智能(AI)如何理解和處理人類語言的一個重要組成部分。但是在這些模型背后隱藏著一個很容易被忽視的過程: 符號化 .本文將解釋什么是符號化,為什么它如此重要,以及它是否可以避免。
摘要:提出了一種通過符號化方法對授時系統(tǒng)時間偏差進行預(yù)測的方法。該方法利用矢量擬合來表達時間序列的走勢形態(tài),采用聚類算法對形態(tài)進行聚類,然后根據(jù)聚類結(jié)果得到符號序列,并用不完全抽取方法來抽取序列模式。預(yù)測時,可根據(jù)學(xué)習(xí)得到的模式集來對新序列做出預(yù)測分析。通過對授時系統(tǒng)誤差數(shù)據(jù)的實驗表明,該方法可以對時間偏差進行較好預(yù)測,并可對預(yù)測的數(shù)值進行校準(zhǔn),從而進一步提高授時精度。