融匯金信羅彤:知識圖譜將為投資者帶來更高效的個性化信息來源
在投資信息漫天飛、數(shù)據(jù)難辨真?zhèn)蔚氖袌霰尘跋?,金融機(jī)構(gòu)內(nèi)部的分析團(tuán)隊(duì),難以滿足諸多投資客戶的咨詢需求,而當(dāng)面對跨行業(yè)分析,這個問題更為明顯。
北京融匯金信信息技術(shù)有限公司推出“智能小e”,這款機(jī)器人能夠利用大數(shù)據(jù)及文本語義分析來處理金融領(lǐng)域的文本,主要包括文本語義分析,分布式抓取計(jì)算,語義網(wǎng)自動構(gòu)建,文本情感分析;根據(jù)文本得出的結(jié)論可以輔助投資者進(jìn)行決策。
融匯金信CEO羅彤認(rèn)為,在金融領(lǐng)域每個產(chǎn)業(yè)都有它的專業(yè)壁壘,缺少一個工具能夠把它們總結(jié)起來,為人們提供自動知識服務(wù)和決策支持。
10月31日,羅彤在2019中國金融科技產(chǎn)業(yè)峰會上談到,“金融產(chǎn)業(yè)中,知識圖譜能夠賦能人們更高效率的個性化信息獲取”隨后,羅彤在現(xiàn)場演示了一個案例:通過與“機(jī)器人小e”對話,用戶能獲得關(guān)鍵詞“鋰電池”的上下游相關(guān)領(lǐng)域、技術(shù),有哪些子類、企業(yè)、客戶。另外還展示了一個由機(jī)器處理行業(yè)信息的知識圖譜。
“目前智能小e通過算法建設(shè)的知識體系覆蓋130多萬個關(guān)系、細(xì)分6、7萬個細(xì)分產(chǎn)業(yè)與產(chǎn)品、覆蓋公司上萬家,覆蓋產(chǎn)業(yè)投資全領(lǐng)域,”羅彤介紹道,“而目前業(yè)內(nèi)的知識圖譜大多由人工完成,很難做到全部領(lǐng)域。”
百科類知識較多來自于維基百科和百度百科,數(shù)據(jù)相對比較規(guī)整,獲取比較容易,在非百科圖譜方面,相關(guān)產(chǎn)業(yè)的深度知識非常稀少。
會后,羅彤接受采訪,向我們簡短講述了融匯金信發(fā)展歷程:
2010年,羅彤帶著用兩年時間打造的全球十大語義搜索引擎回國創(chuàng)業(yè),他和團(tuán)隊(duì)向國內(nèi)一家知名媒體機(jī)構(gòu)展示了他們的搜索系統(tǒng),對方覺得可以,希望將這個產(chǎn)品融入到打造中國的媒體(一家美國金融信息企業(yè),使用自動化機(jī)器撰寫分析報告)進(jìn)程中來,而當(dāng)時僅僅做到了語義搜索,沒有做到人機(jī)對話和智能報告。
機(jī)器學(xué)習(xí)特別是深度學(xué)習(xí)需要大量標(biāo)注,金融領(lǐng)域則覆蓋了上萬各產(chǎn)業(yè)細(xì)分和產(chǎn)品,很少有公司有足夠的時間和人力來標(biāo)注全產(chǎn)業(yè)的數(shù)據(jù)。羅彤的團(tuán)隊(duì)在2015年向百萬級數(shù)據(jù)中引入弱監(jiān)督學(xué)習(xí)模型,嘗試讓機(jī)器在微弱關(guān)聯(lián)的信息中尋找關(guān)聯(lián),取得了一定進(jìn)展。
直到2016年以后,羅彤和他的團(tuán)隊(duì)逐步將其升級到對話的,這與智能手機(jī)的發(fā)展大背景同步,當(dāng)年的谷歌Asistant、微軟Crotana、蘋果Siri等工具如日中天,羅彤希望通過對話的方式來為客戶提供服務(wù)。
人們需要更快的金融信息獲取工具,將農(nóng)業(yè)、醫(yī)藥、生物制造等垂直領(lǐng)域,短時間處理大量信息的任務(wù)需要機(jī)器的幫助。例如,跨領(lǐng)域的產(chǎn)業(yè)信息,依靠一個分析師多年積累的知識,難以滿足用戶的多元,遷移算法或許是下一次技術(shù)突破的關(guān)鍵。
然而羅彤強(qiáng)調(diào),眼下基于知識圖譜的金融智能助手核心是一種在密集的公開信息中自動學(xué)習(xí)知識體系,尋找風(fēng)險、填補(bǔ)人類知識死角、減少收集資料時間的工具。
另外,基于知識圖譜和對話功能,羅彤希望在未來推出“任務(wù)型”機(jī)器人,即能夠模擬一個人主動跟投資者做投顧服務(wù)和金融產(chǎn)品營銷的產(chǎn)品,目前該產(chǎn)品已有成型框架,預(yù)計(jì)在今年底向客戶部署。同時,基于知識圖譜和自動寫作,公司和產(chǎn)業(yè)分析的智能報告大大節(jié)約了人力,也是金融智能助手重要的發(fā)展方向。