如何利用機(jī)器學(xué)習(xí)的方式來監(jiān)測加密貨幣市場的情緒
在加密貨幣市場中,有這樣一個(gè)既有的觀點(diǎn)認(rèn)為這個(gè)市場容易受到來自新聞和社交媒體的輿論影響。就像任何其他新興且非理性的金融市場一樣,新聞或者社交媒體中傳達(dá)出的預(yù)期之外事件將影響到金融產(chǎn)品的價(jià)格。因此,人們越來越寄希望于通過采用諸如情緒分析(Sentiment Analysis)等機(jī)器學(xué)習(xí)的方式來監(jiān)測市場情緒與加密貨幣和數(shù)字代幣之間可能存在的聯(lián)系。盡管這種方式很重要,但人們采用的大多數(shù)情緒分析的方法都太淺顯了,以至于這些分析很難形成有實(shí)踐意義的結(jié)論,甚至常常形成具有誤導(dǎo)性的結(jié)論。
如何有效的通過情緒分析來評估一項(xiàng)資產(chǎn)未來的價(jià)格走勢是具有挑戰(zhàn)性的,而這項(xiàng)挑戰(zhàn)也并非是在加密領(lǐng)域中所獨(dú)有的。在大多數(shù)情況下,通過文本情緒來產(chǎn)生有價(jià)值的洞見是一項(xiàng)非常困難的任務(wù),這需要用到自然語言處理 (NLP) 模型對特定金融領(lǐng)域進(jìn)行優(yōu)化。大型量化對沖基金公司聘請大量機(jī)器學(xué)習(xí)領(lǐng)域的專家來訓(xùn)練 NLP 模型以用于特定任務(wù),比如說對收入報(bào)告進(jìn)行分析,其目的在于能夠讓他們在一項(xiàng)中頻交易(medium frequency trade)中獲得優(yōu)勢。對加密資產(chǎn)進(jìn)行有效的情緒分析要求機(jī)器學(xué)習(xí)是有深度的和嚴(yán)密性的。
為進(jìn)一步闡述上述觀點(diǎn),我們不妨從對情緒分析的特點(diǎn)開始,漸進(jìn)式地加深對情緒分析的了解。
淺談情緒分析
在著名歷史劇《黎塞留》的第二幕的第二場中,英國劇作家愛德華·布爾沃-李頓寫出了經(jīng)典名句:“文字的力量勝于武力(The pen is mighTIer than the sword)”。蒼海浮沉,歷經(jīng)百年,用這一經(jīng)典名句來概括情緒分析的重要性似乎再恰當(dāng)不過。相較于肢體語言,有時(shí)感情于字里行間中更能影響人們的行為。
僅從概念上來看,情緒分析從屬于 NLP ,它更專注于識別文本交流中存在的情緒狀態(tài)。不同于一般看法,情緒分析不僅僅是一門技術(shù),它還是深度學(xué)習(xí)領(lǐng)域里的一個(gè)子類,用于甄別文本數(shù)據(jù)中的各類情緒因素。從這個(gè)角度來說,我們姑且可以認(rèn)為以下幾種情緒分析與智能加密資產(chǎn)相關(guān)。
· 極性分析(Polarity Analysis):這類情緒分析將文本情緒劃分為:積極、消極和中性。比如在大多數(shù)情緒分析模型中,“比特幣價(jià)格的止跌企穩(wěn)提升市場信心”這句話就被歸類為積極類。
· 情緒/語氣分析(EmoTIon/Tone Analysis):不同于對文本進(jìn)行總體歸類,這種分析方式致力于對特定語境下所呈現(xiàn)的不同感情進(jìn)行打分。情緒分析算法通常聚焦于難過、開心或憤怒等情緒。例如:“比特幣止損后大幅回升”將會被認(rèn)定是情緒高漲。
· 情緒面分析(Aspect SenTIment Analysis):這種類型的情緒分析聚焦于對一句話中特定主體的情緒進(jìn)行解讀,而并非籠統(tǒng)的將一句話視作一整個(gè)部分。舉例來說:在“ Bakkt 期貨市場的出現(xiàn)對于比特幣市場具有里程碑式的意義”這句話中,情緒面分析將會對與“ Bakkt 期貨”相關(guān)的內(nèi)容進(jìn)行情緒分析,而不是對整句話進(jìn)行分析。
根據(jù)以上分析,我們可以清楚的看到將情緒分析用于加密資產(chǎn)的好處。盡管如此,在對這類技術(shù)嘗鮮之前,我們還應(yīng)該考慮其中存在的風(fēng)險(xiǎn)因素。文章內(nèi)容的上下文、主觀性、反語甚至是語法錯(cuò)誤都可能讓最好的 NLP 算法失效。
加密資產(chǎn)的情緒分析
加密資產(chǎn)是一種新的資產(chǎn)類別,這種資產(chǎn)現(xiàn)在依舊受到金融市場的非理性因素影響,同時(shí)它也缺乏有效的信息披露渠道。從這個(gè)觀點(diǎn)來看,認(rèn)為像情緒分析等 NLP 技術(shù)能夠識別 alpha 或聰明 beta(smart beta)因子以預(yù)測加密資產(chǎn)的行為變化情況的這種觀點(diǎn)僅僅是符合邏輯的,但與現(xiàn)實(shí)情況略有差異。(CoinDesk 中文版注:alpha 指的是資產(chǎn)獲得的超額收益,而 beta 指的是一種評估證券系統(tǒng)性風(fēng)險(xiǎn)的工具,用以度量一種證券或一個(gè)投資證券組合相對總體市場的波動性。)
當(dāng)把情緒分析技術(shù)應(yīng)用于加密資產(chǎn)時(shí),我們可能會主要遇到兩種類型的挑戰(zhàn):
1、將主流 NLP 技術(shù)應(yīng)用于特定領(lǐng)域(如加密資產(chǎn)分析)時(shí)面臨的挑戰(zhàn)
2、錯(cuò)誤的理解了新聞和社交媒體中所反映出來的真實(shí)情緒含義
第一個(gè)挑戰(zhàn)幾乎可以被視為是快速發(fā)展的 NLP 技術(shù)的一個(gè)預(yù)期外的副作用。如今,對于開發(fā)人員來說通過調(diào)取簡單的應(yīng)用程序編程接口 (API) 從而將情緒分析技術(shù)應(yīng)用于實(shí)踐是相對容易的,在這一過程中,API 調(diào)用者不需要具備任何有關(guān)深度學(xué)習(xí)的專業(yè)技能。
盡管通過調(diào)用 NLP 的 API 能夠?qū)σ粋€(gè)普通句子的情緒進(jìn)行有效分析,但是當(dāng)試圖從一句特定語句中推斷出特定領(lǐng)域的相關(guān)信息時(shí),這些 API 的表現(xiàn)是相當(dāng)糟糕的。比如說,分析“比特幣 ETF 可能即將獲批”這句話,需要 NLP 模型對特定市場下的專業(yè)術(shù)語的語義非常精通,并且能從非常微觀的層面,而并非僅從整句話中,對語境中的情緒進(jìn)行推斷。
第二個(gè)挑戰(zhàn)來自于對新聞和社交媒體評論中所反饋出情緒的錯(cuò)誤識別。作為信息的一個(gè)來源,新聞所包含的信息是相當(dāng)豐富的但是在進(jìn)行情緒分析是也可以說是相當(dāng)無用。其直觀的原因是:好的新聞中所包含的情緒應(yīng)該是中立的。社交媒體的內(nèi)容表現(xiàn)形式則截然相反。推特(Twitter)或者電報(bào)(Telegram) 中關(guān)于加密貨幣的觀點(diǎn)通常會包含一些情緒,但就大多數(shù)情況而言,這些評論都是基于對一些公眾普遍關(guān)切的重大信息的情緒反饋,這就意味著這些情緒里面并沒有包含有價(jià)值的信息。除此以外,來自社交媒體的評論往往是嘈雜和相對主觀的,這可能將會誤導(dǎo)情緒分析的結(jié)果。
從純技術(shù)的角度來說,為加密資產(chǎn)搭建有效的情緒分析模型需要對模型進(jìn)行加密市場專業(yè)術(shù)語的訓(xùn)練,同時(shí)也需要將新聞作為信息來源和社交媒體作為情緒放大器進(jìn)行分析。然而,當(dāng)我們將情緒分析模型應(yīng)用于加密資產(chǎn)領(lǐng)域時(shí),我們目前面對的最大的心理誤區(qū)之一就是我們是否克服了這項(xiàng)技術(shù)挑戰(zhàn)。
市場與情緒影響的謬論
市場情緒影響謬論描述的是一種不好的或者是非理性的情形,比如說在新興的金融市場領(lǐng)域,投資者們認(rèn)為情緒分?jǐn)?shù)和金融資產(chǎn)的價(jià)格變動之間有直接的相關(guān)性。為了闡述這樣一種動態(tài)行為經(jīng)濟(jì)學(xué),我們假設(shè)你正在使用分析工具對最近推特上關(guān)于比特幣的情緒進(jìn)行分析。從心理上來說,大多數(shù)投資者傾向于將市場情緒解讀為領(lǐng)先指標(biāo):
· 如果市場情緒是積極的,那么就意味著看好后市
· 如果市場情緒是消極的,那么就意味著看空后市
但是,當(dāng)你的模型用于分析公開的重大信息時(shí),以下非直覺的情緒分析應(yīng)該作為滯后指標(biāo):
· 如果市場情緒表示樂觀,但是市場價(jià)格并未上升,這意味著熊市的來臨
· 如果市場情緒表示悲觀,但是市場價(jià)格并未下降,這意味著牛市的來臨
當(dāng)意識到情緒—價(jià)格關(guān)系的非一致性時(shí),這使得情緒分析不再被視作市場領(lǐng)指標(biāo),而是當(dāng)作交易策略中的一種相關(guān)因子進(jìn)行分析。
從情緒分析到市場影響分析
從信息的角度來看,加密資產(chǎn)市場是復(fù)雜且充滿不確定因素的。就情緒分析而言,多種因素混雜其中對當(dāng)前的分析模型而言是一個(gè)噩夢。我們或許應(yīng)該開發(fā)一種更全面的分析方法,而并非僅僅專注于市場情緒分析。情緒與市場的影響指標(biāo)在長期來看,是集極性(消極、積極、中立)分析、情緒(不安的、興奮的、悲傷的等)分析以及基于情緒面(主題、主體等)分析于一體的。這個(gè)方法要求訓(xùn)練模型精通于加密資產(chǎn)的動態(tài)變化,從而在特定市場環(huán)境下對市場情緒進(jìn)行分析。
情緒與市場的影響模型這一觀點(diǎn)在概念上不算特別:量化情緒、情緒和話題組合在特定市場條件下對加密資產(chǎn)的影響。這一方法的部分優(yōu)點(diǎn)在于它并不像目前大多數(shù)情緒分析模型一樣是不受監(jiān)督的;它能夠通過訓(xùn)練獲得加密市場特定領(lǐng)域的知識。比如說,我們可以通過訓(xùn)練讓模型了解到對中國在加密資產(chǎn)市場投資進(jìn)行樂觀的報(bào)道可能給上周處于相對熊市的市場帶來積極的影響。情緒與市場的影響分析模型的核心原則就是將情緒分析模型對特定加密市場的分析置于特定的語境之中。
在加密資產(chǎn)市場領(lǐng)域,情緒分析可能仍將是人們熱衷談?wù)摰念^條話題。然而,為了讓其行之有效,這些模型需要更深入的加強(qiáng)機(jī)器學(xué)習(xí)的嚴(yán)密性以及增加基于特定動態(tài)加密資產(chǎn)市場之上的知識儲備。隨著市場的發(fā)展,我們可能會看見情緒分析技術(shù)由簡單的線性分析轉(zhuǎn)變?yōu)橥ㄟ^對加密資產(chǎn)市場領(lǐng)域特定話題的有效量化從而形成對市場的全面分析。
Jesus Rodriguez(耶穌·羅德里格斯)是區(qū)塊鏈智能基礎(chǔ)設(shè)施平臺 IntoTheBlock 的首席技術(shù)官和聯(lián)合創(chuàng)始人,同時(shí)也是 Invector 實(shí)驗(yàn)室的首席科學(xué)家。同時(shí),他是加密貨幣和人工智能領(lǐng)域的活躍投資者、演講者和寫作者。