當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 與其他的人工智能技術(shù)相比,情感分析(Sentiment Analysis)顯得有些特殊,因為其他的領(lǐng)域都是根據(jù)客觀的數(shù)據(jù)來進行分析和預(yù)測,但情感分析則帶有強烈的個人主觀因素。情感分析的目標(biāo)是從文

與其他的人工智能技術(shù)相比,情感分析(Sentiment Analysis)顯得有些特殊,因為其他的領(lǐng)域都是根據(jù)客觀的數(shù)據(jù)來進行分析和預(yù)測,但情感分析則帶有強烈的個人主觀因素。情感分析的目標(biāo)是從文本中分析出人們對于實體及其屬性所表達的情感傾向以及觀點,這項技術(shù)最早的研究始于2003年Nasukawa和Yi兩位學(xué)者的關(guān)于商品評論的論文。

隨著推特等社交媒體以及電商平臺的發(fā)展而產(chǎn)生大量帶有觀點的內(nèi)容,給情感分析提供了所需的數(shù)據(jù)基礎(chǔ)。時至今日,情感識別已經(jīng)在多個領(lǐng)域被廣泛的應(yīng)用。

評價者表達的是對手機整體的褒義評價,但如果是:“我覺得這款手機拍照功能很不錯,但信號不是很好”這樣的句子,在同一個評論中出現(xiàn)了褒義詞又出現(xiàn)了貶義詞,篇章級的分析是無法分辨出來的,只能將其作為一個整體進行分析。不過好在有很多的場景是不需要區(qū)分觀點評價的實體和觀點持有者,例如:在商品評論的情感分析中,可以默認(rèn)評論的對象是被評論的商品,評論的觀點持有者也是評論者本人。

第一步是判斷待分析的句子是否含有觀點信息;第二步則是針對這些含有觀點信息的句子進行情感分析,發(fā)現(xiàn)其中情感的傾向性,判斷是褒義還是貶義。關(guān)于分析情感傾向性的方法與篇章級類似,依然是可以采用監(jiān)督學(xué)習(xí)或根據(jù)情感詞詞典的方法來處理,我們會在后續(xù)的小節(jié)詳細講解。句子級的情感分析相較于篇章級而言,顆粒度更加細分,但同樣只能判斷整體的情感,忽略了對于被評價實體的屬性,同時它也無法判斷比較型的情感觀點。

另一種需要注意的情況是否定詞,否定詞的出現(xiàn)一般會改變情感詞原本的情感傾向,變?yōu)橄喾吹那楦校纭安缓谩本褪窃凇昂谩鼻懊婕由狭朔穸ㄔ~“不”,使之變成了貶義詞。除了條件句之外,還有一種語言表達也是需要在數(shù)據(jù)預(yù)處理階段進行排除的,那就是疑問句。

具體的做法與機器學(xué)習(xí)一樣需要分為兩個步驟:第一步是根據(jù)訓(xùn)練數(shù)據(jù)構(gòu)建算法模型;第二步是將測試數(shù)據(jù)輸入到算法模型中輸出對應(yīng)的結(jié)果,接下來做具體的講解。首先,我們需要準(zhǔn)備一些訓(xùn)練用的文本數(shù)據(jù),并人工給這些數(shù)據(jù)做好情感分類的標(biāo)注。通常的做法下:如果是褒義和貶義的兩分類,則褒義標(biāo)注為1,貶義標(biāo)注為0,如果是褒義、貶義和中性三分類,則褒義標(biāo)注為1,中性標(biāo)注為0,貶義標(biāo)注為-1。

當(dāng)訓(xùn)練好分類模型之后,就可以對測試集進行分類了,具體的流程與建模流程類似,先對測試的文本數(shù)據(jù)進行分詞并做數(shù)據(jù)預(yù)處理,然后根據(jù)特征詞矩陣抽取測試文本的特征詞構(gòu)建詞袋矩陣,并將詞袋矩陣的詞頻數(shù)據(jù)作為輸入數(shù)據(jù)代入之前訓(xùn)練好的模型進行分類,得到分類的結(jié)果。

互聯(lián)網(wǎng)上的交流不僅僅只是通過單純的文字來進行,大量的情感表達是通過顏文字或表情包來實現(xiàn)的,例如經(jīng)典的表示笑臉的顏文字“:D”,這類文本表達無法與上下文形成聯(lián)系,所以很難判斷他們評價的實體對象是什么。

不過好在這類數(shù)據(jù)本身就代表了非常強烈的情感傾向,在篇章級和句子級的顆粒度對情感進行分析,我們可以將特定的顏文字作為一種特殊的詞組構(gòu)建成情感字典,并人工進行情感分的賦值,對于emoji表情也可以將標(biāo)準(zhǔn)的emoji編碼編入情感字典。而對于表情包的識別則是一個計算機視覺的問題,目前還沒有學(xué)者在這個領(lǐng)域方向展開研究。

這類比較語句中通常存在著兩個以上的實體或?qū)傩?,如果只是在句子級的顆粒度下可以辨別出這句話是含有褒義的情感,但在屬性級的顆粒度下,以情感五元組來定義的情感無法將一個實體作為另一個實體的屬性來進行判斷,很難分辨觀點持有者到底是在對哪一個實體或?qū)傩员磉_情感。而這類語句在商品的評論中有非常常見,需要特別注意。

目前對于情感的分析依然處于初級階段,僅僅只是對情感做了褒義、貶義、中性三種劃分,但現(xiàn)實生活中的情緒遠遠不止這三種類型,例如:在心理學(xué)領(lǐng)域中,著名的心理學(xué)家羅伯特·普拉切克(Robert Plutchik)提出的情緒輪包含了8種基本情緒,并且每種情緒又劃分了不同的情緒強度等級,8種情緒還可以相互結(jié)合形成更多的情緒,如圖所示。

情緒輪在用戶體驗設(shè)計上被廣泛的應(yīng)用,很多情感化設(shè)計都是基于情緒輪進行的。但是在人工智能領(lǐng)域,將情緒進行多分類比情感分析的三分類任務(wù)要難得多,目前大多數(shù)分類方法的結(jié)果準(zhǔn)確性都不到50%。這是因為情緒本身包含了太多的類別,而且不同的類別之間又可能具有相似性,一個情緒詞在不同的語境下有可能表達的是不同的情緒類別,算法很難對其進行分類。即使是人工對文本進行情緒類別標(biāo)注也往往效果不佳,因為情緒是非常主觀性的,不同的人對不同的文本可能產(chǎn)生不同的理解,這使得人工標(biāo)注情緒類比的過程異常困難。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉