當前位置:首頁 > 芯聞號 > 充電吧
[導讀]神經科學家正在教導計算機直接從人腦中讀出單詞。近日,《科學》(Science)雜志的專職撰稿人凱利·塞維克(Kelly Servick)報道了預印本網站bioRxiv發(fā)表的3篇論文。在論文中,3個研究

神經科學家正在教導計算機直接從人腦中讀出單詞。近日,《科學》(Science)雜志的專職撰稿人凱利·塞維克(Kelly Servick)報道了預印本網站bioRxiv發(fā)表的3篇論文。在論文中,3個研究團隊各自展示了他們如何將神經活動記錄解碼成語音。在這3個研究中,研究人員在進行腦外科手術的患者大腦上直接放置了電極,當他們聽取語音或者大聲朗讀文字時,這些電極就記錄神經元的活動。接著,研究人員嘗試解讀患者聽到或說出的內容,患者大腦的電活動都轉化成了某種程度上能夠理解的聲音文件。

第一篇論文發(fā)表在bioRxiv上,描述了研究人員向正在進行腦外科手術的癲癇患者播放語音的實驗。需要指出的是,實驗中采集的神經活動記錄必須非常詳細,才能用于解讀。而且這種詳細的程度必須在十分罕見的條件(比如腦外科手術)下才能達到,此時大腦暴露在空氣中,電極直接放在上面。

當患者聽取聲音文件時,研究人員記錄了患者大腦中處理聲音部分的神經元活動。他們嘗試了多種方法將神經元活動數據轉化成語音,發(fā)現“深度學習”的效果最佳。深度學習是機器學習的分支,計算機可以在無人管理的情況下,通過深度學習來解決問題。當研究人員通過一個合成人類聲音的聲碼器播放轉化結果時,由11個聽眾組成的小組解讀這些詞的準確率是75%。

第二篇論文采用的是正在進行切除腦腫瘤手術的患者的神經元記錄。當患者大聲朗讀單音節(jié)詞時,研究人員記錄了他們嘴里發(fā)出的聲音,以及他們大腦中發(fā)音區(qū)域的神經元活動。研究人員沒有訓練計算機深度學習每一位患者的語音,而是教導人工神經網絡將神經記錄轉化成音頻文件。結果顯示,這些音頻文件至少在相當程度上是可以理解的,并且類似麥克風錄音的效果。以上這兩項研究的聲音文件都可以在網上下載。

第三篇論文采用的神經元活動記錄來自大腦中將決定說出的特定單詞轉化為肌肉運動的區(qū)域。盡管目前該實驗的記錄還沒有在網上公布,但研究人員報道稱,他們成功重建了整個語句(也是在癲癇患者進行腦外科手術時記錄的),而且聽到這些語句的人在多項選擇測試(共有10個選項)中準確進行解釋的成功率是83%。該實驗的方法依賴于識別出生成單個音節(jié)(而非整個單詞)所涉及的模式。

所有這些實驗的目標都是相同的,即有朝一日使失去說話能力(由于肌萎縮側索硬化癥或類似疾病)的人通過腦機界面來說話。不過,目前這些應用的科學基礎還未達到。

據《科學》雜志的報道,解讀一個人只在頭腦里想象說話的神經元活動模式,要比解讀一個人聆聽或發(fā)出語音的神經模式復雜得多。不過,第二篇論文的作者表示,解讀一個人想象話說時的大腦活動也許是可能的。

必須說明的是,這些都還只是很小型的研究。第一篇論文采用的只是來自5名患者的數據,而第二篇論文采用數據來自6名患者,第三篇則只有3名患者。這些研究中記錄的神經元活動都沒有持續(xù)超過1個小時。盡管如此,科學仍然在向前發(fā)展。直接連接到大腦的人工語音設備似乎已經有了真正的可能性,也許不遠的將來我們就將見證它的誕生。

神經科學家正在教導計算機直接從人腦中讀出單詞。近日,《科學》(Science)雜志的專職撰稿人凱利·塞維克(Kelly Servick)報道了預印本網站bioRxiv發(fā)表的3篇論文。在論文中,3個研究團隊各自展示了他們如何將神經活動記錄解碼成語音。在這3個研究中,研究人員在進行腦外科手術的患者大腦上直接放置了電極,當他們聽取語音或者大聲朗讀文字時,這些電極就記錄神經元的活動。接著,研究人員嘗試解讀患者聽到或說出的內容,患者大腦的電活動都轉化成了某種程度上能夠理解的聲音文件。

第一篇論文發(fā)表在bioRxiv上,描述了研究人員向正在進行腦外科手術的癲癇患者播放語音的實驗。需要指出的是,實驗中采集的神經活動記錄必須非常詳細,才能用于解讀。而且這種詳細的程度必須在十分罕見的條件(比如腦外科手術)下才能達到,此時大腦暴露在空氣中,電極直接放在上面。

當患者聽取聲音文件時,研究人員記錄了患者大腦中處理聲音部分的神經元活動。他們嘗試了多種方法將神經元活動數據轉化成語音,發(fā)現“深度學習”的效果最佳。深度學習是機器學習的分支,計算機可以在無人管理的情況下,通過深度學習來解決問題。當研究人員通過一個合成人類聲音的聲碼器播放轉化結果時,由11個聽眾組成的小組解讀這些詞的準確率是75%。

第二篇論文采用的是正在進行切除腦腫瘤手術的患者的神經元記錄。當患者大聲朗讀單音節(jié)詞時,研究人員記錄了他們嘴里發(fā)出的聲音,以及他們大腦中發(fā)音區(qū)域的神經元活動。研究人員沒有訓練計算機深度學習每一位患者的語音,而是教導人工神經網絡將神經記錄轉化成音頻文件。結果顯示,這些音頻文件至少在相當程度上是可以理解的,并且類似麥克風錄音的效果。以上這兩項研究的聲音文件都可以在網上下載。

第三篇論文采用的神經元活動記錄來自大腦中將決定說出的特定單詞轉化為肌肉運動的區(qū)域。盡管目前該實驗的記錄還沒有在網上公布,但研究人員報道稱,他們成功重建了整個語句(也是在癲癇患者進行腦外科手術時記錄的),而且聽到這些語句的人在多項選擇測試(共有10個選項)中準確進行解釋的成功率是83%。該實驗的方法依賴于識別出生成單個音節(jié)(而非整個單詞)所涉及的模式。

所有這些實驗的目標都是相同的,即有朝一日使失去說話能力(由于肌萎縮側索硬化癥或類似疾病)的人通過腦機界面來說話。不過,目前這些應用的科學基礎還未達到。

據《科學》雜志的報道,解讀一個人只在頭腦里想象說話的神經元活動模式,要比解讀一個人聆聽或發(fā)出語音的神經模式復雜得多。不過,第二篇論文的作者表示,解讀一個人想象話說時的大腦活動也許是可能的。

必須說明的是,這些都還只是很小型的研究。第一篇論文采用的只是來自5名患者的數據,而第二篇論文采用數據來自6名患者,第三篇則只有3名患者。這些研究中記錄的神經元活動都沒有持續(xù)超過1個小時。盡管如此,科學仍然在向前發(fā)展。直接連接到大腦的人工語音設備似乎已經有了真正的可能性,也許不遠的將來我們就將見證它的誕生。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯系該專欄作者,如若文章內容侵犯您的權益,請及時聯系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯合牽頭組建的NVI技術創(chuàng)新聯盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現場 NVI技術創(chuàng)新聯...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉