當(dāng)前位置:首頁 > 智能硬件 > 機(jī)器人
[導(dǎo)讀] 書面語言是人類區(qū)別于其他生物的重要特點,有的生物可以和人類一樣彼此交談,但是只有人類可以寫下有自己風(fēng)格的字符:精巧的漢字,復(fù)雜的花體字母,每個人的筆跡都是獨一無二的。但現(xiàn)在,布朗大學(xué)研究人員研制

書面語言是人類區(qū)別于其他生物的重要特點,有的生物可以和人類一樣彼此交談,但是只有人類可以寫下有自己風(fēng)格的字符:精巧的漢字,復(fù)雜的花體字母,每個人的筆跡都是獨一無二的。但現(xiàn)在,布朗大學(xué)研究人員研制的新型機(jī)器人的已經(jīng)可以做到憑借一己之力學(xué)會像人類一樣寫字和畫圖。

Atsunobu Kotani是布朗大學(xué)的本科生,他在老師的幫助下創(chuàng)建了一種深度學(xué)習(xí)算法,使機(jī)器人能夠相當(dāng)準(zhǔn)確地確定使用哪種筆畫,以及以何種順序生成手寫單詞和手繪圖像。機(jī)器人最初使用日文進(jìn)行訓(xùn)練,隨后可以用算法“自學(xué)”,自行確定筆畫順序和位置,臨摹出它未見過的語言中的單詞,寫出包括中文、英文、印地語、韓語、希臘語、烏爾都語的文字,復(fù)制字母和筆畫的精確度可達(dá)93%。

機(jī)器人還可以復(fù)寫一些簡單的線條草圖,完成了例如對蒙娜麗莎草圖的臨摹。在不遠(yuǎn)的未來,機(jī)器人就能在職場上幫我們記筆記、畫流程圖,成為我們的得力助手。

但研究人員也提到,目前機(jī)器人還存在不足,比如還做不到像左撇子一樣從右往左進(jìn)行書寫。書寫是一種看似簡單,實際上是精心設(shè)計的復(fù)雜動作組合過程。當(dāng)寫一個單詞時,你必須知道在哪里落下筆,握著它畫一條線,之后提起筆,結(jié)束這條線。接著在什么時候拿起你的筆,再畫一條線。

模仿他人的筆跡需要學(xué)習(xí)每一個字符當(dāng)中的筆觸、線條寬度、書寫習(xí)慣、字體傾斜程度等等因素,才能成功復(fù)制其書寫。

就像機(jī)器人學(xué)習(xí)在人類看來簡單的兩條腿走路花了很久的時間一樣,讓機(jī)器人學(xué)會使用類似于人們寫作方式來書寫是一個非常難以實現(xiàn)的目標(biāo)。機(jī)器不能以和人類一樣的方式觀察文字。比如,當(dāng)人看到字母“A”時,是看到三條不同的線條,所以很容易知道要用三個筆畫重現(xiàn)它。但是機(jī)器只能看到一組像素,而Kotani的算法可以幫助將這些像素轉(zhuǎn)換為筆畫,從而讓機(jī)器可以像人類一樣順利寫出字母。

Kotani提出的用于分析字母的深度學(xué)習(xí)網(wǎng)絡(luò),可以再現(xiàn)書寫字母所需的一系列筆畫,然后告訴機(jī)器人完成每個筆畫要做的動作。

因為只是臨摹,無須理解字符背后的實際含義,所以機(jī)器人可以寫出任何語言,例如它能夠用十種不同語言編寫“hello”,這些語言背后使用的是完全不同的字符集。同樣的方法也可以應(yīng)用于任何類型的線條圖,如簡單的草圖。這種算法可以幫助機(jī)器人在未來更好地與人們互動。

機(jī)器的學(xué)習(xí)系統(tǒng)包含兩個不同的模型,一個是“全局”模型,它允許機(jī)器人將文字作為一個整體查看圖像,以幫助它確定特定單詞或角色的可能起點位置,以及如何移動到下一個單詞。另一個是“本地”模型,可以幫助機(jī)器人完成當(dāng)前如何處理手中的筆,即進(jìn)行正確的移動,放置等。

為了訓(xùn)練機(jī)器人,研究人員提供了一個日語字符語料庫,并提供了有關(guān)字符的組合筆畫應(yīng)如何書寫的信息。之后它自行學(xué)習(xí)創(chuàng)建了一個模型,該模型可以查看字符的像素并預(yù)測開始每一個字符筆畫的位置,然后給出在繪制筆畫時需要移動的位置信息。這使得機(jī)器人能夠?qū)懗鲆郧皬奈匆娺^的語言,這種自學(xué)能力也讓研究人員也十分意外。

研究人員分別在白板上通過印地語,泰米爾語和意第緒語等各種語言寫下“你好”,試圖混淆機(jī)器人。結(jié)果機(jī)器人做到了通過機(jī)器視覺對每種不同的語言文字進(jìn)行觀察,然后分別編寫單詞副本,即使它之前只會寫日語。除了印刷體之外,機(jī)器人還進(jìn)行了英文草書的書寫,結(jié)果一樣出色。

機(jī)器人還可以辨別6歲孩童寫下的稚嫩文字,在一群幼兒園的兒童參觀實驗室時,機(jī)器人輕松地模仿了這些孩子的筆跡。

圖像也可以臨摹,Kotani在白板上畫下一副蒙娜麗莎的粗略草圖之后,機(jī)器人也進(jìn)行了惟妙惟肖的復(fù)寫。而且和噴墨打印機(jī)不同,這臺機(jī)器人畫畫并不是一行一行地畫出來,而是可以模仿人類畫畫的筆觸一筆一畫地臨摹。

但因為研究人員訓(xùn)練機(jī)器人用的是現(xiàn)代日語,書寫順序是從左到右進(jìn)行,之后推廣到的英語也是以相同的方向?qū)懙?。所以目前機(jī)器人進(jìn)行從右到左的書寫還不夠熟練。盡管如此,它仍然是語言互連的一個很好證明,許多不同的腳本來自同一個人(機(jī)器人)手中。另外這也是朝著開辟人與機(jī)器之間新的溝通方式邁出的重要一步,以后人與機(jī)器也許可以通過手寫文字進(jìn)行交流。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉