谷歌研發(fā)通用翻譯工具:欲打破語言障礙
技術(shù)能否打破語言的障礙?Google顯然認(rèn)為答案是肯定的。在一位德國電腦科學(xué)家的領(lǐng)導(dǎo)下,該公司正在研制一款世界通用的翻譯工具。微軟和臉譜也在研究類似技術(shù)。
當(dāng)科幻小說作家設(shè)想人類的未來時(shí),總是有一些改進(jìn)世界的點(diǎn)子反復(fù)出現(xiàn)。比如免費(fèi)的用之不竭的能源、以光速旅行的宇宙飛船、還有能夠翻譯宇宙所有語言的迷你電腦。
網(wǎng)絡(luò)巨頭谷歌公司正試圖將最后一個(gè)夢想變成現(xiàn)實(shí),負(fù)責(zé)這一項(xiàng)目的是一位來自德國西南部小鄉(xiāng)村的電腦科學(xué)家。
41歲的弗朗茲·約瑟夫·奧克長期專注于一個(gè)目標(biāo):建造完美的翻譯計(jì)算機(jī),它是如此的低調(diào)、敏捷,“人們很容易忽略它的存在,只是聽到有一個(gè)聲音在對(duì)他/她耳語。這一裝置能夠瞬間翻譯對(duì)話或是用任何語言寫成的文本——— 比如網(wǎng)頁內(nèi)容。
奧克擁有計(jì)算機(jī)博士學(xué)位,他的論文主題是人工智能。美國國防部高級(jí)研究計(jì)劃署(D A R PA )將他招募到加利福尼亞。2004年,奧克接到谷歌創(chuàng)始人之一拉里·佩奇的電話。他問奧克:你難道不想更上一層嗎?于是奧克擁有了自己領(lǐng)導(dǎo)的部門——— 谷歌翻譯。
大膽的未來幻想是谷歌的商業(yè)模式之一,從自動(dòng)駕駛汽車,到延長壽命的研究,這家網(wǎng)絡(luò)巨頭涉獵了眾多超前的領(lǐng)域。雖然迄今為止,谷歌翻譯似乎并沒有拿出多少成績,這可能是因?yàn)閵W克和他所領(lǐng)導(dǎo)的團(tuán)隊(duì)有著更大的野心:他們想要打破不同語言之間的壁壘。
這位德國科學(xué)家和他的團(tuán)隊(duì)已經(jīng)取得了重大進(jìn)展。谷歌翻譯現(xiàn)在可以在71種語言之間來回翻譯,比如將英語翻譯為德語;將冰島語翻譯為日語,或是反過來。
只需要將需要翻譯的文本粘貼到谷歌翻譯頁面的空白方框內(nèi),瞬間就可以將其翻譯為目標(biāo)語言。只需要點(diǎn)擊一個(gè)按鈕就可以將意大利語的網(wǎng)頁翻譯成德語或其他的69種語言。你還可以用智能手機(jī)將日本地鐵站一個(gè)令人不解的標(biāo)識(shí)牌拍攝下來,翻譯工具可自動(dòng)識(shí)別圖片上的文字并翻譯。
去年,谷歌翻譯服務(wù)的使用次數(shù)達(dá)到2億次。迄今為止,這一服務(wù)完全免費(fèi)。但眾多的跨國公司肯定會(huì)愿意花錢購買自動(dòng)翻譯服務(wù);在未來,隨著機(jī)器翻譯質(zhì)量的提高,谷歌隨時(shí)可以開始收費(fèi)。
現(xiàn)在,公司的目標(biāo)還只是完善這一服務(wù),并將它引入智能手機(jī)。翻譯小組已經(jīng)開發(fā)出一款應(yīng)用程序,它可將智能手機(jī)變成一款會(huì)說話的翻譯機(jī)器,迄今為止,這款程序已經(jīng)可以處理約24種語言。只要翻譯的語句相對(duì)簡單,這款程序的使用效果還算不錯(cuò)。比如有人想要告訴一位北京的出租車司機(jī)他需要趕快去一家藥店。他只需要用自己熟悉的語言(比如德語)對(duì)手機(jī)說出要求,手機(jī)立刻會(huì)用中文重復(fù)他的意圖:“請帶我去一家藥店。”奧克覺得,目前這一程序依然“有些遲鈍、笨拙,因?yàn)檫€需要按按鈕。”更重要的是,翻譯的質(zhì)量不太穩(wěn)定。然而,就在幾年前,哪怕是現(xiàn)在的水平,人們也是無法想象的。
幾十年前,IBM奠定了自動(dòng)翻譯的基礎(chǔ),但這個(gè)項(xiàng)目進(jìn)展遲緩,很快就被放棄。由于這個(gè)前車之鑒,谷歌翻譯啟動(dòng)的第一年只是“一個(gè)純粹的研究項(xiàng)目”,但在近期他們?nèi)〉昧司薮蟮倪M(jìn)展,奧克甚至稱之為“飛躍”。
翻譯小組在谷歌硅谷總部的規(guī)模在壯大,團(tuán)隊(duì)成員包括多名德國電腦專家,但卻沒有一個(gè)語言學(xué)家。奧克本人也不擅長語言學(xué)。相反,他說,“我學(xué)語言很艱難,這正是機(jī)器翻譯的魅力:重要的是擅長數(shù)學(xué)和統(tǒng)計(jì)學(xué),會(huì)編程。”
開發(fā)字典、定義語法結(jié)構(gòu)……諸如此類模擬人類翻譯的規(guī)則都和谷歌翻譯程序無關(guān)。事實(shí)上,這些語言規(guī)則大多太靈活,太不精確,導(dǎo)致電腦無法處理。比如在英語和德語中,形容詞位于名詞之前,而在法語中卻相反。因此如果拘泥于語法規(guī)則,翻譯軟件很快就會(huì)“迷失”。
谷歌翻譯團(tuán)隊(duì)遵循自己的專長:海量數(shù)據(jù)處理和統(tǒng)計(jì)分析。“我們的系統(tǒng)所做的就是對(duì)比現(xiàn)有的翻譯文本,自我學(xué)習(xí),比如某個(gè)單詞和某些詞語的組合在另一種語言中最常見的翻譯是什么,”奧克說,“最終我們計(jì)算的是翻譯的可能性。”現(xiàn)有參照數(shù)據(jù)越龐大,這套系統(tǒng)就越準(zhǔn)確。因此,只有在互聯(lián)網(wǎng)出現(xiàn)之后,計(jì)算機(jī)翻譯才成為可能。萬維網(wǎng)提供了海量的現(xiàn)成翻譯文本。
翻譯軟件一邊收集數(shù)據(jù),一邊學(xué)習(xí)。比如,當(dāng)被要求將一句話從法語翻譯為德語,軟件先從網(wǎng)上搜索對(duì)應(yīng)的單詞、短語,然后根據(jù)搜集到的信息計(jì)算出如何構(gòu)成一個(gè)新的句子。這一方法頗為有效,但遠(yuǎn)遠(yuǎn)談不上完美。語法、語調(diào)和歧義依然是自動(dòng)翻譯軟件面對(duì)的巨大難題。翻譯結(jié)果雖然可以理解,卻是語言學(xué)家的噩夢。機(jī)器顯然不懂得文字之美。難道需要教會(huì)軟件如何優(yōu)美地遣詞造句嗎?奧克認(rèn)為沒有必要。關(guān)鍵在于如何“更有效地學(xué)習(xí)。”換句話說,電腦需要掌握模仿的藝術(shù)。
從翻譯程序的角度,當(dāng)需要互譯的語言本身在語法和單詞結(jié)構(gòu)上相似,并有大量的參照數(shù)據(jù)時(shí),翻譯的效果通常比較令人滿意。英語和西班牙語的互譯相對(duì)完美,而英語和日語互譯則不如人意。“不幸的是,英語和德語也屬于艱難的組合,”奧克說,“這尤其讓我煩惱。”
但是,谷歌最終的目的到底是什么?它想要壟斷人類通信嗎?或是希望掌控全球交流?
奧克說商業(yè)策略不在他的管轄范圍。但他表示:“機(jī)器翻譯讓很多人能夠獲得從前無法獲得的信息,這就讓其他的事情成為可能。”重要的是它們創(chuàng)造的間接利益。在其他產(chǎn)品上谷歌采取相似的策略。它的搜索引擎和郵件服務(wù)目前都是免費(fèi)的,但它們卻為谷歌帶來了數(shù)億的用戶和與之相關(guān)的信息。
與此同時(shí),谷歌也面臨日益激烈的競爭。幾周前,社交網(wǎng)站臉譜收購了一家小公司。該公司研發(fā)了一套語言輸入和自動(dòng)翻譯系統(tǒng)。臉譜希望這套系統(tǒng)可以方便不同國家用戶之間的溝通。目前這家社交網(wǎng)站在全球200多個(gè)國家和地區(qū)擁有超過10億用戶。
歐盟也開發(fā)了自己的自動(dòng)翻譯軟件M T @EC。它主要用于翻譯官僚術(shù)語。由于金融危機(jī)導(dǎo)致的預(yù)算削減,在未來幾年,歐盟可能不得不裁減10%的翻譯人員。
微軟也啟動(dòng)了自己的翻譯項(xiàng)目。去年秋天,微軟全球運(yùn)營部負(fù)責(zé)人里克·拉希德在中國的一次新聞發(fā)布會(huì)上宣布了他們的研究成果。拉希德說英語,這款微軟的翻譯器同時(shí)將他的話翻譯為普通話———不是用千篇一律的計(jì)算機(jī)聲音,而是用拉希德自己的聲音,通過他之前錄制的語音樣本組裝而成。這至少賦予了機(jī)器翻譯一點(diǎn)點(diǎn)的人性化。
倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...
關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...
關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)