隨著AI應用在智能手機落地,手機翻譯已經(jīng)成為了很多人的剛需,而在手機翻譯中,目前做的最好最完善的,當屬華為。
最新發(fā)布的華為Mate30系列在全屏翻譯的基礎(chǔ)上,又帶來了滾屏翻譯。只需三個步驟,即可實現(xiàn)多屏內(nèi)容實時翻譯:
1、雙指長按屏幕內(nèi)容;2、點擊“【全屏翻譯】;3、點擊【滾屏翻譯】。
據(jù)了解,EMUI10全屏翻譯解決了外文翻譯的難題,但是如果想要翻譯多屏內(nèi)容,需要一次又一次進行全屏翻譯的操作。
隨著內(nèi)容長度的增加,操作的繁復還會使閱讀的連貫性降低。如此一來,滾屏翻譯便派上了用場。
據(jù)悉,EMUI10滾屏翻譯支持各種應用、十種語言、多屏內(nèi)容的翻譯。使用小藝語音口令 “幫我翻譯屏幕”或雙指按壓屏幕即可使用。
按照官方說法,當你瀏覽一篇長文章需要翻譯時,系統(tǒng)會先將其滾動截屏,形成一張原文的長截圖,然后對長截圖進行切分、文本檢測、翻譯、排序、去重、拼接,最后以同樣的圖片和翻譯完成的文字,再次呈現(xiàn)在你的面前,這就是滾屏翻譯。
在對長截圖進行初步處理的過程中,會用到OCR,即光學字符識別(Optical Character Recognition)技術(shù)。也就是對原來長文章形成的長截圖上的文字,進行識別提取,將它們提供給后續(xù)的機器翻譯環(huán)節(jié)使用,也就是完成了長篇源文字提取的過程。
從技術(shù)原理上為檢測和識別兩段式算法框架,涉及中、英、日、韓、俄、西、法、德、意、葡十種語言識別能力,包含多個運行于NPU(Neural-network Processing Unit,神經(jīng)網(wǎng)絡處理單元)的深度模型。
翻譯得準不準,依賴于OCR識別的準確性;翻譯得快不快,依賴于OCR處理字符速度的快慢,而這些主要取決于華為Mate30系列的NPU算力。