華為Mate30系列滾屏翻譯:滿屏外文秒變母語
隨著AI應(yīng)用在智能手機(jī)落地,手機(jī)翻譯已經(jīng)成為了很多人的剛需,而在手機(jī)翻譯中,目前做的最好最完善的,當(dāng)屬華為。
最新發(fā)布的華為Mate30系列在全屏翻譯的基礎(chǔ)上,又帶來了滾屏翻譯。只需三個(gè)步驟,即可實(shí)現(xiàn)多屏內(nèi)容實(shí)時(shí)翻譯:
1、雙指長按屏幕內(nèi)容;2、點(diǎn)擊“【全屏翻譯】;3、點(diǎn)擊【滾屏翻譯】。
據(jù)了解,EMUI10全屏翻譯解決了外文翻譯的難題,但是如果想要翻譯多屏內(nèi)容,需要一次又一次進(jìn)行全屏翻譯的操作。
隨著內(nèi)容長度的增加,操作的繁復(fù)還會(huì)使閱讀的連貫性降低。如此一來,滾屏翻譯便派上了用場(chǎng)。
據(jù)悉,EMUI10滾屏翻譯支持各種應(yīng)用、十種語言、多屏內(nèi)容的翻譯。使用小藝語音口令 “幫我翻譯屏幕”或雙指按壓屏幕即可使用。
按照官方說法,當(dāng)你瀏覽一篇長文章需要翻譯時(shí),系統(tǒng)會(huì)先將其滾動(dòng)截屏,形成一張?jiān)牡拈L截圖,然后對(duì)長截圖進(jìn)行切分、文本檢測(cè)、翻譯、排序、去重、拼接,最后以同樣的圖片和翻譯完成的文字,再次呈現(xiàn)在你的面前,這就是滾屏翻譯。
在對(duì)長截圖進(jìn)行初步處理的過程中,會(huì)用到OCR,即光學(xué)字符識(shí)別(Optical Character Recognition)技術(shù)。也就是對(duì)原來長文章形成的長截圖上的文字,進(jìn)行識(shí)別提取,將它們提供給后續(xù)的機(jī)器翻譯環(huán)節(jié)使用,也就是完成了長篇源文字提取的過程。
從技術(shù)原理上為檢測(cè)和識(shí)別兩段式算法框架,涉及中、英、日、韓、俄、西、法、德、意、葡十種語言識(shí)別能力,包含多個(gè)運(yùn)行于NPU(Neural-network Processing Unit,神經(jīng)網(wǎng)絡(luò)處理單元)的深度模型。
翻譯得準(zhǔn)不準(zhǔn),依賴于OCR識(shí)別的準(zhǔn)確性;翻譯得快不快,依賴于OCR處理字符速度的快慢,而這些主要取決于華為Mate30系列的NPU算力。