信息隱私是語音識別技術(shù)發(fā)展的犧牲品嗎
(文章來源:南方都市報(bào))
? ? ? ?今年以來,科技巨頭蘋果、谷歌、亞馬遜、臉書和微軟的語音助手或軟件無一例外被爆出“監(jiān)聽門”。有專家表示,在目前的弱人工智能階段,人工監(jiān)聽和分析是必須的。
那么,語音識別技術(shù)發(fā)展和隱私保護(hù)之間的沖突要如何解決?9月17日,在國家網(wǎng)絡(luò)安全宣傳周的個(gè)人信息保護(hù)高峰論壇上,小米集團(tuán)法務(wù)總監(jiān)朱玲鳳試圖結(jié)合行業(yè)已有的實(shí)踐操作作出回答?!罢Z音助手是人工智能領(lǐng)域非常重要的應(yīng)用領(lǐng)域”,她指出,從2010年開始,互聯(lián)網(wǎng)巨頭通過自主研發(fā)或者并購/參股的方式開始探索智能語音行業(yè),包括蘋果的Siri,谷歌的Google Assistant和亞馬遜的Alexa等。
國內(nèi)阿里巴巴、百度和小米等企業(yè)也紛紛投入智能音箱市場。據(jù)調(diào)研公司Canalys預(yù)計(jì),到今年年底,中國智能音箱保有量將超過5990萬臺,與截至2018年底的2250萬臺相比增長166%,使得智能音箱的普及率達(dá)到13%——語音助手已經(jīng)成為大家生活中非常習(xí)慣的一個(gè)場景。
然而,智能語音助手市場的瘋狂增長離不開海量用戶數(shù)據(jù)的“喂養(yǎng)”,隱私問題也隨之滋生。今年7月26日,蘋果被曝出雇傭外包商監(jiān)聽用戶和Siri的對話,其中包含位置信息、聯(lián)系方式等個(gè)人敏感信息。此前亞馬遜Alexa、Google Assistant、微軟的Skype和語音助手都被曝出類似事件。
朱玲鳳表示,現(xiàn)在的語音識別技術(shù)還處于監(jiān)管之下的機(jī)器學(xué)習(xí),而不能靠自主學(xué)習(xí)提升識別能力?!昂唵蔚牟僮鬟^程就是把粗略的語音資料輸入進(jìn)去,由人工進(jìn)行分析,再分類標(biāo)注,然后把它灌輸?shù)秸麄€(gè)模型當(dāng)中,最后用大量的用戶數(shù)據(jù)去驗(yàn)證這個(gè)模型是不是正確。”
所以,在目前的階段,“人類的轉(zhuǎn)入和標(biāo)注是語音識別技術(shù)提升必然要經(jīng)過的一個(gè)過程”,她說。她還總結(jié)道,這就是用戶使用語音助手產(chǎn)品和預(yù)期明顯沖突的地方——用戶不希望和語音助手之間的私人交談被第三方轉(zhuǎn)入,但是第三方語音轉(zhuǎn)入確實(shí)是技術(shù)發(fā)展所必需的東西。
朱玲鳳認(rèn)為,不能因?yàn)椴环嫌脩纛A(yù)期,就因噎廢食不繼續(xù)發(fā)展語音識別技術(shù),因?yàn)檫@項(xiàng)技術(shù)確實(shí)給老人、小孩以及殘障人士帶來了福音。但是,這是否意味著需要犧牲用戶的隱私?朱玲鳳認(rèn)為,企業(yè)應(yīng)該拿出更加尊重用戶隱私的態(tài)度來,并介紹了一些行業(yè)內(nèi)已有的實(shí)踐操作。
首先是企業(yè)要遵守透明性原則,讓用戶知道可能存在人工分析語音指令的情況,以及為什么保存這樣的數(shù)據(jù)、保存多久。同時(shí),要給用戶提供一個(gè)控制機(jī)制,讓用戶可以選擇退出。例如,蘋果在隱私事件爆發(fā)后就進(jìn)行了調(diào)整,允許默認(rèn)情況下不收集用戶的錄音,只有當(dāng)用戶選擇加入語音改善計(jì)劃之后,才會把用戶的語音上傳到服務(wù)器進(jìn)行人工分析。
其次,還要添加別的安全措施。比如蘋果Siri使用隨機(jī)標(biāo)識符來保存用戶語音助手相關(guān)信息,這些標(biāo)識符不會與用戶的Apple賬號和手機(jī)號進(jìn)行關(guān)聯(lián)。六個(gè)月后,設(shè)備的數(shù)據(jù)會與標(biāo)識符取消關(guān)聯(lián)。