人工智能也存在種族歧視嗎
2017年,一款皂液分發(fā)器走紅網(wǎng)絡(luò):在推特用戶Chukwuemeka Afigbo上傳的視頻中,一位白人男性在分發(fā)器下方揮手,皂液正常流出;而黑皮膚的手放到分發(fā)器下時(shí),機(jī)器卻毫無(wú)反應(yīng)。這兩個(gè)人交談著,再一次測(cè)試這臺(tái)冒犯人的、樂(lè)柏美商務(wù)用品出品的機(jī)器。一人問(wèn):“你的手怎么回事?”另一個(gè)回答說(shuō):“太黑了?!?/p>
他說(shuō)的也有道理。皂液分發(fā)器通過(guò)紅外發(fā)光二極管燈泡發(fā)射不可見(jiàn)光,接收手的反射光啟動(dòng)機(jī)器。膚色較暗的人吸收的光多于反射的光,因此阻礙了皂液分發(fā)器的正常工作。
這則視頻在全球廣泛流傳,被分享成百上千次,也激起不少民憤;這告訴了我們一個(gè)簡(jiǎn)單的道理:不同于長(zhǎng)期以來(lái)技術(shù)推動(dòng)人類進(jìn)步的說(shuō)法,技術(shù)仍然存在種族差異。
技術(shù)在娛樂(lè)應(yīng)用程序里的失敗技術(shù)應(yīng)用是一回事,但環(huán)顧四周會(huì)發(fā)現(xiàn),生活中常用的技術(shù)出現(xiàn)種族差異是另一回事。如果你懷疑世界建立之初就只考慮到了白人,不妨看看新一輪技術(shù)熱潮是如何在早期開(kāi)發(fā)過(guò)程中忽略“有色人種”的。
開(kāi)發(fā)者承擔(dān)了大部分責(zé)任,同時(shí)科技初創(chuàng)公司正嘗試填補(bǔ)硅谷及其他地區(qū)“白人男性”開(kāi)發(fā)者留下的空缺。到了2017年,開(kāi)發(fā)人員自主研發(fā)不再是什么新鮮事,但讓技術(shù)忽略大部分全球人口,無(wú)非是個(gè)虧本買賣。有關(guān)新聞(附帶視頻)報(bào)道了一名劉姓中國(guó)學(xué)生的iPhone X面部識(shí)別功能如何無(wú)法分辨他和他的母親。技術(shù)的失誤帶來(lái)的安全隱患僅僅基于種族問(wèn)題。
膚色問(wèn)題在面部識(shí)別軟件中的無(wú)能表現(xiàn)得更為嚴(yán)峻:后者在遇到執(zhí)法過(guò)程中無(wú)法擺脫對(duì)黑人面孔的無(wú)意識(shí)偏見(jiàn)。Alexandria Ocasio-Cortez議員于五月就亞馬遜和移民和海關(guān)執(zhí)法局(ICE)對(duì)眾議院監(jiān)管委員會(huì)(House Oversight Committee)提出質(zhì)詢,她指出,“這些算法的有效程度因人而異”,并進(jìn)一步提問(wèn),它對(duì)女性、有色人種和不同性別是否有效。得到回應(yīng)均為否定時(shí),她提出了一個(gè)尖刻的問(wèn)題:這些算法對(duì)誰(shuí)最有效?回答很簡(jiǎn)短:“肯定是白人男性?!?/p>
今年,也許最令人擔(dān)憂的是一份Georgia Tech的報(bào)告,該報(bào)告考察了自動(dòng)駕駛汽車問(wèn)題,并分析了多種“機(jī)器視覺(jué)”系統(tǒng)識(shí)別不同膚色行人的有效程度。結(jié)果表明,比起較深膚色的人,AI系統(tǒng)更善于識(shí)別淺色皮膚的行人,成功識(shí)別白人行人的幾率比黑人高出10%。另一份近期的報(bào)告指出,F(xiàn)itbit等可穿戴心率追蹤器在有色人種身上不太靠譜,因?yàn)樗昧艘环N極易被黑色素吸收的綠光。
無(wú)數(shù)實(shí)例表明,技術(shù)設(shè)計(jì)忽視種族是當(dāng)今社會(huì)的“時(shí)興”問(wèn)題。長(zhǎng)期以來(lái),世界的發(fā)展就沒(méi)有考慮過(guò)有色人種,現(xiàn)在隨著朝AI和自動(dòng)化方向的變革,未來(lái)似乎仍沒(méi)有顧及這群人。盡管自動(dòng)化汽車和面部識(shí)別遠(yuǎn)未在全球范圍內(nèi)普及,此時(shí)此刻,人們?nèi)粘I钪衅毡槭褂玫募夹g(shù)正在他們的口袋里傳達(dá)著有關(guān)種族優(yōu)越的信息。
“iPhone里的Siri是我現(xiàn)在唯一常用的技術(shù),我主要用它識(shí)別像‘帶我回家’之類的基礎(chǔ)句子,”Julian Mendel在Facetime上說(shuō),“但有幾次它聽(tīng)到我的聲音后沒(méi)有反應(yīng)或壓根沒(méi)聽(tīng)懂我在說(shuō)什么。”
憑借自己在牙買加長(zhǎng)大、近期移居美國(guó)的經(jīng)歷,用戶Julian Mendel正用(英國(guó)人聽(tīng)來(lái))濃重的牙買加口音外加美式鼻音解釋Siri的用戶體驗(yàn)?!拔矣X(jué)得我的確在用一個(gè)不同的聲音和Siri說(shuō)話,因?yàn)樗^對(duì)聽(tīng)不懂方言。我不認(rèn)為牙買加那邊有這種東西,所以我堅(jiān)信這種技術(shù)還有很長(zhǎng)一段路要走。對(duì)很多人而言,它幾乎沒(méi)什么作用。很多人能夠支付技術(shù)的費(fèi)用,卻沒(méi)辦法使用它,因?yàn)槠匠4蠹視?huì)說(shuō)方言?!?/p>
有色人種為了被人理解而采用更清晰(意作:更接近白人)的語(yǔ)音屢見(jiàn)不鮮,但讓一些人為新技術(shù)而順應(yīng)白人的語(yǔ)音習(xí)慣至少可以說(shuō)是令人沮喪的。畢竟,根據(jù)口音縮小市場(chǎng)的技術(shù)能有多有效呢?
Mendel不是唯一受這類問(wèn)題困擾的人。我和帶有濃重的印度、韓國(guó)和西班牙口音的人交談過(guò),他們都表示遇到過(guò)類似情況。何況還有其他沒(méi)有說(shuō)到的語(yǔ)言。所以,有沒(méi)有方法解決這個(gè)讓一部分全球人口無(wú)法使用技術(shù)的問(wèn)題嗎?
在多倫多的Collision(北美最大的技術(shù)會(huì)議)會(huì)場(chǎng)上,Mozilla的創(chuàng)意總監(jiān)Katharina Borchert正面對(duì)200名聽(tīng)眾。她展示的主題是:用語(yǔ)音數(shù)據(jù)彌補(bǔ)市場(chǎng)的空白。她穿著時(shí)髦,有一頭栗色的頭發(fā),戴眼鏡,說(shuō)著一口帶德語(yǔ)鼻音的口音,Borchert正在解釋技術(shù)公司代表的“白皮膚的陳舊男性”壟斷勢(shì)力如何怠慢被她稱為來(lái)自“新興市場(chǎng)”的人群。她強(qiáng)調(diào)了很多人已經(jīng)知道的事實(shí):語(yǔ)音識(shí)別不能滿足有口音或非英語(yǔ)母語(yǔ)者的需求(她指出,即使像中文普通話一樣的通用語(yǔ)言也以男性語(yǔ)音為主)。她倡導(dǎo)Common Voice,一個(gè)意在通過(guò)收集個(gè)體聲音作為數(shù)據(jù)集,促進(jìn)A.I.語(yǔ)音多樣化的項(xiàng)目。點(diǎn)擊Common Voice,錄制諸如“所有房子都由木材建成”,或“帶有種族成見(jiàn)的各種民族恐慌和偏見(jiàn)”等句子貢獻(xiàn)語(yǔ)音。
“我們意識(shí)到,數(shù)據(jù)生態(tài)系統(tǒng)十分閉塞,因?yàn)榭偸悄敲磶讉€(gè)大公司擁有訓(xùn)練數(shù)據(jù)集,”Borchert結(jié)束演講后在茶歇時(shí)間說(shuō),“蘋(píng)果、亞馬遜、谷歌、Nuance和微軟,你可以利用它們的數(shù)據(jù)集,也可以利用亞馬遜Alexa的技能,但這些對(duì)于像Mozilla這樣有使命感、重視開(kāi)放式網(wǎng)絡(luò)、立志創(chuàng)造充滿機(jī)遇的生態(tài)系統(tǒng)的公司來(lái)說(shuō),規(guī)模就遠(yuǎn)遠(yuǎn)不夠?!?/p>
“我們從幾年前開(kāi)始開(kāi)發(fā)語(yǔ)音識(shí)別的公司那里得知,他們通常將公共電臺(tái)的聲音收錄到數(shù)據(jù)集中,這樣就不必太擔(dān)心版權(quán)問(wèn)題。這些音頻大多來(lái)自說(shuō)母語(yǔ)、接受過(guò)發(fā)聲訓(xùn)練的男性,所以最后得到的語(yǔ)音是清晰的,因?yàn)閿?shù)據(jù)集里大部分聲音都如此。自然而然會(huì)導(dǎo)致不公正的結(jié)果,因?yàn)閿?shù)據(jù)就那些。收集的女聲不多,更沒(méi)有夸張口音。這就是為什么早期版本在識(shí)別女性聲音方面有很大的問(wèn)題,因?yàn)榕砸粽{(diào)與男性的不同。所以,講話人語(yǔ)音越多樣,數(shù)據(jù)從長(zhǎng)遠(yuǎn)來(lái)講質(zhì)量也越好。”
這種方法存在一些問(wèn)題——數(shù)據(jù)集的大小取決于講話人參與的積極性,人們還會(huì)擔(dān)心收集數(shù)據(jù)的用途。Borchert目前正與從柏林到盧旺達(dá)大大小小的社區(qū)合作;在東非地區(qū),人們自然會(huì)懷疑白人“創(chuàng)意執(zhí)行官”為什么要找東非原住民錄制聲音?!爱?dāng)然,找到愿意說(shuō)英語(yǔ)的人比找到愿意說(shuō)盧旺達(dá)語(yǔ)的人容易很多,因?yàn)檎莆蘸笳叩娜藬?shù)更少?!彼忉尩馈!八杂⒄Z(yǔ)的數(shù)據(jù)容量比其他語(yǔ)言更容易擴(kuò)大,不過(guò)我認(rèn)為具體實(shí)施還要看社區(qū)積極性和參與度。”
Borchert也認(rèn)識(shí)到,人們?cè)诓恢肋@些數(shù)據(jù)的最終去向時(shí),是不愿意提供聲音信息的。(Borchert保證,其條款是數(shù)據(jù)不被非法使用的保障,所有語(yǔ)音數(shù)據(jù)均會(huì)匿名,無(wú)法分辨其中的個(gè)人信息)
“我們不想擁有所有數(shù)據(jù)”她強(qiáng)調(diào),“我們不想構(gòu)建所有語(yǔ)音系統(tǒng)。我希望我們能引發(fā)下一波語(yǔ)音平臺(tái)創(chuàng)新的熱潮。我母親的英語(yǔ)有濃重的德語(yǔ)口音,她能使用德語(yǔ)版本的Amazon Echo,但她用不了英語(yǔ)版本,也不能用Siri……我的父親不會(huì)用英語(yǔ)和Siri對(duì)話。
她辯稱,收集到的數(shù)據(jù)不僅可以用于養(yǎng)老,理想條件下,還可以用于移動(dòng)醫(yī)療,無(wú)需打字就可以問(wèn)一些簡(jiǎn)單的問(wèn)題。顯然這樣的項(xiàng)目除了調(diào)節(jié)語(yǔ)音的平衡,還能成為政治活動(dòng)的工具。Borchert回憶了近期發(fā)生的一件事:政治活動(dòng)家和高校人員共同將加泰羅尼亞語(yǔ)和威爾士語(yǔ)的語(yǔ)音引入項(xiàng)目,當(dāng)時(shí)正為這兩種語(yǔ)言即將失傳而擔(dān)憂的政治氛圍中。
Common Voice的進(jìn)程漫長(zhǎng)而艱辛。但它提供了很好的企業(yè)方案,有望借助大家的聲音反抗現(xiàn)有種族格局,大大改變?nèi)蚨鄶?shù)老齡化人口使用技術(shù)的方式。但見(jiàn)證真正的改變發(fā)生還需要對(duì)企業(yè)的部署結(jié)構(gòu)進(jìn)行根本性的改革,必須用現(xiàn)在的問(wèn)題重新設(shè)定未來(lái)。在未來(lái)世界里,人們的技術(shù)將源自日常生活。
目前,我們只做到了第一步,即認(rèn)識(shí)到技術(shù)的種族差異。這或許聽(tīng)起來(lái)難以接受,但如果你是正在爭(zhēng)取技術(shù)獲取權(quán),希望在家庭日常生活中使用AI的有色人種來(lái)說(shuō),你比世界上的其他人更難找到方向——假裝白人的語(yǔ)音,把白色餐巾偷偷放在皂液分發(fā)器下,失去養(yǎng)老的機(jī)會(huì),承擔(dān)比白人行人更高的風(fēng)險(xiǎn),可能是你未來(lái)短期內(nèi)需要面對(duì)的境況。
來(lái)源:搜狐