當前位置:首頁 > 嵌入式 > 嵌入式動態(tài)
[導讀]人們最初確實天真地以為,算法能比人類更能避免偏見。人工智能學習人類知識,同時也吸收人類偏見。這種擔憂由來已久。但谷歌的一項新發(fā)明極大推進了人工智能從文本材料中學

人們最初確實天真地以為,算法能比人類更能避免偏見。人工智能學習人類知識,同時也吸收人類偏見。這種擔憂由來已久。但谷歌的一項新發(fā)明極大推進了人工智能從文本材料中學習的速度,也使解決機器偏見問題迫在眉睫。

10 月 25 日,谷歌宣布利用 BERT 來優(yōu)化搜索引擎,已經(jīng)使英語搜索結果的匹配度提高了 10% 左右。未來,谷歌還會推出學習其他語言和國家的算法。

BERT 是谷歌在 2018 年開發(fā)的一種基于神經(jīng)網(wǎng)絡的 NLP 技術,它能一次接收整句話,而非從左至右(或相反)逐字接收。這使得如果有人要搜“在沒有路緣的山坡停車”,BERT 能認出“不要”,從而給出正確的搜索結果。而傳統(tǒng)搜索引起只會關注“路緣”和“山坡”,給出與搜索意圖相反的結果。

圖 | BERT 能更好識別“在沒有路緣的山坡停車”句子里的“沒有”一詞,從而理解人類意圖

讓人們擔憂的是,BERT 的學習材料正來自數(shù)字化書籍和新聞文章。在 BERT 學會一切之前,人們沒有時間來清理其中根深蒂固的偏見。而這些偏見一旦被算法吸收,將更難辨認,也更難清除。

“形象一下在 AI 世界長大的孩子。他們在谷歌搜索 CEO 照片,冒出的大部分是男性。他們又搜索個人助手,大部分是女性。”Kriti Sharma 在一次 TED 相關演講中說??突仿〈髮W的計算機科學家已研究證實,BERT 傾向于將程序員與男性聯(lián)系起來。

另一位計算機科學家 Robert Munro 發(fā)現(xiàn),展示給 BERT 100 個單詞,包含馬、嬰兒、房子、珠寶等。BERT 會認為大部分與男性有關,僅媽媽是個例外。

“BERT 改變了一切,你可以教它所有技巧。”NLP 初創(chuàng)公司 Primer 的科學主管 John Bohannon 說。Munro 則認為,不平等現(xiàn)象一直存在,但有了 BERT,偏見就能夠繼續(xù)存在下去。

“是時候把算法當作人類設計的造物了。”人工智能批評人士 Kate Crawford 說,算法經(jīng)常被看作是不帶偏見、不可理解、勿需質疑的對象,但實際它會繼承我們的偏見,它只可能跟我們一樣好。

決策黑盒為偏見“藏污納垢”

人們最初確實天真地以為,算法能比人類更能避免偏見。1970 年代,倫敦圣喬治醫(yī)學院的 Geoffrey Franglen 博士著手編寫一個算法來篩選學生的入學申請。他認為,如果所有學生的申請都要遵循完全一樣的評估流程,結果就是公平的。

算法完成后與人類判斷有 90% 到 95% 的一致率,因此被投入使用。但直到 4 年后,調查者才發(fā)現(xiàn):算法會僅僅因為一個候選人沒有歐洲名字(可能不是白人),就扣除 15 分。如果申請者是女性,又要被扣掉 3 分。

“從深層次看,算法只是在維持招生系統(tǒng)早已存在的偏見而已。”IEEE 的文章評論說,“圣喬治醫(yī)學院之所以被逮住,是因為他們把偏見供奉到一個計算機程序里面,歧視是調查者可以驗證的。”

但對于人工智能的黑箱式?jīng)Q策,情況變得更加復雜。性別或出生地在算法中并不對應單一可辨的參數(shù),你很難給機器“定罪”。“在大工業(yè)時代,機器以暴露齒輪來展示強大。但如今,齒輪被隱藏起來,融入生活,無處不在,AI 就是這個齒輪。”一篇《福布斯》文章精辟地說。

在這種黑箱決策面前,反歧視法案可能也無能為力。Kriti Sharma 認為,如果 AI 幫人事主管尋找一位技術領袖,它會發(fā)現(xiàn)主管雇傭的大多是男性,從而以為男人比女人更容易編程。如果人類主管這樣做,我們會憤怒,也能夠阻止。“人工智能實際已凌駕于法律之上,因為是機器做的決定。”

更值得擔憂的是,AI 決策可能放大了科技企業(yè)和數(shù)據(jù)標注者的權力,因為無人能監(jiān)督。一個名為 ImageNet Roulette 的流行應用,曾故意向人們展示這種風險:它曾傾向于將非洲裔美國人標記為“不法分子”“罪犯”,此外還有“失敗者”“初學者”“蕩婦”這樣的標簽。

圖 | ImageNet 展示了為人們打上刻板標簽的權力,如何從拿低薪的標注者手中轉移到算法上

它的訓練數(shù)據(jù)來自 ImageNet 數(shù)據(jù)集,包含了 1400 張被標記的照片,而每張標記費用為幾美分。因此標簽標注者的偏見便被帶入數(shù)據(jù)集,訓練出各種算法,應用在形形色色的領域。“如果標注女性照片的人不選非二元人群或短發(fā)女性,那最終得到的人工智能就只認長發(fā)的女性模特。”

在被發(fā)現(xiàn)算法存在機器偏見時,谷歌和亞馬遜都會承諾迅速解決。“我們發(fā)現(xiàn)的明顯的偏見,但里面如果還有幾個呢?”Bohannon 博士說。如果要依賴這種決策,“正如生物學家努力理解細胞工作原理一樣,軟件工程師也必須找到理解 BERT 系統(tǒng)的方法。”

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉