現(xiàn)在還沒有100%無偏見的數(shù)據(jù)集誰才是讓AI產(chǎn)生偏見的幕后推手

時間：2020-07-15 11:39:25

美國麻省理工學(xué)院媒體實驗室研究項目顯示，人工智能識別淺色皮膚男性的平均錯誤率不超過1%，識別深色皮膚女性的平均錯誤率達(dá)35%……

人臉識別所導(dǎo)致的偏見問題一直受到廣泛關(guān)注。近期，一篇關(guān)于圖像超分辨率的論文引發(fā)了對于產(chǎn)生偏見原因的新爭論。

網(wǎng)友利用論文中的開源代碼進(jìn)行了模型推理，在使用時發(fā)現(xiàn)，非白人面孔的高糊照片被還原成了一張白人面孔。對此，2018年圖靈獎得主、AI領(lǐng)軍人物楊立昆(Yann LeCun)在推特上指出，當(dāng)數(shù)據(jù)有偏見時，機(jī)器學(xué)習(xí)系統(tǒng)就變得有偏見。而這一觀點(diǎn)，掀起一場爭論浪潮。有人說，機(jī)器學(xué)習(xí)系統(tǒng)產(chǎn)生偏見不應(yīng)只歸咎于數(shù)據(jù)集，這種甩鍋的做法是不公平的，還有技術(shù)、人類觀念等原因。

現(xiàn)在還沒有100%無偏見的數(shù)據(jù)集

隨著人工智能時代的到來，人臉識別技術(shù)正被越來越廣泛地應(yīng)用在執(zhí)法、廣告及其他領(lǐng)域。然而，這項技術(shù)在識別性別、膚色等過程中，存在著一定偏見。

“在美國，人臉識別系統(tǒng)中白人男性的識別率最高，而黑皮膚女性的識別率則最低;在亞洲國家的人臉識別系統(tǒng)中黃種人的識別率相比白種人的識別率差距就會小一些。”福州大學(xué)數(shù)學(xué)與計算機(jī)科學(xué)學(xué)院、福建省新媒體行業(yè)技術(shù)開發(fā)基地副主任柯逍博士說。

這次陷入爭論中心的人臉識別偏見問題其實是一個存在很久、熱度很高的話題。

早前，美國麻省理工學(xué)院媒體實驗室主導(dǎo)的一項名為《Gender Shades》的研究項目在研究了各個前沿科技公司的面部識別系統(tǒng)后發(fā)現(xiàn)，各系統(tǒng)在識別男性面臉與淺色面臉方面表現(xiàn)更佳，淺色皮膚男性的平均識別錯誤率不超過1%，淺色皮膚女性的平均識別錯誤率約為7%，深色皮膚男性的平均識別錯誤率約為12%，深色皮膚女性的平均識別錯誤率則高達(dá)35%。

那么本次爭議中，楊立昆指出的數(shù)據(jù)集問題是如何產(chǎn)生偏見的?有無100%沒有偏見的數(shù)據(jù)集?“不均衡的數(shù)據(jù)，導(dǎo)致了系統(tǒng)在學(xué)習(xí)時,更好地擬合了比重較大的數(shù)據(jù)，而對占比小的數(shù)據(jù)的擬合則表現(xiàn)不佳，這就可能最終導(dǎo)致了偏見的產(chǎn)生。”柯逍介紹說，如一個常見的人臉識別數(shù)據(jù)集LFW，數(shù)據(jù)集中有近77%的男性，同時超過80%是白人。

“目前，幾乎可以肯定的是沒有100%無偏見的數(shù)據(jù)集。”柯逍舉例說，在收集數(shù)據(jù)時，可以針對性地讓男性與女性數(shù)目一樣，甚至也可以讓各種膚色的數(shù)據(jù)數(shù)目都一樣。但是，其中可能大部分人是沒有戴眼鏡的，這可能就對戴眼鏡的人進(jìn)行識別時帶來了偏見。進(jìn)一步講，各個年齡段的人臉也很難做到完全一致，導(dǎo)致最后學(xué)習(xí)到的模型可能對戴眼鏡、年長或年幼的人臉產(chǎn)生偏見。所以有時候討論數(shù)據(jù)偏見的產(chǎn)生，會發(fā)現(xiàn)其產(chǎn)生的原因是考慮問題的角度不同。

出現(xiàn)偏見不能只歸咎于數(shù)據(jù)

眾多專家也指出，數(shù)據(jù)可能是機(jī)器學(xué)習(xí)系統(tǒng)中偏見的來源，但不是唯一的來源。

其實，在本次爭議中，楊立昆在推特中已經(jīng)很明確地表示，他的本意并不是說問題都出在數(shù)據(jù)集上，只是針對這篇論文，其算法在特定場景下，換個數(shù)據(jù)集就能解決問題，但并不是說所有的機(jī)器學(xué)習(xí)系統(tǒng)偏見都來源于數(shù)據(jù)集。

那么，誰才是產(chǎn)生偏見真正的“幕后推手”?

AI學(xué)習(xí)過程應(yīng)該是架構(gòu)、數(shù)據(jù)、訓(xùn)練算法等的相互作用。算法包括了特征的選擇、損失函數(shù)的選擇、訓(xùn)練方法的選擇以及超參數(shù)調(diào)節(jié)等，其本身的缺陷也是偏見產(chǎn)生的一個原因。

2019年12月，美國國家標(biāo)準(zhǔn)技術(shù)研究院進(jìn)行的一項研究發(fā)現(xiàn)，在大多數(shù)當(dāng)前評估的人臉識別算法中，跨人種差異確實存在廣泛的準(zhǔn)確性偏差。

柯逍介紹說，在算法設(shè)計的時候，往往會選擇L1損失函數(shù)或者L2損失函數(shù)。若在將一個低分辨率人臉圖像還原成高分辨率人臉圖像的方法中，使用L2損失函數(shù)，得到的大多數(shù)人臉圖像更像白人;而使用L1損失函數(shù)，得到大多數(shù)人臉圖像更像黑人。這說明由于損失函數(shù)的選擇不同，某個群體(黑人或白人)在一定程度上就會受算法的忽視，進(jìn)而產(chǎn)生偏見。

這當(dāng)中還存在另一種情況，假如數(shù)據(jù)帶有少量的偏見，算法系統(tǒng)會將其放大，并變得更具有偏見。一項研究表明，如果初始數(shù)據(jù)中，下廚與女性的聯(lián)系概率是66%，將這些數(shù)據(jù)喂給人工智能后，其預(yù)測下廚與女性聯(lián)系起來的概率會放大到84%。一般來說，機(jī)器學(xué)習(xí)系統(tǒng)會選擇最符合通用情況的策略，然而這樣會導(dǎo)致一些非典型情況或較為特殊情況被忽略。

除此之外，產(chǎn)生偏見的原因還有相似性的偏見。信息推送系統(tǒng)總會向用戶推薦他已經(jīng)看到、檢索過的相關(guān)內(nèi)容。最終的結(jié)果是導(dǎo)致流向用戶的信息流都是基于現(xiàn)存的觀點(diǎn)和看法。“系統(tǒng)會自動幫助用戶屏蔽與他們意見相左的信息，這就催生了一個信息泡沫，用戶看到的都是人工智能讓你看到的。這種偏見根本上也是數(shù)據(jù)與算法共同作用產(chǎn)生的。”柯逍說。

“總體而言，偏見還是源于規(guī)則制定者。”中銳網(wǎng)絡(luò)人工智能產(chǎn)品總監(jiān)葉亮說，工程師從頭到尾參與了整個系統(tǒng)設(shè)計，尤其是機(jī)器學(xué)習(xí)的目標(biāo)設(shè)定。算法就好像一只嗅探犬，當(dāng)工程師向它展示特定東西的氣味后，它才能夠更加精準(zhǔn)地找到目標(biāo)。

算法糾偏工具已經(jīng)上崗

近期，國際多家機(jī)構(gòu)相繼宣布禁用人臉識別技術(shù)。有色人種被還原成白人的事件，再次掀起了人們對于人工智能系統(tǒng)產(chǎn)生偏見的批判浪潮，也再次警醒人們，技術(shù)帶有偏見所帶來的潛在危機(jī)。

偏見可能導(dǎo)致無辜者蒙冤。在2018年夏天，英國媒體就報道過，由于人臉識別技術(shù)的誤判，導(dǎo)致一名年輕黑人男性被誤認(rèn)為嫌疑犯，在公眾場合被警察搜身。

也有報告顯示，一些國外執(zhí)法機(jī)構(gòu)可以根據(jù)AI識別出的發(fā)色、膚色和面部特征對視頻中的人物進(jìn)行檢索。這種技術(shù)上的偏見也在一定程度上放大了人們的偏見。

除了對人種與性別的識別偏差之外，人臉識別技術(shù)還因其在侵犯隱私方面的問題而引起擔(dān)憂。2020年初，美國一家人臉識別技術(shù)公司便受到了嚴(yán)密的審查，有關(guān)部門發(fā)現(xiàn)，其面部識別工具由超過30億張圖像構(gòu)建而成，然而這些圖像大部分都是通過抓取社交媒體網(wǎng)站收集的，并且已被許多企業(yè)廣泛使用。

偏見存在的同時，一批新興的算法糾偏工具也涌入了人工智能。

早在2018年，臉書曾發(fā)布一個算法模型，表示會在算法因種族、性別、年齡等因素做出不公正判斷時發(fā)出警告以提醒開發(fā)者;2019年麻省理工學(xué)院就提出了一種糾偏算法，可以通過重新采樣來自動消除數(shù)據(jù)偏見。

那么克服偏見還需要人工智能技術(shù)做出哪些努力?“開源方法和開源技術(shù)都有著極大的潛力改變算法偏見。”葉亮指出，開源方法本身十分適合消除偏見程序，開源社區(qū)已經(jīng)證明它能夠開發(fā)出強(qiáng)健的、經(jīng)得住嚴(yán)酷測試的機(jī)器學(xué)習(xí)工具。如果線上社團(tuán)、組織和院校能夠接受這些開源特質(zhì)，那么由開源社區(qū)進(jìn)行消除算法偏見的機(jī)器設(shè)計將會順利很多。

柯逍認(rèn)為，可以看出偏見基本來源于數(shù)據(jù)與算法，加強(qiáng)對人工智能所使用的數(shù)據(jù)、算法以及模型的評估，能夠在一定程度上緩解潛在的、可導(dǎo)致偏見與歧視的因素。同時，人工智能的偏見其實都是人類偏見的反映與放大，因此人們放下偏見才是最根本的解決方案。

關(guān)鍵詞： AI

延伸閱讀:

版權(quán)聲明：
凡注明來網(wǎng)絡(luò)消費(fèi)網(wǎng)的作品，版權(quán)均屬網(wǎng)絡(luò)消費(fèi)網(wǎng)所有，未經(jīng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的，應(yīng)在授權(quán)范圍內(nèi)使用，并注明"來源：網(wǎng)絡(luò)消費(fèi)網(wǎng)"。違反上述聲明者，本網(wǎng)將追究其相關(guān)法律責(zé)任。
除來源署名為網(wǎng)絡(luò)消費(fèi)網(wǎng)稿件外，其他所轉(zhuǎn)載內(nèi)容之原創(chuàng)性、真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考并自行核實。

熱文

學(xué)好語文就選科大訊飛AI翻譯筆，多重使...
三個月內(nèi)突圍而出，TVB識貨618告捷: GM...
玩轉(zhuǎn)穗澳特色就在琶洲！2023澳門·廣州...
玩轉(zhuǎn)穗澳特色就在琶洲！2023澳門·廣州...
環(huán)球報道:[今日關(guān)注] 南昌男科醫(yī)院男科...
環(huán)球報道:[今日關(guān)注] 南昌男科醫(yī)院男科...
錦繡良緣
vivo手機(jī)屏下的按鍵突然沒了怎么辦|天天...
vivo手機(jī)屏下的按鍵突然沒了怎么辦|天天...
證監(jiān)會立案！此前剛遭上交所紀(jì)律處分！-...
證監(jiān)會立案！此前剛遭上交所紀(jì)律處分！-...
志愿者化身“移動拐杖”：端午假期鐵路...
畫面溫馨！約60只海豚在海警艦艇附近跳...
畫面溫馨！約60只海豚在海警艦艇附近跳...
深圳中國國際旅行社有限公司（關(guān)于深圳...
深圳中國國際旅行社有限公司（關(guān)于深圳...
天天即時：欠了信用卡1萬如何申請延長分期
共話中國經(jīng)濟(jì)新機(jī)遇丨綜述：中荷經(jīng)貿(mào)人...
共話中國經(jīng)濟(jì)新機(jī)遇丨綜述：中荷經(jīng)貿(mào)人...
基金分紅：方正富邦穩(wěn)豐一年定開債券發(fā)...
基金分紅：方正富邦穩(wěn)豐一年定開債券發(fā)...
樹欲靜風(fēng)而不止的意思_樹欲靜風(fēng)不止什么...
樹欲靜風(fēng)而不止的意思_樹欲靜風(fēng)不止什么...
手扶梯_關(guān)于手扶梯的介紹
天天觀點(diǎn)：京津冀及山東多地超過40℃ 1...
天天觀點(diǎn)：京津冀及山東多地超過40℃ 1...
當(dāng)前速看：大摩：維持MP Materials(MP.US)評級
當(dāng)前速看：大摩：維持MP Materials(MP.US)評級
獨(dú)臂背山工穿梭懸崖絕壁，運(yùn)125斤重的一...
獨(dú)臂背山工穿梭懸崖絕壁，運(yùn)125斤重的一...
長城MV | 團(tuán)結(jié)，就是力量！
世界滾動:鎮(zhèn)江中國獨(dú)角獸企業(yè)數(shù)量全國排...
世界滾動:鎮(zhèn)江中國獨(dú)角獸企業(yè)數(shù)量全國排...
世界播報:新疆挖掘南疆特色產(chǎn)業(yè)潛力
世界播報:新疆挖掘南疆特色產(chǎn)業(yè)潛力
欠了信用卡11年沒還，不還產(chǎn)生什么后果_...
欠了信用卡11年沒還，不還產(chǎn)生什么后果_...
天天精選！小區(qū)便利店怎么選擇位置
我的世界自動門感應(yīng)門（我的世界自動感...
我的世界自動門感應(yīng)門（我的世界自動感...
她曾經(jīng)在23歲時走紅，卻被身高限制戲路...
她曾經(jīng)在23歲時走紅，卻被身高限制戲路...
最新消息：老年人有性生活就是不害臊？...
羊湯怎么熬好喝? 快資訊
羊湯怎么熬好喝? 快資訊
如果你是說話容易緊張，還很自卑的人，...
如果你是說話容易緊張，還很自卑的人，...
焦點(diǎn)快播：美媒：失蹤潛艇副駕駛妻子是...
頭條焦點(diǎn)：離婚二審撫養(yǎng)權(quán)怎么判
頭條焦點(diǎn)：離婚二審撫養(yǎng)權(quán)怎么判
世界最新：杭州民辦東方中學(xué)教師待遇_杭...
世界最新：杭州民辦東方中學(xué)教師待遇_杭...
【天天播資訊】國際油價21日上漲天天觀天下
五彩繩原來是織女留下來的線基本情況講解
五彩繩原來是織女留下來的線基本情況講解
環(huán)球速讀：瘋狂！散戶大買15億，美股空...
環(huán)球速讀：瘋狂！散戶大買15億，美股空...
世界動態(tài):首屆京津冀生態(tài)產(chǎn)業(yè)創(chuàng)新發(fā)展大...
世界報道:運(yùn)動員該如何應(yīng)對“飯圈文化”...
世界報道:運(yùn)動員該如何應(yīng)對“飯圈文化”...
“盛夏”（113） | 上游主題攝影征稿...
“盛夏”（113） | 上游主題攝影征稿...
港交所紐約辦事處開幕　提升北美地區(qū)服務(wù)
港交所紐約辦事處開幕　提升北美地區(qū)服務(wù)
韓媒：韓國環(huán)境部已批準(zhǔn)“薩德”基地環(huán)...
看圖學(xué)習(xí)｜中華優(yōu)秀傳統(tǒng)文化是中華民族...
看圖學(xué)習(xí)｜中華優(yōu)秀傳統(tǒng)文化是中華民族...
當(dāng)前觀察：郴電國際郴州分公司營業(yè)班獲...
當(dāng)前觀察：郴電國際郴州分公司營業(yè)班獲...
天天新動態(tài)：三亞22日10時起發(fā)放一批旅...
呂梁市“三夏”麥?zhǔn)瞻才耪{(diào)度會要求：顆...
呂梁市“三夏”麥?zhǔn)瞻才耪{(diào)度會要求：顆...
比砒霜毒百倍！一顆就能致命！千萬別碰...
比砒霜毒百倍！一顆就能致命！千萬別碰...
全球要聞：光明日報刊文:為什么印度難以...
全球要聞：光明日報刊文:為什么印度難以...
紀(jì)檢監(jiān)察機(jī)關(guān)統(tǒng)籌用好基層監(jiān)督力量精...
紀(jì)檢監(jiān)察機(jī)關(guān)統(tǒng)籌用好基層監(jiān)督力量精...
總投資約36億元，惠州新材料產(chǎn)業(yè)園再引5...
觀焦點(diǎn)：魍魎魑魅怎么讀什么意思？它...
選流量卡如何避坑？這三步曲你都了解了嗎？
選流量卡如何避坑？這三步曲你都了解了嗎？
俠探杰克第一季豆瓣（影評下午茶之俠探...
俠探杰克第一季豆瓣（影評下午茶之俠探...
將于7月內(nèi)上市新款榮威i5官圖發(fā)布
淘寶林彎彎是誰_林彎彎淘寶店
淘寶林彎彎是誰_林彎彎淘寶店
【天天播資訊】琿春市積極構(gòu)建和諧勞動...
【天天播資訊】琿春市積極構(gòu)建和諧勞動...
三終端上人難，邀約棘手。
GDR發(fā)行熱度持續(xù)上升多家龍頭企業(yè)扎堆...
GDR發(fā)行熱度持續(xù)上升多家龍頭企業(yè)扎堆...
國寶“體驗”端午文化當(dāng)前焦點(diǎn)
國寶“體驗”端午文化當(dāng)前焦點(diǎn)
【環(huán)球報資訊】OPPO A57打開飛行模式方法介紹
近親屬和親屬的區(qū)別_近親屬|(zhì)當(dāng)前看點(diǎn)
近親屬和親屬的區(qū)別_近親屬|(zhì)當(dāng)前看點(diǎn)
當(dāng)前視訊！二建報名時間2021年_2021年二...
當(dāng)前視訊！二建報名時間2021年_2021年二...
焦點(diǎn)熱訊:華中科技大學(xué)地址在哪個城市_...

科技

· 2023最建議買的二手手機(jī)推薦？2023最建議買
· 為什么懂手機(jī)的人都不用華為？為什么很多人
· 華為oppo手機(jī)同等價位哪個好？三千左右買華
· oppo和華為誰用久了可以不卡？oppo手機(jī)好還
· oppo萬能密碼6位數(shù)解鎖是什么？OPPO手機(jī)的
· 如何打開oppo手機(jī)鎖屏密碼？oppo手機(jī)密碼鎖
· OPPO手機(jī)怎么總是自己跳轉(zhuǎn)快應(yīng)用？OPPO打開
· oppo手機(jī)像中毒似的彈出廣告？oppo手機(jī)老是
· oppo手機(jī)熱點(diǎn)資訊如何徹底關(guān)掉？oppo手機(jī)老
· oppo手機(jī)開發(fā)者選項在哪里能打開？oppo手機(jī)

熱文

環(huán)球報道:[今日關(guān)注] 南昌男科醫(yī)院男科收費(fèi)高嗎排名公開
證監(jiān)會立案！此前剛遭上交所紀(jì)律處分！-觀焦點(diǎn)
深圳中國國際旅行社有限公司（關(guān)于深圳中國國際旅行社有限公司介紹）|報道
基金分紅：方正富邦穩(wěn)豐一年定開債券發(fā)起基金6月27日分紅
樹欲靜風(fēng)而不止的意思_樹欲靜風(fēng)不止什么意思是什么
當(dāng)前速看：大摩：維持MP Materials(MP.US)評級
獨(dú)臂背山工穿梭懸崖絕壁，運(yùn)125斤重的一筐粽子：想讓家人過上好日子-全球速看料
世界播報:新疆挖掘南疆特色產(chǎn)業(yè)潛力
欠了信用卡11年沒還，不還產(chǎn)生什么后果_全球最資訊
她曾經(jīng)在23歲時走紅，卻被身高限制戲路，老公也是優(yōu)秀的演員！|每日熱文

網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱

中國網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像