中新網(wǎng)北京11月6日電 (記者 孫自法)國際知名學(xué)術(shù)期刊《自然》最新發(fā)表一篇人工智能(AI)研究論文,提出并構(gòu)建了一個超過1萬張人類圖像的數(shù)據(jù)庫,旨在評估AI模型在以人為本的計算機視覺領(lǐng)域中的偏見。
這一“公平的以人類為中心的圖像基準(zhǔn)”(FHIBE)由索尼AI團隊開發(fā),其采用符合倫理手段獲取、基于用戶同意的數(shù)據(jù)集,可用于評估以人為中心的計算機視覺任務(wù),從而識別、糾正偏見和刻板印象。
本項研究的相關(guān)圖像數(shù)據(jù)(圖片來自論文)。施普林格·自然供圖該論文介紹,計算機視覺廣泛應(yīng)用于自動駕駛車輛到面部識別技術(shù)等領(lǐng)域。許多計算機視覺使用的AI模型,其訓(xùn)練數(shù)據(jù)存在缺陷,可能未經(jīng)同意收集,經(jīng)常來自網(wǎng)絡(luò)大規(guī)模圖像抓取。人們也已發(fā)現(xiàn),AI模型可能會反映出延續(xù)性別歧視、種族歧視或其他刻板印象的偏見。
在本項研究中,索尼AI團隊構(gòu)建了一個圖像數(shù)據(jù)集,在同意機制、多樣性和隱私等多方面努力采取最佳實踐:FHIBE包含81個國家或地區(qū)中1981個個體的10318張圖像,該數(shù)據(jù)庫涵蓋人口統(tǒng)計和生理特征的全面標(biāo)注,包括年齡、代詞類別、祖先血統(tǒng)、發(fā)色與膚色等;參與者獲得關(guān)于項目和潛在風(fēng)險的詳細(xì)信息,幫助他們做出知情同意,過程符合全面數(shù)據(jù)保護法規(guī)。這些特征使該數(shù)據(jù)庫成為評估AI偏見的可靠資源。
研究團隊將FHIBE和27個現(xiàn)有以人類為中心的計算機視覺應(yīng)用數(shù)據(jù)集進行比較,發(fā)現(xiàn)FHIBE數(shù)據(jù)集在多樣性與AI評估的可靠同意方面標(biāo)準(zhǔn)更高,同時還有效減少了偏見,它包含的參與者自我申報標(biāo)注信息超過其他數(shù)據(jù)集,還包括了相當(dāng)比例通常代表性不足的人群。
論文作者總結(jié)表示,F(xiàn)HIBE數(shù)據(jù)集可用于評估現(xiàn)有的AI模型在計算機視覺任務(wù)中的表現(xiàn),能揭示更多此前無法了解的偏見。他們也提醒指出,創(chuàng)建數(shù)據(jù)集的過程充滿挑戰(zhàn)且成本高昂,但FHIBE可能代表了邁向更可信AI的一步。
(原標(biāo)題:國際最新研究構(gòu)建超萬張人類圖像數(shù)據(jù)庫評估人工智能視覺偏見)
本文鏈接:研究構(gòu)建超萬張人類圖像數(shù)據(jù)庫,評估AI視覺偏見http://www.sq15.cn/show-11-27771-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
上一篇: 蟑螂的糞便,正暗中毒害室內(nèi)空氣
下一篇: 新一代光電探測器研發(fā)框架獲共識