國際最新研究構建超萬張人類圖像數據庫 評估人工智能視覺偏見
中新網北京11月6日電 (記者 孫自法)國際知名學術期刊《自然》最新發表一篇人工智能(AI)研究論文,提出并構建了一個超過1萬張人類圖像的數據庫,旨在評估AI模型在以人為本的計算機視覺領域中的偏見。
這一“公平的以人類為中心的圖像基準”(FHIBE)由索尼AI團隊開發,其采用符合倫理手段獲取、基于用戶同意的數據集,可用于評估以人為中心的計算機視覺任務,從而識別、糾正偏見和刻板印象。
本項研究的相關圖像數據(圖片來自論文)。施普林格?自然 供圖該論文介紹,計算機視覺廣泛應用于自動駕駛車輛到面部識別技術等領域。許多計算機視覺使用的AI模型,其訓練數據存在缺陷,可能未經同意收集,經常來自網絡大規模圖像抓取。人們也已發現,AI模型可能會反映出延續性別歧視、種族歧視或其他刻板印象的偏見。
在本項研究中,索尼AI團隊構建了一個圖像數據集,在同意機制、多樣性和隱私等多方面努力采取最佳實踐:FHIBE包含81個國家或地區中1981個個體的10318張圖像,該數據庫涵蓋人口統計和生理特征的全面標注,包括年齡、代詞類別、祖先血統、發色與膚色等;參與者獲得關于項目和潛在風險的詳細信息,幫助他們做出知情同意,過程符合全面數據保護法規。這些特征使該數據庫成為評估AI偏見的可靠資源。
研究團隊將FHIBE和27個現有以人類為中心的計算機視覺應用數據集進行比較,發現FHIBE數據集在多樣性與AI評估的可靠同意方面標準更高,同時還有效減少了偏見,它包含的參與者自我申報標注信息超過其他數據集,還包括了相當比例通常代表性不足的人群。
論文作者總結表示,FHIBE數據集可用于評估現有的AI模型在計算機視覺任務中的表現,能揭示更多此前無法了解的偏見。他們也提醒指出,創建數據集的過程充滿挑戰且成本高昂,但FHIBE可能代表了邁向更可信AI的一步。(完)
本文鏈接:國際最新研究構建超萬張人類圖像數據庫 評估人工智能視覺偏見http://www.sq15.cn/show-5-75830-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。