記者7月2日從國家區塊鏈技術創新中心獲悉,新華社國家重點實驗室、人民網、中國科學院文獻情報中心、北京廣播電視臺、高等教育出版社、首都圖書館、中央電化教育館出版社、萬方數據、中國知網等語料數據重點單位,日前聯合國家區塊鏈技術創新中心,共同建立高價值語料可信安全流通生態體系。
近年來,人工智能技術快速發展,為各行業加速形成新質生產力提供了機遇。人工智能大模型的發展,其訓練使用的高價值語料數據是關鍵因素。當前,高價值語料數據跨單位、跨行業、跨地區分布,但由于缺乏足夠的隱私安全保障和有效的激勵機制,語料數據擁有者往往“不敢分享”“不愿分享”,造成大量高價值語料數據“供給難、流通難、使用難”。
國家區塊鏈技術創新中心有關專家表示,以區塊鏈、隱私計算為代表的新一代信息技術,憑借著可信存證、不可篡改、易確權、充分保護數據隱私安全等優異性能,可以保障語料數據可信安全地流通、使用和管理,一舉破解上述難題。
據介紹,此次加入生態體系的成員均是國內語料數據領域的核心單位。成員單位將運用我國自主可控、性能領先的區塊鏈軟硬件一體基礎設施,搭建起覆蓋全國的分布式語料數據互聯互通橋梁,鏈接語料供給方、加工方、需求方,實現全國分布式語料數據可信接入,跨地域可發現、可訪問,形成高質量語料數據集。同時,成員單位運用區塊鏈智能合約技術,實現語料數據流通全鏈路透明、自動“計量結算”,激勵語料擁有者分享數據;運用創新隱私計算技術,保障大模型高價值語料數據在處理加工和模型訓練過程中“無法二次傳播”。
此外,生態體系的共建各方還將開展基于區塊鏈與隱私計算的語料數據可信安全流通規范制定,形成高價值語料數據流通與增值的可持續生態,推動我國人工智能領域通用大模型與行業大模型的高質量發展。
記者7月2日從國家區塊鏈技術創新中心獲悉,新華社國家重點實驗室、人民網、中國科學院文獻情報中心、北京廣播電視臺、高等教育出版社、首都圖書館、中央電化教育館出版社、萬方數據、中國知網等語料數據重點單位,日前聯合國家區塊鏈技術創新中心,共同建立高價值語料可信安全流通生態體系。
近年來,人工智能技術快速發展,為各行業加速形成新質生產力提供了機遇。人工智能大模型的發展,其訓練使用的高價值語料數據是關鍵因素。當前,高價值語料數據跨單位、跨行業、跨地區分布,但由于缺乏足夠的隱私安全保障和有效的激勵機制,語料數據擁有者往往“不敢分享”“不愿分享”,造成大量高價值語料數據“供給難、流通難、使用難”。
國家區塊鏈技術創新中心有關專家表示,以區塊鏈、隱私計算為代表的新一代信息技術,憑借著可信存證、不可篡改、易確權、充分保護數據隱私安全等優異性能,可以保障語料數據可信安全地流通、使用和管理,一舉破解上述難題。
據介紹,此次加入生態體系的成員均是國內語料數據領域的核心單位。成員單位將運用我國自主可控、性能領先的區塊鏈軟硬件一體基礎設施,搭建起覆蓋全國的分布式語料數據互聯互通橋梁,鏈接語料供給方、加工方、需求方,實現全國分布式語料數據可信接入,跨地域可發現、可訪問,形成高質量語料數據集。同時,成員單位運用區塊鏈智能合約技術,實現語料數據流通全鏈路透明、自動“計量結算”,激勵語料擁有者分享數據;運用創新隱私計算技術,保障大模型高價值語料數據在處理加工和模型訓練過程中“無法二次傳播”。
此外,生態體系的共建各方還將開展基于區塊鏈與隱私計算的語料數據可信安全流通規范制定,形成高價值語料數據流通與增值的可持續生態,推動我國人工智能領域通用大模型與行業大模型的高質量發展。
本文鏈接:國家區塊鏈中心牽頭共建人工智能語料共享新模式http://www.sq15.cn/show-2-7401-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: 國內第一大光源加速器完成全環真空閉環