記者8月19日從國家區塊鏈技術創新中心獲悉,由國家區塊鏈技術創新中心、北京能源集團牽頭,聯合新華社國家重點實驗室、人民網、高等教育出版社、中國通用技術集團等10余家國內語料數據重點單位共同打造的高價值語料可信流通基礎設施正式啟動建設。
高價值語料數據是訓練人工智能大模型的關鍵因素。長期以來,高價值語料數據存在跨單位、跨行業、跨地區分布的特點,部分領域還暴露出濫用語料數據、泄露語料隱私等問題。以區塊鏈、隱私計算為代表的新一代信息技術,憑借可信存證、不可篡改、易確權等性能,可以保障語料數據可信安全地流通、使用和管理,有效破解上述難題。
國家區塊鏈技術創新中心相關負責為人介紹,高價值語料可信流通基礎設施將運用我國自主可控、性能領先的區塊鏈軟硬件技術,搭建起覆蓋全國的分布式語料數據互聯互通橋梁,鏈接語料供給方、加工方、需求方,實現全國分布式語料數據可信接入,跨地域可發現、可訪問,形成高質量語料數據集;同時,運用創新隱私計算技術,通過“數據不出域、可用不可見”的方式,保障大模型高價值語料數據在處理加工和模型訓練過程中無法二次非授權傳播。
在高價值語料可信流通基礎設施的支撐下,國家語料數據的重點單位還將開展基于區塊鏈與隱私計算的語料數據可信安全流通規范制定,形成高價值語料數據流通與增值的可持續生態。
記者8月19日從國家區塊鏈技術創新中心獲悉,由國家區塊鏈技術創新中心、北京能源集團牽頭,聯合新華社國家重點實驗室、人民網、高等教育出版社、中國通用技術集團等10余家國內語料數據重點單位共同打造的高價值語料可信流通基礎設施正式啟動建設。
高價值語料數據是訓練人工智能大模型的關鍵因素。長期以來,高價值語料數據存在跨單位、跨行業、跨地區分布的特點,部分領域還暴露出濫用語料數據、泄露語料隱私等問題。以區塊鏈、隱私計算為代表的新一代信息技術,憑借可信存證、不可篡改、易確權等性能,可以保障語料數據可信安全地流通、使用和管理,有效破解上述難題。
國家區塊鏈技術創新中心相關負責為人介紹,高價值語料可信流通基礎設施將運用我國自主可控、性能領先的區塊鏈軟硬件技術,搭建起覆蓋全國的分布式語料數據互聯互通橋梁,鏈接語料供給方、加工方、需求方,實現全國分布式語料數據可信接入,跨地域可發現、可訪問,形成高質量語料數據集;同時,運用創新隱私計算技術,通過“數據不出域、可用不可見”的方式,保障大模型高價值語料數據在處理加工和模型訓練過程中無法二次非授權傳播。
在高價值語料可信流通基礎設施的支撐下,國家語料數據的重點單位還將開展基于區塊鏈與隱私計算的語料數據可信安全流通規范制定,形成高價值語料數據流通與增值的可持續生態。
本文鏈接:高價值語料可信流通基礎設施啟動建設http://www.sq15.cn/show-2-8060-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: 石窟寺保護利用水平顯著提升
下一篇: “繡球花”創造電解水制氫催化劑新紀錄