10月17日消息,HuggingFace官網顯示,百度昨晚發布的自研多模態文檔解析模型PaddleOCR-VL,發布20小時內即登頂HuggingFace Trending全球第一。
據了解,該模型核心參數僅0.9B,輕量高效,能以極低計算開銷精準識別文本、手寫漢字、表格、公式、圖表等復雜元素,支持109種語言。在權威榜單OmniBenchDoc V1.5中,它以92.6分獲綜合性能全球第一,四大核心能力全線SOTA,超越GPT-4o等模型,刷新OCR VL模型性能紀錄。
作為文心4.5衍生模型,PaddleOCR-VL融合了NaViT動態分辨率視覺編碼器與ERNIE-4.5-0.3B語言模型,實現精度與效率雙突破。
本文鏈接:百度最新開源模型PaddleOCR-VL登頂HuggingFaceTrending全球第一http://www.sq15.cn/show-3-157144-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇: 廣大特材:董事長歸來,企業再啟新征程