3月30日,百度文心衍生模型PaddleOCR在GitHub上的Star數(shù)突破73.3K,超越谷歌Tesseract OCR,成為全球Star數(shù)最高的OCR項目。
谷歌Tesseract OCR誕生于1985年,最初由惠普實驗室研發(fā),2005年開源后由Google接手維護并持續(xù)迭代,是OCR領(lǐng)域延續(xù)近四十年的技術(shù)標桿,長期位居GitHub OCR項目Star數(shù)榜首。此次也是中國開源項目首次在OCR領(lǐng)域超越谷歌,實現(xiàn)GitHub Star數(shù)第一。
PaddleOCR基于文心大模型訓練而來,是文心大模型多模態(tài)能力的重要部分,支持超100種語言識別,用戶覆蓋160個國家和地區(qū)。
1月29日,新一代文檔解析模型PaddleOCR-VL-1.5在 OmniDocBench V1.5 榜單中取得了全球SOTA成績。
此外,PaddleOCR同步升級服務能力:官網(wǎng)免費每日解析頁數(shù)由1萬提升至2萬,用戶還可通過OpenClaw直接調(diào)用PaddleOCR Skill,免費獲取高精度PDF解析能力。
與此同時,PaddleOCR OCEAN生態(tài)聯(lián)盟正式成立,面向核心開源貢獻者、深度企業(yè)用戶及全球平臺伙伴開放,首批成員包括Hugging Face、Dify、RAGFlow、Cherry Studio、Milvus等全球平臺伙伴,將共同推動OCR技術(shù)在更廣泛場景中的應用落地。
-
百度
+關(guān)注
關(guān)注
9文章
2389瀏覽量
95246 -
模型
+關(guān)注
關(guān)注
1文章
3831瀏覽量
52287 -
GitHub
+關(guān)注
關(guān)注
3文章
489瀏覽量
18770
原文標題:PaddleOCR登頂GitHub Star OCR全球第一!
文章出處:【微信號:baidu_2000,微信公眾號:百度】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配百度文心ERNIE-Image文生圖模型
海光DCU Day0適配百度文心ERNIE-Image文生圖模型
瀚博半導體宣布深度參與百度飛槳黑客松生態(tài)活動
百度正式發(fā)布并開源新一代文檔解析模型PaddleOCR-VL-1.5
百度文心大模型5.0 Preview榮登LMArena文本榜國內(nèi)第一
百度健康升級發(fā)布文心健康管家
百度文心大模型5.0-Preview文本能力國內(nèi)第一
百度文心大模型X1.1正式發(fā)布
小語種OCR標注效率提升10+倍:PaddleOCR+ERNIE 4.5自動標注實戰(zhàn)解析
【EASY EAI Orin Nano開發(fā)板試用體驗】PP-OCRV5文字識別實例搭建與移植
中興努比亞啟動接入百度文心4.5系列開源大模型
百度文心大模型X1 Turbo獲得信通院當前大模型最高評級證書
百度文心衍生模型PaddleOCR登頂GitHub Star OCR全球第一
評論