PaddleOCR GitHub源碼,PaddleOCR是一款簡(jiǎn)單方便的開(kāi)源OCR文字識(shí)別工具,提供于GitHub上面,可以在這里查看源碼數(shù)據(jù),可以自行編輯使用。本站帶來(lái)最新的PaddleOCR源碼數(shù)據(jù)資源下載,下面給出了詳細(xì)特性說(shuō)明,感興趣的朋友們可以下載體驗(yàn)。
PaddleOCR介紹
PaddleOCR旨在打造一套豐富、領(lǐng)先、且實(shí)用的OCR工具庫(kù),助力使用者訓(xùn)練出更好的模型,并應(yīng)用落地。
PP-OCR是一個(gè)實(shí)用的超輕量OCR系統(tǒng)。主要由DB文本檢測(cè)、檢測(cè)框矯正和CRNN文本識(shí)別三部分組成。該系統(tǒng)從骨干網(wǎng)絡(luò)選擇和調(diào)整、預(yù)測(cè)頭部的設(shè)計(jì)、數(shù)據(jù)增強(qiáng)、學(xué)習(xí)率變換策略、正則化參數(shù)選擇、預(yù)訓(xùn)練模型使用以及模型自動(dòng)裁剪量化8個(gè)方面,采用19個(gè)有效策略,對(duì)各個(gè)模塊的模型進(jìn)行效果調(diào)優(yōu)和瘦身,最終得到整體大小為3.5M的超輕量中英文OCR和2.8M的英文數(shù)字OCR。
PaddleOCR特性
1、PPOCR系列高質(zhì)量預(yù)訓(xùn)練模型,準(zhǔn)確的識(shí)別效果
超輕量ppocr_mobile移動(dòng)端系列:檢測(cè)(2.6M)+方向分類器(0.9M)+ 識(shí)別(4.6M)= 8.1M
通用ppocr_server系列:檢測(cè)(47.2M)+方向分類器(0.9M)+ 識(shí)別(107M)= 155.1M
超輕量壓縮ppocr_mobile_slim系列:檢測(cè)(1.4M)+方向分類器(0.5M)+ 識(shí)別(1.6M)= 3.5M
2、支持中英文數(shù)字組合識(shí)別、豎排文本識(shí)別、長(zhǎng)文本識(shí)別
3、支持多語(yǔ)言識(shí)別:韓語(yǔ)、日語(yǔ)、德語(yǔ)、法語(yǔ)
4、支持用戶自定義訓(xùn)練,提供豐富的預(yù)測(cè)推理部署方案
5、支持PIP快速安裝使用
6、可運(yùn)行于Linux、Windows、MacOS等多種系統(tǒng)