- TH-OCR文字識別SDK
- OCR文字識別系統(信創版)
- TH-OCR少數民族文檔識別
功能介紹
-
1:1還原重構表格
支持OCR自動識別分析表格,并1:1還原重構表格,確保數據完整性
-
OCR識別多種版面報刊
可以識別不同版式的報刊內容,精確重現原始布局
-
支持多種采集方式
通過手機、平板電腦、高拍儀、掃描儀、數碼相機等途徑獲取的圖像均可識別
-
可識別多門語種,字符集廣
支持OCR識別印刷簡體、手寫簡體、印刷繁體、手寫繁體、生僻字、手寫體和印刷體混合文本及通用英文
-
支持OCR識別、導出多種格式圖像/文件
支持識別BMP、JPG、JPEG、PNG、PDF等主流圖片格式;導出JSON、TXT、雙層PDF等多種格式文件
-
自動旋正圖片
TH-OCR文字識別支持45°、90°、180°、270°等多角度圖片旋正
-
可與多種系統集成應用
提供標準的API接口,實現與檔案、OA、ERP等應用系統快速集成
-
多種部署方式
既支持B/S端服務部署,也支持PC端SDK集成部署,也支持移動端SDK(Android,鴻蒙)集成
-
支持CPU和GPU硬件配置部署
同樣識別性能情況下,支持CPU和GPU硬件配置部署,節約硬件投入成本
產品優勢
國家科技進步二等獎
- TH-OCR技術榮獲國家科技進步二等獎、教育部科技進步一等獎等多個獎項
拓展應用
- 支持與AI掃描儀等硬件產品拓展應用,實現大量數據檔案的管理與數字化
自動校正
- 支持對圖像由于掃描引起的傾斜進行自動校正
支持版面分析、版面還原
- 支持對圖像進行自動版面分析,根據分析結果 1:1還原版面格式及信息
智能OCR識別
- 在線可識別字在原文中的位置和大小,可識別多頁PDF文件
支持OCR生僻字識別
- TH-OCR文字識別可高精度識別多種生僻字
可擦除下劃線、濾色后識別
- 可過濾圖片上的紅色或粉色等干擾背景
保證數據安全
- 企業內網部署,滿足用戶數據安全的需求
OCR秒級識別、識別率高
- 識別速度快,識別速度在1秒以內,識別準確率高達99%以上
應用范圍廣
- 可廣泛應用于檔案系統、大模型、RPA等多領域
應用場景
- 電子檔案安全管理系統
- 系統辦公軟件
- 檔案數字化加工
- 智能硬件
- 合同管理
- 大模型
-
電子檔案安全管理系統
將文通科技OCR文字識別系統應用于計算機終端保密檢查系統、電子文檔安全管理系統、郵件防控管理系統、電子檔案安全管理等系統,超高識別率為數據安全和風險防范提供高效技術支持。
-
系統辦公軟件
將文通科技TH-OCR文字識別SDK嵌入到RPA等辦公軟件中,可應用于金融、醫療保健、企業、政府、招標機構等各領域,為終端客戶提供各類文檔或者內部資料的文字提取功能,操作便捷,提升整體的工作效率、節約人力成本。
-
檔案數字化加工
將文通科技OCR文字識別系統應用于大量數據檔案的管理與數字化場景,通過掃描企業紙質檔案,可導出雙層PDF、TXT、WORD、XML、XLS等格式文件,方便企業編輯、查找檔案信息,應用于圖書館數字化項目、歷史檔案數字化、軍政檔案管理、軍政檔案管理等項目,實現檔案數字化管理,提升效率和智能化水平。
-
智能硬件
將文通科技文字識別SDK嵌入到多功能一體機、掃描儀或其他智能硬件中,在進行文檔錄入的工作時,可快速識別和提取文字,實現企業信息數字化管理。
-
合同管理
合同比對基于文通科技TH-OCR文字識別,自動抽取合同文本中的關鍵信息,可識別字在原文中的位置和大小,將圖像識別輸出為可編輯的文件格式,進行存儲,實現計算機替代人工審核比對,解決合同管理工作中人工審核時間成本高、人力成本高的難題。
-
大模型
文通科技OCR識別技術與大模型相結合,通過對文檔整體內容和結構的理解,能夠更準確地識別和分類信息,從而顯著提升文檔檢索和管理的效率。例如,深度學習模型可以理解復雜的文檔版面,自動提取關鍵信息,處理各種文字和排版風格,確保轉換后的電子文本質量和可編輯性,極大地減少了人工操作的時間和成本。
客戶案例
免費測試
TH-OCR文字識別SDK 識別
圖像建議:大小在200KB左右,位深度24以上。掃描圖像建議:分辨率為300DPI,小于3M。

- TH-OCR文字識別SDK
- 結果
- JSON數據