夸克圖像文字識別算法是廣州市動悅信息技術有限公司旗下的深度合成服務算法。該算法依託於夸克(APP)套用於圖像文字識別場景,服務於企業端客戶,根據輸入的圖像,結合文字檢測識別技術,輸出圖像中文字。
2023年8月,國家網際網路信息辦公室發布第二批境內深度合成服務算法備案清單,夸克圖像文字識別算法在列。
基本介紹
- 中文名:夸克圖像文字識別算法
- 所屬公司:廣州市動悅信息技術有限公司
- 角色:服務提供者
- 備案編號:網信算備440105974095301230017號
算法原理,運行機制,套用場景,算法目的,
算法原理
夸克圖像文字識別算法對用戶拍攝、上傳的圖片進行文字檢測、文本識別和格式轉換處理,協助用戶提取圖片中的文本並將文本轉化成其他文檔格式,滿足用戶不同場景的需求。
運行機制
夸克用戶拍攝、上傳圖片後,可通過自動框選、手動框選圖片中的文本,選擇“確定”功能後,夸克圖像文本識別算法會提取圖片中的文本特徵,再結合語言模型進行解碼打分策略,最終將得分最高的文本串作為圖片的文本內容。轉換為文本後,文本可支持world、PDF、圖片、excel 等格式導出。夸克圖像文字識別算法僅支持對用戶主動拍攝、上傳的圖片進行識別。在內容安全方面,如果識別到圖片中的文字內容違反法律、行政法規等有關規定時,將依法及時採取攔截等處置措施
套用場景
夸克掃描王“提取文字”、“提取表格”
算法目的
滿足用戶在便利地識別和提取圖片檔案中地文本的需求