TH-OCR文字識別系統(tǒng)介紹
一.TH-OCR
TH-OCR是英文OpTIcal Character RecogniTIon的縮寫,意思為光學(xué)字符識別,通稱為文字識別,它的工作原理為通過掃描儀或數(shù)碼相機(jī)等光學(xué)輸入設(shè)備獲取紙張上的文字圖片信息,利用各種模式識別算法分析文字形態(tài)特征,判斷出漢字的標(biāo)準(zhǔn)編碼,并按通用格式存儲在文本文件中,由此可以看出,OCR實(shí)際上是讓計(jì)算機(jī)認(rèn)字,實(shí)現(xiàn)文字自動(dòng)輸入。它是一種快捷、省力、高效的文字輸入方法。
TH-OCR的突出特點(diǎn):
◇ 漢英雙語同時(shí)混排,識別率最高,居世界領(lǐng)先水平。
◇ 可以識別黑白、灰度、彩色圖像,可以讀取多種圖像格式。
◇ 首創(chuàng)對識別結(jié)果進(jìn)行電子文檔版面復(fù)原功能,所見即所得。
◇ 首創(chuàng)日文、韓文、日英混排、韓英混排識別功能,識別率98%以上。
TH-OCR的幾大優(yōu)勢:
1. 是唯一可以識別2萬多漢字的多體文字識別系統(tǒng),漢字識別國內(nèi)最優(yōu)。
2. 漢字和英文混排、日文和英文混排、韓文和英文混排同時(shí)識別。
3. 漢字識別率最高。文通TH-OCR經(jīng)過"863"智能專家組對數(shù)十萬字的指標(biāo)評測和中國軟件評測中心對產(chǎn)品的嚴(yán)格測試,識別正確率超過99.5%,代表了目前印刷體文字識別的最高水平。
4. 支持多種環(huán)境接口。文通TH-OCR支持WINDOWS環(huán)境和GB、BIG5、GBK、JIS、 SHIFT-JIS和KSC等多種內(nèi)碼,可以用于 WINDOWS NT和WINDOWS 98/2000/XP,適合全球各個(gè)地區(qū)使用。TH-OCR還具有自學(xué)習(xí)功能,不論什么生僻字,都可以通過鍵盤輸入進(jìn)行學(xué)習(xí),大大拓寬了OCR系統(tǒng)的識別字符集。
二.漢王OCR文本王
漢王文本王。漢王文本王是漢王公司采用最新的印刷體字符識別技術(shù),集成文本閱讀校對開發(fā)的一套高效輸入、快捷辦公的精品軟件系統(tǒng)。漢王文本王識別率高,識別速度快,并且為用戶定制了多種簡捷的工作模式:自動(dòng)、單步智能工作模式和專業(yè)批量工作模式自由選擇。相信會(huì)成為您辦公的好助手。
技術(shù)指標(biāo):
● 識別字符:
簡體字符集:國標(biāo)GB2312-80的全部一、二級漢字6800多個(gè)。
純英文字符集。
簡繁字集:除了簡體漢字外,還可以混識臺灣繁體字5400多個(gè)以及香港繁體字。
● 識別字體種類:
能識別宋體、仿宋、楷、黑、魏碑、隸書、圓體、行楷等一百多種字體,并支持多種字體混排。
● 識別字號:
初號——小六號字體。
● 表格識別:
可以自動(dòng)判斷、識別各種通用型印刷體表格。電子表格還原準(zhǔn)確精美,輸出的電子表格可隨意編輯。
● 正確識別率:
一般的識別條件下,對印刷體文稿都能達(dá)到很高的識別正確率。
● 識別速度:
在PII-233計(jì)算機(jī)上,印刷文稿識別速度達(dá)120字/秒。
產(chǎn)品特點(diǎn):
1.智能識別,準(zhǔn)確無誤:全智能化識別核心,識別速度快,識別效率高
2.一鍵掃入,WORD輸出:用戶操作簡單快捷,與WORD無縫連接,只需輕松按下一鍵,文檔自動(dòng)輸出到WORD
3.多種模式,任君選擇:用戶可根據(jù)工作需要或個(gè)人習(xí)慣選擇自動(dòng)、單步智能工作模式或?qū)I(yè)批量工作模式
4.復(fù)雜版面,自動(dòng)分析:智能分析各種中、英、繁、表、圖混排格式的文本,無需過多人工干預(yù)
5.表格輸入,輕松實(shí)現(xiàn):多樣化的表格判識,完美精確的表格還原,瞬間即可轉(zhuǎn)化成為可任意編輯的電子表格
6.批量輸入,快速高效:大批量的文件掃描,全自動(dòng)化的文字識別,速度快,效率更高
7.版面還原,原文重現(xiàn):精確保留了原版面格式,準(zhǔn)確恢復(fù)文本原貌
8.文件保存,多種格式:識別完的文檔可以保存為多種格式(PDF、HTML、RTF、XLS、TXT)的文件,方便實(shí)用
9.工程管理,更加輕松:工程文件方便管理,工作進(jìn)度隨時(shí)保存,打開工程文件即可繼續(xù)工作
10.文本朗讀、翻譯,省時(shí)省力:漢王閱讀小精靈,避免眼睛疲勞,讓您隨心所欲聽;翻譯軟件助您跨越語言障礙