文通鉴 TH-OCR使用手册——TH-OCR相关设置
发布日期:2007-10-16 16:06:00点击数:1457
1、系统设置
打开命令菜单,选择设置后,屏幕上显示设置对话框。如图所示,它包括了对系统、识别、扫描、后编改、语音校稿及其它等六项设置的选择。

(1)系统页面
英文提示:选中此项,则系统所有的界面均为英文,包括相关的提示信息也为英文。
自动进行倾斜校正:在扫描或导入图像到TH-OCR的同时,系统对图像自动进行倾斜校正操作。
自动进行版面分析:在扫描或导入图像到TH-OCR的同时,系统对图像文件进行自动的版面分析。
自动进行识别:在扫描或导入图像到TH-OCR的同时,系统对图像文件进行自动识别。
显示全局窗口:扫描或导入图像文件后,在TH-OCR界面会显示图像文件的全局窗口。
显示跟踪窗口:在进行后编改操作时,在界面的下部显示原始图像的跟踪窗口,以方便您在校对的时候,能同时看到识别结果与原始图像。
提示:
◆若扫描或导入的图像版面较为复杂,建议不选用自动进行识别、自动进行版面分析。对于复杂版面,手动进行版面分析能得到更佳的识别结果。
◆若用户选中自动进行识别,则系统会自动对图像文件先进行版面分析,然后再进行识别。
(2)扫描页面

扫描页面的设置包括文件名、扫描图象格式、图象压缩格式。用户可以根据实际工作情况自行选择。
在文件名区域:
◆扫描时输入文件名:扫描结束后,系统会弹出对话框,您可以对扫描的图像文件进行命名,以及选择保存目的文件夹。
◆自动命名:在文件前缀文本框中输入扫描文件的文件名前缀,系统会在扫描的同时对文件进行自动命名,文件的命名规则在您设置的文件名后按先后顺序添加数字,如image0001,image0002......。
在扫描图像格式区域
对于在TH-OCR中扫描的图像,有TIFF、JPEG、BMP、PCX四种保存格式,相对于不同的文件格式,又有各自的图像压缩格式。
◆TIF格式
TIF文件格式有四种压缩方式:None(无压缩)、PackBits、LZW、Group4FAX。
◆JPG格式
JPG文件格式有三种:High Quality、Middle Quality、Low Quality。
High Quality(高质量):文件较大,保存文件为一个无损而高质的格式,但是文件较大。在您想要保存一个高质量的JEG图像文件时,这个设置是非常有效的。
Middle Quality(良好质量):文件大小稍小巧一些,又能获得较高质量的文件。这种设置对文件进行了一定的压缩,压缩率为90%,这个压缩率能够提供一个高质量的图像显示在计算机的屏幕上。
Low Quality(低质量):文件是最小的,但是文件的质量不高,显示于计算机的屏幕上时,有一些模糊。
◆BMP格式
用BMP格式保存文件的时候,此时保存的文件是最大的,但是图像的清晰度是最好的。
◆PCX格式
用PCX格式来保存文件时,也只有一种格式:PCX。
(3)识别页面
识别页面设置,是对识别后的输出结果文本进行设置。
输出全角字符:选中此项,识别后得到的识别结果文本中,输出的字符为全角字符。
注:此项只对英文字母和数字有效。
汉字后加空格:在识别输出的时候,在汉字及标点符号后加一空格。
输出文本式框线:在识别表格图像时,您可以选择此项在识别结果文本中输出文本式框线。
后处理:选中此项,TH-OCR系统会自动对识别结果中错误的地方进行一次后处理,修正识别中比较明显的错误。
自动导出:对图像文件识别后,自动进行导出,导出的文件格式有两种:RTF格式和HTML格式。
(4)后编改页面
◆在浮动跟踪窗区域
对于浮动跟踪窗的位置,有三种选择:无(不显示浮动跟踪窗),文本行之上(在识别结果文本行的上方显示浮动跟踪窗),文本行之下(在识别结果文本行的下方显示浮动跟踪窗)。
浮动跟踪窗是有颜色显示的,背景色为浮动跟踪窗的底色,前景色为浮动跟踪窗中原始图像文字的颜色。浮动跟踪窗的前景色与前景色可以自行设置。
◆在可疑字颜色区域
可疑字指的是TH-OCR的识别核心进行识别时,不确定的识别结果。对于这些字,在TH-OCR中会用不同于正常识别结果字体的颜色来进行标识,您也可以自行设置可疑字的颜色以及可疑字的字体。例如,若正常的识别结果文本字体为12号字体黑色,您可以设置可疑字字体的颜色为红色14号,这样您就可以很迅速的找到可疑字,并对它们进行确认了。
(5)语音校稿页面

阅读回车字符:在语音校稿的时候,朗读出回车字符,以供您来进行校稿。
阅读标点符号:在语音校稿的时候,朗读出标点符号。
阅读单个数字:在语音校稿的时候,朗读出单个的数字。
语速:拖动刻度条,调整朗读的语速。数字越大,朗读的速度越快。
音量:拖动刻度条,调整音量的大小。数字越大,音量越高。
性别:系统中提供男声与女声的朗读。
点击重置按钮,重新进行设置。
2、工具条设置
显示或隐藏工具条
(1)打开显示菜单,指向工具条.
(2)选中或取消选中工具条子菜单下的各工具条或窗口,可以显示或隐藏工具条及窗口。
(3)也可以在TH-OCR工具条上单击鼠标右键在弹出菜单中选择相关的菜单选项。如图所示: