文通鉴 TH-OCR使用手册——TH-OCR相关设置

发布日期:2007-10-16 16:06:00点击数:1457
1、系统设置

  打开命令菜单,选择设置后,屏幕上显示设置对话框。如图所示,它包括了对系统、识别、扫描、后编改、语音校稿及其它等六项设置的选择。

 
(1)系统页面
  英文提示:选中此项,则系统所有的界面均为英文,包括相关的提示信息也为英文。
  自动进行倾斜校正:在扫描或导入图像到TH-OCR的同时,系统对图像自动进行倾斜校正操作。
  自动进行版面分析:在扫描或导入图像到TH-OCR的同时,系统对图像文件进行自动的版面分析。
  自动进行识别:在扫描或导入图像到TH-OCR的同时,系统对图像文件进行自动识别。
  显示全局窗口:扫描或导入图像文件后,在TH-OCR界面会显示图像文件的全局窗口。
  显示跟踪窗口:在进行后编改操作时,在界面的下部显示原始图像的跟踪窗口,以方便您在校对的时候,能同时看到识别结果与原始图像。

提示:
  ◆若扫描或导入的图像版面较为复杂,建议不选用自动进行识别、自动进行版面分析。对于复杂版面,手动进行版面分析能得到更佳的识别结果。 
  ◆若用户选中自动进行识别,则系统会自动对图像文件先进行版面分析,然后再进行识别。 

(2)扫描页面

  扫描页面的设置包括文件名、扫描图象格式、图象压缩格式。用户可以根据实际工作情况自行选择。
  在文件名区域:
  ◆扫描时输入文件名:扫描结束后,系统会弹出对话框,您可以对扫描的图像文件进行命名,以及选择保存目的文件夹。 
  ◆自动命名:在文件前缀文本框中输入扫描文件的文件名前缀,系统会在扫描的同时对文件进行自动命名,文件的命名规则在您设置的文件名后按先后顺序添加数字,如image0001,image0002......。 
  在扫描图像格式区域
  对于在TH-OCR中扫描的图像,有TIFF、JPEG、BMP、PCX四种保存格式,相对于不同的文件格式,又有各自的图像压缩格式。
  ◆TIF格式 
TIF文件格式有四种压缩方式:None(无压缩)、PackBits、LZW、Group4FAX。
  ◆JPG格式 
  JPG文件格式有三种:High Quality、Middle Quality、Low Quality。
High Quality(高质量):文件较大,保存文件为一个无损而高质的格式,但是文件较大。在您想要保存一个高质量的JEG图像文件时,这个设置是非常有效的。
  Middle Quality(良好质量):文件大小稍小巧一些,又能获得较高质量的文件。这种设置对文件进行了一定的压缩,压缩率为90%,这个压缩率能够提供一个高质量的图像显示在计算机的屏幕上。
  Low Quality(低质量):文件是最小的,但是文件的质量不高,显示于计算机的屏幕上时,有一些模糊。
  ◆BMP格式 
用BMP格式保存文件的时候,此时保存的文件是最大的,但是图像的清晰度是最好的。
  ◆PCX格式 
  用PCX格式来保存文件时,也只有一种格式:PCX。

(3)识别页面
  识别页面设置,是对识别后的输出结果文本进行设置。
  输出全角字符:选中此项,识别后得到的识别结果文本中,输出的字符为全角字符。
  注:此项只对英文字母和数字有效。
  汉字后加空格:在识别输出的时候,在汉字及标点符号后加一空格。
输出文本式框线:在识别表格图像时,您可以选择此项在识别结果文本中输出文本式框线。
  后处理:选中此项,TH-OCR系统会自动对识别结果中错误的地方进行一次后处理,修正识别中比较明显的错误。
  自动导出:对图像文件识别后,自动进行导出,导出的文件格式有两种:RTF格式和HTML格式。

(4)后编改页面
 
  ◆在浮动跟踪窗区域 
  对于浮动跟踪窗的位置,有三种选择:无(不显示浮动跟踪窗),文本行之上(在识别结果文本行的上方显示浮动跟踪窗),文本行之下(在识别结果文本行的下方显示浮动跟踪窗)。
  浮动跟踪窗是有颜色显示的,背景色为浮动跟踪窗的底色,前景色为浮动跟踪窗中原始图像文字的颜色。浮动跟踪窗的前景色与前景色可以自行设置。
  ◆在可疑字颜色区域 
  可疑字指的是TH-OCR的识别核心进行识别时,不确定的识别结果。对于这些字,在TH-OCR中会用不同于正常识别结果字体的颜色来进行标识,您也可以自行设置可疑字的颜色以及可疑字的字体。例如,若正常的识别结果文本字体为12号字体黑色,您可以设置可疑字字体的颜色为红色14号,这样您就可以很迅速的找到可疑字,并对它们进行确认了。

(5)语音校稿页面

  阅读回车字符:在语音校稿的时候,朗读出回车字符,以供您来进行校稿。
  阅读标点符号:在语音校稿的时候,朗读出标点符号。
  阅读单个数字:在语音校稿的时候,朗读出单个的数字。
  语速:拖动刻度条,调整朗读的语速。数字越大,朗读的速度越快。
  音量:拖动刻度条,调整音量的大小。数字越大,音量越高。
  性别:系统中提供男声与女声的朗读。
  点击重置按钮,重新进行设置。

2、工具条设置
  显示或隐藏工具条
  (1)打开显示菜单,指向工具条. 
  (2)选中或取消选中工具条子菜单下的各工具条或窗口,可以显示或隐藏工具条及窗口。
  (3)也可以在TH-OCR工具条上单击鼠标右键在弹出菜单中选择相关的菜单选项。如图所示:
返回顶部