中国信息产业网 2008-3-6 08:14
据国外媒体报道,搜索谷歌就一项针对图片和视频中所含文字内容的识别技术提交了专利申请。据悉该软件于2007年开发成功,它可识别图像、视频中内置的文本内容。谷歌在该专利申请的简要技术说明中表示,这种文字识别使用了计算器辅助技术,其中包括对图像中的文字进行抽取,以前谷歌申请的专利技术多与文本搜索有关。业内人士预计,谷歌未来将在视频、图片搜索服务中向大家提供以OCR图片文字识别技术为核心的搜索服务。这个新闻,让一直默默发展着的OCR技术成为世人瞩目的明星。
在个人应用领域,继谷歌新产品之后,文文件录入、文档搜索、文档管理,OCR在个人办公系统中的作用越来越大,已然形成了一个个人应用的铁三角。尽管是因为DV/DC等移动数码设备的普及,让大家知道并了解文通信息的慧视软件,但不可否认,作为一款独立的输入软件,慧视的优势是独一无二的。慧视对图像源的要求降低,使得DV/DC等拍到的图像数据可以被轻松识别,甚至是户外的广告牌、石碑等。自此,OCR受到人们的广泛关注。
谷歌于2007年开始进入OCR研究领域,将OCR与传统的搜索技术结合在一起,获得了双赢的效果,可以说谷歌让OCR更亲民,而OCR则让谷歌更强大。北京文通信息技术有限公司从1992年开始就进入OCR领域,经过15年不断发展,TH-OCR已经将其它OCR技术远远抛在了后面。从技术的可靠性、稳定性和实用性等多个角度来说,TH-OCR是目前最优秀的OCR技术。
TH-OCR是“863计划”重点项目,由清华大学电子工程系智能图文实验室研发,现在代表我国OCR技术水平的TH-OCR多次获得国际奖项,并且文通在2007年实现了我国少数民族语言识别,这是世界首个蒙藏维哈朝多民族语言识别技术。OCR技术的不断成熟,带动了文文件影像市场的整体发展。目前市场上已有很多以OCR为核心的文文件影像整体解决方案,文通的整体解决方案就涉及了从金融、政府、图书馆到电力、企事业单位等多个领域,随着OCR技术的不断成熟,它的应用范围也越来越大。
中国人民银行于2007年6月25日建成全国支票影像交换系统,实现了支票在全国范围的互通使用,企事业单位和个人持任何一家银行的支票均可在境内所有地区办理支付。在金融系统,支票的异地使用具有深刻的历史意义和社会意义,而这一过程的实现则是由文文件影像技术来保障的。通过对支票、证件等凭证影像文文件的原式原样保存,电子文文件影像文件具有法律效力,从而实现支票的异地支付,提高了银行工作效率,方便了人们的生活,从长远看更利于我国经济的发展。文通信息首先提出了表格识别的文文件影像概念,全力保障金融行业高速可靠地运转。
个人应用与行业应用的全面发展,将OCR技术推向了前台,越来越多的人开始知道、了解OCR,并时刻感受着OCR技术带来的便利。