电子报
电子报
- 第1833期

习近平考察清华TH-OCR文字识别科研成果应用基地


  本报讯 3月22日上午,中共中央政治局常委、中央书记处书记、国家副主席习近平在湖南考察工作期间,考察、参观了位于长沙市的清华TH-OCR文字识别科研成果应用基地———湖南省青苹果数据中心有限公司。
  习近平副主席走进车间,和大家一一握手。他详细了解了生产流程,仔细观看了我校电子工程系教师彭良瑞演示的 “蒙藏维哈柯朝民族文字文档综合识别理解系统”,以及应用 TH-OCR技术生产的 《人民日报图文电子版》、《韩国历史报刊电子版》等几十种数字化产品。在听取了关于在新疆建设民族文字数字化生产基地的汇报后,习近平充分肯定了中心应用现代技术推动文化工程建设的成绩。习近平说:“把文献数字化并进行整理,这是一项基础性工作。你们用高科技手段,对历史文献、精神文化产品进行整理传播,这是一个很有市场前景、具有经济和社会效益的产业,有关部门应高度重视,给予大力支持。”
  我校电子工程系丁晓青教授带领的智能图文信息处理研究室在国家自然科学基金委、教育部、国家语委、863计划等支持下,长期不懈地在文字识别领域钻研探索,研究方向包括多文种印刷体文字识别、脱机及联机手写汉字识别、表格识别以及视频文字检测识别等,先后取得了多项经鉴定达国际领先水平的科研成果,并推动科研成果产业化应用,形成 TH-OCR文字识别系列软件产品。近年来,TH-OCR汉日韩文字识别技术在激烈的国际竞争中夺标授权微软公司在Office软件中使用;增值税发票识别防伪认证系统在国家金税工程中应用;在各行各业中应用的 TH-OCR系列软件产品还包括车牌识别、名片识别、表格识别、纸币与证件鉴伪、信封地址识别等。
  在文档数字化应用领域中,我校与民族地区高校西北民族大学、新疆大学、内蒙古大学合作完成的“蒙藏维哈柯朝民族文字文档综合识别理解系统”,在国内外首次独创统一解决了蒙古、藏、维吾尔、哈萨克、柯尔克孜、朝鲜等民族文字以及阿拉伯文印刷文档识别问题。该系统应用于青苹果数据中心在新疆的民族文字数字化生产基地建设中,对于开展“技术援疆”、促进互联网时代少数民族优秀文化的传承和发展具有重要意义。(电子系)