曙光智能汉字识别系统 NC-OCR
 
  曙光NC-OCR汉字识别系统,为信息化处理技术搭起了一座桥梁。它是通过扫描设备将印刷文字扫描成图像文件,经计算机的OCR识别软件完成图像文件到电子文件的转换,解决了印刷汉字高速输入的“瓶颈”,最大限度地满足报刊、杂志、图书、印刷及办公自动化文字处理的需要,也为各种电子数据库的建立发挥重要的作用。

  NC-OCR开发起点高,是在应用领域广的微机系统上开发的,核心模块性能优异,运行稳定,各项性能指标均达到该领域的先进水平,用户界面友好,操作简单、灵活,有完善的使用手册和联机帮助。为实现“高科技产业化”的目标,已将该项技术进行产品化。   

    该系统的主要技术性能指标:

  支持图象格式: Unpressed TIFF(普通非压缩图象格式), Pack Blb TIFF;
  识别率: 正常图象识别率>98%;
  识别速度: 22字/秒(486/100, 8M RAM);
  识别字数: 简体部分:国标简体一级汉字3755个、英文、标点、数字、200多个常用二级汉字;繁体部分:5401个繁体汉字、英文、标点、数字;
  识别字体: 黑体、宋体、仿宋体、楷体、圆体五种常用字体;
  识别字号: 1号字-6号字

  此外系统还有如下功能和特点:

  卓越的表格识别功能,首创将表格识别结果保存为 Microsoft Word可以接受的RTF格式,可实现表格的电子文档再现;
  具备快速准确的纯英文识别功能;
  增加简繁体自动转换功能;
  繁体汉字识别功能在简体和繁体 Windows/Windows95中灵活的切换操作界面;
  在识别过程中,增加了保留文件版式的功能;
  可自动去除硬回车和多余空格的功能;
  
  NC-OCR汉字识别系统于1999年技术转让给汉王科技后,其性能指标有更大的提高,不仅有普通版,又增加了专业版,实现了新的飞跃。



Copyright for NCIC All Rights Reserved
本网站版权归国家智能计算机研究开发中心所有