本报讯 近日,记者从湖南长沙高新技术开发区汉星科技公司获悉,该公司基于“头码”输入法的3万余套汉字输入软件已推广到湖南、湖北、北京等地应用,并与湖南人民出版社联合,参与了国家新闻出版重大科技工程项目“中华字库工程”的申报与专家评审会答辩。
作为我国四大数字出版工程之一的“中华字库”工程,旨在全面整理我国汉字资源,因而对输入法的速度、准确性、简易性、语种覆盖等方面提出了更高的要求,研发汉字的编码体系、输入、输出、存储、传输以及兼容等关键技术,成为技术攻关的重点。
该公司技术带头人程罡博士介绍,“头码”输入法的技术优势在于“猎头”加“合成”。即充分利用汉语包含声、韵、调和汉字包含分字的特点,结合拼音和笔画的信息进行“合成”编码。编码时,重点保留汉语汉字最首要的“头部”音、形信息,只对汉语拼音中最先出现的整字声母和“部件”声母的键位信息,以及汉字书写笔顺的头两笔或单笔的笔画信息进行提取。这样不仅加快了输入速度,而且使得汉字音、形结合的特点得以保留,具有良好的通用性,比目前流行的汉字笔画输入法的笔画数减少了一半以上,也有效克服了汉字拼音输入法由于同音异形字过多导致翻页过长的弱点,具有易、快、准、全、美的优点,能满足普通人员和专业人员的输入需要。这是继王码五笔形码输入法、智能拼音音码输入法之后的第三代输入法。该项研发成果于2009年先后获得汉星合成码、猎头码输入法两项国家发明专利授权。
记者从有关专家处了解到,汉语言文字音节清晰明了,便于人机对话时的语音处理,具有西方语言不可比拟的独特优势;其音形义关联,便于学习时举一反三,触类旁通;其字数多于西语文字的拼音字母个数,排列组合时更加伸缩自如。因此,以汉字作为信息处理的入口不仅不存在障碍,反而更具优势。基于这一认识,该公司于2006年至2008年开发出前期产品,并成为中国电子技术标准化研究所国家项目合作单位。据悉,该研发团队目前正在准备为从古至今出现过的100万个汉字和30万个各类少数民族文字提供输入法的整体设计和编码方案,并将在单字输入的基础上,进一步开发语词、语句、语段、语篇等级别的语料库。(成舸 李浩鸣)
《科学时报》 (2011-3-2 A1 要闻)