揭密最熟悉的陌生输入法——郑码

如果要说世界上普及率最高的中文笔画输入法(字形码),绝对不是五笔字型,而是郑码。

对大多数人来说,郑码是我们最熟悉同时又最陌生的输入法。它是windows系统中唯一预装的一套笔画输入法,除了郑码之外,其它的全拼双拼、微软拼音、智能ABC等都是拼音码。然而我使用电脑的时间超过10年,从未见过任何一个人会使用郑码的人。

从windows95开始,所有的中文windows系统(95/98/NT/2000/XP)都预装了郑码。这到底是为什么?郑码到底是谁发明的?为什么微软公司选择的是郑码而不是五笔字型?郑码真的有什么过人之处么?

郑码到底是谁发明的?

郑码的发明人是我国著名文字学家、享誉海内外的《英华大词典》主编郑易里教授。我家里正好就有他编著的这本词典,1965年版,铅字印刷的,现在已经老旧老旧的了。所以,对他的名字我觉得很亲切。

郑码和五笔字型的渊源

郑易里教授研究汉字拆分方案几十年,1980年时候完成了世界上首个只用通用键盘的26个英文字母键将汉字代码输入计算机的《26键位汉字拆根输入码方案》。但是他将自己多年对字根、对汉字编码理论和方案的研究心得和发明成果都无私地传授给了王永民等人。王永民等人在郑的研究基础上完成了五笔字型的发明。可以说,如果不是他当时的无私奉献,现在占中国统治地位的笔画输入法,就绝对不是五笔字型了。五笔诞生以后虽然获得了很大的成功和荣誉,但郑易里仍觉得五笔对于汉字的拆分不是很合理和完善,特别是不太符合汉字的文字规范,因此继续不断研究改进,在他的女儿郑珑的帮助下,最后共同发明了更为规范和完善的中文笔画输入法—《字根通用码》。也就是我们后来看到的郑码。

郑码的过人之处

《郑码》以单字输入为基础,词语输入为主导,用2-4个英文字母便能输2字词、多字词和30个字以内的短语;在这种字词交融输入之下,输入一个汉字的平均码长是1.8-1.9键之间。他备有两个词库,分别收录25000和50000条词语。为了不同用户的需求,郑码输入法分为《普及型》和《标准型》两种。《标准型》重码率低,适合高速盲打输入。

《郑码》的优势是,在汉字文字规律方面符合国家语言文字规范,具有规范、易学、快速、通用的特点(当然,这个易学和快速,是相对于当时的笔画输入法而言的),有条件在中、小学和社会上推广应用。郑码因此获得了国家无数的奖项和荣誉。(现在看来,目前中文录入速度最快的应该是五笔字型,已经超过每分钟300个字。而郑码的最高速度大约是240字。而最简单易学的输入法,我想还是拼音吧:D)[博主注:理论分析一下,郑码没有五笔需要的末笔交叉识别码,字根规范得多,拆字速度比五笔快,这样打字速度比五笔慢是没有道理的。据我所知,现在郑码最高速度超过340字,而本文中所说的郑码最高速度240字,的确也是有依据的(见http://www.cn25.net/zm/showbbs.asp?bd=14&id=36&totable=1),不过那个是用郑码打繁体的速度。关于速度问题,郑码在正式比赛中,拿过多个第一,而五笔则只是在个别项目上得第二。参看:http://zm2000.blog.sohu.com/21259367.html]

但是,郑码具备有其它输入法无法替代的一个重要优势:在不改变编码规则和字根代码的前提下,可以方便地给10万汉字编码。也就是说,学会用《郑码》输入几千个常用汉字,用同一方法编码,还可以输入几万个中国的生僻汉字以及日本和韩国的汉字。有了郑码,我们可以轻易的完成中日韩三国的汉字录入工作,可以完成《说文解字》乃至《康熙字典》这样超大字符集汉字的录入,这一优势是其他输入法所不可比拟的。

1994 年末,三星公司受韩国政府委托,来中国大陆引进汉字输入法,以完成韩国训民中文系统和将超过5000万汉字的珍贵国宝《高丽大藏经》(其实这个大藏经也是高丽王朝在北宋年间从中国引入的)电子化的工作,中文信息学会向韩国推荐了十几种输入法。不久三星公司派来三位专家。在中文信息学会的配合下,马不停蹄地将这十几个“码”轮番考核、测试、筛选。经过严格测试和考核,公司高层领导最后决定,原来准备选三种“码”(输入法)的打算,现在决定只选一种就可以了,那就是郑码。韩国三星集团的理事长总结时候说:“《郑码》是1995年三星最成功的技术引进。”

郑码和windows的渊源
《郑码》经过一系列国家级的测试、鉴定、评审,都认为具有世界领先水平之后。这个经过千锤百炼的汉字编码系统可以定型推广了。郑易里建议接过他的接力棒的中易公司又瞄准了新的目标——曲线汉字库。因为,这是除了我们无力问津的操作系统以外的中文信息处理的另一个关键因素。

汉字库是中文信息处理的最终表现,因为大家看见的不是输入法,也不是操作系统;而是用精美的汉字打印出来的文章。电脑用汉字库的初级阶段是由各个“点”组成的汉字字形。称为用“点”来描述汉字。它不能无级放大、缩小,要像铅字一样大小分号,而且略大一些的点阵字、笔划边就像锯齿一样难看。当时通用的排版系统上的汉字库是中等技术级的矢量汉字库。即是用直线来描述汉字字形,直线部分自不必说,而曲线部分,是用许多折线来组成。这种汉字库,稍一放大,就会由于显出曲线部分的折线来,产生变形而无法使用。当中易公司要进入汉字库开发领域时,决心越过矢量汉字库,迎头赶上世界最先进的用曲线描叙汉字字型库的技术。当时世界上只有美国 2—3 个公司有这种用曲线描叙西文的技术,而用曲线描述汉字要比西文庞大复杂的多。公司利用世界上已公开的曲线描述字形的很少资料,组织软件工程师们向曲线字库的纵深领域进攻,同时聘请国内最权威的字模专家做字形的技术总监,并和中国标准技术开发公司专门开发国家标准点阵字库部门合作,一场向世界最高水平,符合国际曲线标准汉字字模的战役全面展开!

做曲线汉字字模是一件周期长、技术水平很高、风险大、资金投入大的项目。中易公司已连续创业4年,基本上都在完善《郑码》而没有什么收入。当为寻求开发曲线汉字库的资金,向一些大电脑公司寻求合作时,他们却认为符合国际标准的 20902 个汉字的曲线汉字库的应用时机还很遥远。现在就投入大量资金开发风险太大,怕得不偿失,于是都婉言谢绝。

但是中易公司认为,在信息时代,技术的更新,不是逐步到来的,而是像三级跳跳来的。我们是中国人,不但要在汉字输入法方面世界领先,在汉字库的技术领域,也要领先,才不愧对发明汉字颇讲书法艺术的老祖宗!

事情果然像预料的那样,1994 年初,世界最大的美国微软公司把刚刚诞生才几个月的 Windows3.2 中文版就准备抛开,全力开发 32 位操作系统的 Windows 95 中文版。包括中、日、韩三国的 20902 个汉字的国际标准。美国微软的工程师很快来北京调查,谁家有这 20902 个国际标准的汉字库?哪个输入法能支持(检索)这 20902 个汉字?他们马上找到了中易公司,他们在了解《郑码》能不能支持(检索)20902个国际标准汉字时,中易公司给他们演示的却是当时世界最大的国家6万电脑大汉字库的输入(检索)。他们看到《郑码》只用4键就能迅速准确地输入 6 万汉字时,惊讶之极,难以言表。即然6万字都这么干净、利索地输入,20902 个汉字还在话下吗。再问到谁家有这 20902 个曲线汉字库时,中易公司轻松地将打印好的全套样本展现在他们眼前。以后的半个月,他们曾4次派不同级别的工程师和管理专家来中易公司咨询考查,确认一切完备无误后,要了样品才满意离去。

从这以后,随着Windows中文版的推广,《郑码》和中易字库一起进入了千万中文用户的电脑中。

Leave a Reply

Your email address will not be published. Required fields are marked *