汉字输入法的不完全发展史 [打字系列Vol.6]
最后更新于
最后更新于
这是与文字输入相关的第六篇文章,追寻一下汉字输入发展的足迹
输入法的问题,对于英文来说似乎很好解决:只需要有26个按键就足够。然而汉字数量上万,常用上千,操作一个有成千上万按键的输入设备应该没人喜欢。汉字输入融入现代科技的道路上,有怎样的轶事?
解决汉字输入的方法核心在于组合,人们根据读音与笔画设计了不同的组合,使得快速输入中文成为可能。
表音符号与表意符号
打字机时代
拼音,以及智能输入
硬核时刻:双拼输入法
为了方便理解英文和汉语有什么根本区别,我们简单涉猎一下语言学的概念:表音文字和表意文字。根据字面意思,前者每一个文字可以代表一种读音,写出文字之后,也就知道了其发音;后者文字则具有语义表示,写出文字后,可以推出其意义。
英语属于表音文字:一个单词papaya,即使不知道意思你也可以读出一二;汉语的表意作用在不断的改变下已经不太存在,但早期汉字是由表意的象形文字进化而来的:即使不知道读音,其意也能被猜得八九不离十:
表音文字基本上都会有一个字母表,包含几十个字母,通过组合来表示各种读音,因此设计输入法只需要考虑到这些字母的输入就好了;然而表意文字很难用几十个文字表达所有意思,所以其文字数量很大。如果照搬表音文字的输入,简直灾难。
打字机时代算是文字输入法的启蒙期,其在印刷方面的便捷性让许多国人开始设计能够输入汉字的打字机。抛去“方便”二字,我们的祖宗其实就有答案:活字印刷术——也就是把每个汉字刻在可拆换的模子上,需要哪个就用哪个模子。一个非常简单且出人意料流行的中文打字方式,和这个思路差不多:把常用汉字刻在模子,平铺在机器上,用操杆按下对应的字块 [1]:
尽管难用,专业的打字员还是可以达到1秒一个汉字的速度!其原因在于,这些字块是根据用词频率排布的,常用词句的文字往往距离比较近。
这样打字很不OK!其实仔细思考,每一个汉字也不一定是一个独立不可分割的元素,如果我们能找到一些关键的笔画,设计如同英文一样组合输入也不是天方夜谭。这时候,一位大家都熟悉的人,站出来了,他叫林语堂。
林语堂不仅是大文学家,他还发明了一款中文打字机,而且为了研发几乎花掉了自己所有的家当。林语堂的发明是一款叫做“明快”的打字机,其输入的方式与当今的笔画输入法非常相似。
明快的输入法大致是这样:林语堂将汉字拆分成了不同的部首组合,其键盘包括72个键位:上排下排共64个部首键,以及8个数字键。打字时先按上排部首,然后按下排部首,机器会通过一个叫做“魔术眼”的东西(个人猜是一块玻璃)给出八个可能的候选字;再按下数字键选择对应的文字。
后续有许多人都类似地设计了以部首来编码汉字的方式,这种编码一直延续到如今的输入法,例如五笔,郑码,笔画输入法。然而,正如今天使用笔画输入法的不多一样,这种方法因为需要记忆,其普及度并不如舒式打字机。在成千字块中寻找文字的方式,从新中国打印宣传画报开始,一直延续到上世纪八十年代。
早在1552年,意大利传教士利玛窦和罗明坚就完成过一本《葡汉词典》,尝试用拉丁语为汉字注音 [4]。然而我们如今使用的汉语拼音,则是在1950年代,由一群语言学家在各种注音系统(例如赵元任和林语堂!设计的国语罗马字系统)基础之上完善的。
由于国家大力推广拼音学习,许多人在学习打字的时候自然会图方便采用拼音输入法。然而使用过拼音输入法的长辈们都知道,早期的输入法,例如智能ABC,只可以一次打出一个字或者一个词,由于一个拼音组合往往会有许多对应的汉字,用户需要花很多时间在选字上,输入效率可以说是龟速。
转机出现在一些输入法开始引入“个性化”的功能(例如当初的紫光拼音):当用户输入了一个词库中不存在的单词后(例如人名),输入法会记住这个单词,并且将其加入到候选词中去。这样一来,输入法用得越久,词库就越符合用户的语言习惯。
更大的转机大家就比较熟悉了,搜狗推出了“云输入”:传统的输入法只会在本地的词库进行查找,搜狗则在用户联网情况下将输入发送到服务器进行查找。由于服务器可以容纳海量的词库数据,这种“联网输入”的方式自然要更加准确。如今几款大牌输入法几乎都使用了“云输入”的模式。
这里是硬核一点的知识,面向想要进一步了解的同学们:)
在这里隆重推荐一下我使用的双拼输入法!双拼是一种建立在拼音基础上的编码方式,但是它的优点在于,任何汉字都只由两个字母组合而成,所以用熟练之后,会比普通拼音按键更少一些。一般来讲,一个汉字的拼音由声母和韵母构成,例如“棒”的声母为 b,韵母是 ang,所以打字的时候分两步:先按下声母,再按下韵母。
双拼的原理,就是把26个字母对应到了不同声母和韵母的组合。通过“先按声母,后按韵母”的规律,让不会被按到的键位表示特定组合。例如打声母的时,用v表示zh,用u表示sh;打韵母时,用g表示eng,用h表示ang… 所以“棒”就变成了bh(由于没有汉字的韵母部是h,所以就用h来表示一个韵母组合),其核心就是“废物利用”。
这里给大家贴一个我用的小鹤双拼方案,死记硬背三周强迫自己用双拼就可以起飞了(狗头
汉字输入法的发展远远不止本文提到的这些方面,但从这篇文章你应该对于人们在其中花费的心血,以及表现出的创造力有了一定认识。作为人类创造的产物,文字具有无穷的魅力。如果你能在今后打字的过程中想到林语堂先生或者我,这篇文章的目的就达到了(狗头。
本文引用: [1] Thomas S. Mullaney: The Chinese Typewriter: A history, 2017 [2] https://maoeraobjects.ac.uk/sources/shu-zhendong-typewriter/ [3] http://hasts.mit.edu/2013/12/19/liveblog-qwerty-is-dead-long-live-qwerty-the-birth-of-input-in-twentieth-century-china/ [4] https://zh.wikipedia.org/wiki/双拼