仓颉输入法
◄ | 仓颉输入法 |
► | 仓颉字母与键位 |
特色
仓颉输入法原名形意检字法,是最早的电脑中文输入法,由朱邦复在1976年发明,属于形码输入法。
时至今日,电脑上的中文输入法已达一百多种,各有不同的长处和缺点。有的易学但效率差;有的效率好但难学;有的商业输入法自称易学又快速,但需要付费且安装、使用不便,即使如此尚有入门者抱怨凌乱难学。仓颉输入法并非公认易学的输入法,主因是规则多,且仓颉输入法版本多、教材种类也多,不易选择。但我们相信只要有良好的教材和足够的练习,入门门槛可大大降低。
仓颉输入法的最大优势是普及。由于仓颉输入法发明得早,且发明人公开放弃专利权,今日几乎所有电脑、手机、甚至电子辞典及其他小型机器,都内建仓颉输入法,不必担心学了英雄无用武之地。相较之下,非内建输入法就有很多问题:商业输入法须付费购买,且往往只能安装在一台或少数机器上。有些输入法可在网上免费下载试用版或完整版,但可能因未支援特定平台、公司限制员工上网、插随身碟、安装程式等因素无法使用。即使可以,使用者也往往必须自备安装程式,相较内建输入法不便甚多。
发明仓颉输入法的最初目的是检索汉字,对许多形近汉字有极佳的区辨能力。若不计算特别设计的简快码,仓颉输入法的重码率为主流中文输入法中最低[1][2]。就一般输入场合而言,重码率低意味着选字率低,选字率低就容易“盲打”,不用频繁看屏幕选字,可减少眼睛负担,也在某种程度上提升了输入效率。
也因自始至终就着眼于检索汉字,仓颉输入法支援的字库极大,大部分罕用字皆能比照一般规则取码,是许多古文、汉字研究者的首选中文输入法,一些大字集数据库或研究专案也使用仓颉码作为检字工具,例如Unihan数据库、中文全字库(CNS11643中文标准交换码)、及汉字构形数据库。
有些输入法会利用简化的规则、智慧选字选词、大量的容错码、或特别设计的简快码以求容易上手、减少选字、及提升输入效率。这些做法在特定场合有其价值,但也有相应的代价,例如重码率上升、需要时间让系统学习使用者的输入习惯、需要特别背诵学习简快码等。此外这些功能多是针对现代白话文及常用字设计,对常用文言文、罕用字的人而言效益亦较有限。
市面上还有一些衍生自仓颉的输入法可用于特定场合,如许多系统内建的“速成输入法”即是只取头尾码的仓颉输入法,在容易上手及输入效率比较折衷;又如商业的“大新仓颉输入法”简化了传统仓颉输入法的规则且设计了大量的简快码,熟练者能每分钟输入238字,创下了台湾公开中文打字比赛中的最快纪录。平时利用这些衍生输入法提升效率,而在特殊需要时转换到传统仓颉,也是可考虑的选择。
本书特色
至今市面上已有大量介绍仓颉输入法的网站和书籍,为什么还要写这本教科书?本教科书的特点如下:
一、本教科书比照维基教科书之内容采自由授权,任何人皆可在创用CC 署名-相同方式共享 3.0协议授权下自由引用、复制、甚或改作本教科书的内容。
二、本教科书整合了各家教材之所长,并厘清各家理论的矛盾之处,也尽可能附上客观资料来源供后人查考。
三、大多数仓颉输入法教学不重视版本差异,本教科书则同时介绍最通行的“三代仓颉”(应用于“倚天”、“国乔”、“微软Windows”等系统)、“五代仓颉”及其他重要版本的取码规则,并仔细厘清各版本之间的编码差异。
四、由于历史因素,仓颉输入法易因取码字体差异、编码讹误等问题造成实际使用时的困惑,但大多数仓颉输入法教学不会提及这些问题。本教科书将于〈特别注意〉一章详细探讨这些问题。
版本简介
仓颉输入法源远流长,版本众多,按发明人朱邦复提出时间,大略有以下版本:
- 一代:1977年朱邦复在台湾发表第一代仓颉,根据一万二千字的《国语辞典》所设计。
- 二代:1980年朱邦复发表第二代仓颉,仅将第一代仓颉略作调整。
- 三代:1982年朱邦复发表第三代仓颉,自《康熙字典》选取四万字取码,并改良第二代的部分取码规则。
- 四代:1985年朱邦复在美国发表第四代仓颉。
- 五代:
- 1987年版:1987年朱邦复返中国深圳科技园,任两仪文化科技公司总经理,发表聚珍大字库及第五代仓颉输入法。1990年朱邦复书就《第五代仓颉输入法手册》并先后交由数个出版社出版。当时为因应通行的内码系统,将简体及繁体字分开编码推行,分别收一万余字及六千余字。
- 1999年版:1999年5月《第五代仓颉输入法手册》由香港文化传信再版,内容与1990年版稍有不同,此版即该手册描述之内容。此版主要根据中国大陆的国标扩展码将繁简字统一编码,收二万余字,并与香港及马来西亚“仓颉之友”网站合作推行,但实际推出的输入法仍是分为繁体版及简体版。
- 2003年版:朱邦复工作室推出“汉文库典”,以改版的五代仓颉码为检字依据。此版将繁简汉字统一编码,收录六万余字,并修改部分辅助字形及编码[3],后于2006年博硕文化出版了更新的《第五代仓颉输入法手册》。由于合作网站未完全跟进[4],目前很难见到完全采用此版规则的仓颉输入法。
- 六代:2001年朱邦复将此版本更名为“苍颉检字法”,并据之发表中文电书规格及中文芯片。苍颉检字法未曾公开,仅供合作者使用,直至2013年才将部分资料释出予仓颉输入法爱好者,俗称“第六代仓颉输入法”。
目前最通行的仓颉输入法版本为第三代及1999年版第五代。采用第三代仓颉输入法的主要有微软仓颉[5]、仓颉之友·马来西亚发行的仓颉输入法、及一些改良版仓颉输入法(如自由仓颉、快速仓颉、大新仓颉等)。第五代仓颉输入法主要有仓颉之友·马来西亚发行的仓颉输入法、Linux内建输入法平台提供的仓颉输入法等。苹果电脑内建的仓颉输入法混合了第三代和第五代。
许多电脑或行动版输入法平台可套用不同输入法表格切换为不同输入法,其中多半有内建第三代或第五代仓颉输入法的选项,例如Google在Android系统使用的智慧键盘Gboard。一些民间开发的改良版仓颉输入法则是采三代、五代、或混合编码,具体可参照其说明文件。
本教科书主要根据发明人朱邦复及主要助手沈红莲之说法(简称“官方说法”)为主要架构介绍相关规则,其中主要参考发明人的著作《第五代仓颉输入法手册》(简称五代手册)、《仓颉第三代中文字母输入法》(简称三代手册)、以及朱邦复工作室公开发表过的资料。官方说法不够详细或有争议者,再参酌其他客观资料(如官方实际取码字例)微调或补充,并另行附注。
取码概要
如果说笔顺输入法像执笔写字,仓颉输入法就像用剪刀把汉字剪开。要为汉字取码,首先凭视觉(而非字义或笔顺)观察汉字能否分割,无法分割的是整体字;可分割的则把汉字分割成字首及字身,字首为最左、最上、最外部分,剩余部分为字身。字身若可再分割,则再分割为次字首和次字身。各部分再分别根据字形取出有限个字码,而后按下空白键输出。
一汉字最少用一码输入,最多五码,如:
汉字 分割 取码 演示 串 串(最多取四码) 中中(;LL) 串中中 鯉 .(最多取二.三码) 弓火田土(.;NFWG) 鯉弓火田土 菇 ..(最多取二.一.二码) 廿女十口(..;TVJR) 菇廿女十口 梧 ..(最多取二.二.一码) 木一一口(..;DMMR) 梧木一一口
本教科书会就汉字的分割方法、取码原则、例外字及其他要注意的地方,逐章说明。
教科书目录
附注
- ↑ 据输入法研究者泰瑞统计[1][2],大五码字集的13053汉字中,三代仓颉有500组重码字,有1034字重码,重码字比率为7.92%;五代仓颉有504组重码字,有1046字重码,重码字比率为8.01%。如果把取样汉字范围收窄或扩大,仓颉输入法仍有杰出表现。如以大五码常用字区的5401字作取样范围,三代仓颉有434字重码,重码率为8.04%,数值低于统计中的其他输入法,甚至大胜一些自称选字选率低的输入法。
- ↑ 据统计,徐码输入法重码率较仓颉输入法略低[3],唯徐码输入法普及率较低,尚未成为主流输入法。
- ↑ 见第五代仓颉码表说明
- ↑ 如马来西亚仓颉之友的程式便未完全采用2003年版的编码。[4]
- ↑ 微软早期与朱邦复合作开发微软中文视窗系统3.0,采用仓颉系统,但之后合作关系破裂,微软之后的Windows版本改采其他汉字编码系统,并自行更新仓颉输入法编码,用于Windows系统上的仓颉、新仓颉、速成输入法,通称“微软仓颉”,其编码规则大抵依照第三代仓颉,但常用字以外的内容混合了第四代仓颉及以后的编码。
◄ | 仓颉输入法 |
► | 仓颉字母与键位 |