仓颉输入法

维基教科书,自由的教学读本
跳到导航 跳到搜索
  仓颉输入法
仓颉字母与键位 
Wikipedia-logo.png
维基百科中的相关条目:

仓颉输入法的特色[编辑]

仓颉输入法原名为形意检字法,是最早的电脑中文输入法,由朱邦复在1976年发明,属于形码输入法

时至今日,电脑上的中文输入法已达一百多种,各有不同的长处和缺点。有的易学但效率不佳;有的效率好,但难学;有的商业输入法宣称自己易学又快速,但需要付费且不易安装,也不排除入门者感到凌乱难学。一般人不认为仓颉输入法十分易学,主因是规则略较另一些输入法复杂,且仓颉输入法有若干版本,教材种类也多,不易选择。有些入门者选到较差的教材,耗费时间去死记硬背,往往会倍感艰涩难懂;但只要有良好的教材和足够的练习,入门门槛可大大降低。

仓颉输入法的最大优势是普及。由于仓颉输入法发明得早,且发明人公开放弃专利权,因此今日几乎所有电脑、手机、甚至电子辞典及其他小型机器,都内建了仓颉输入法,不必担心学了英雄无用武之地。相较之下,非内建输入法就有很多问题:商业输入法须付费购买,且往往只能安装在一台或少数机器上。有些输入法可在网络上免费下载试用版或完整版,但可能因未支援特定平台、公司限制员工上网、插随身碟、安装程式等因素无法使用。即使可以,使用者也往往必须自备安装程式,相较内建输入法不便甚多。

仓颉输入法发明的最初目的是汉字检索,对许多形近汉字有极佳的区辨能力。若不计算特别设计的简快码,仓颉输入法的重码率为所有中文输入法中最低[1]。就一般输入场合而言,重码率代表绝大多数汉字都可直接输入,不用频繁看屏幕选字,容易“盲打”,可减少眼睛负担,也令输入效率提升。

仓颉输入法的字根数量少,只有百余个。撇除笔画类和只取首尾类的形码输入法,仓颉输入法是字根数量最少的。而且字根与字根之间都由形状特征联系,不用死记。这是因为在研制之时,发明人已有意识地控制字根数量、梳理字根特征关系,以减轻记忆负担。至于仓颉输入法的取码规则,尽管比另一些输入法略为复杂,却有效反映汉字的特点,对不同汉字都一视同仁,因此也比另一些输入法客观,只要明白了原理,就能一理通百理明,毋须背诵任何字的编码;只要熟悉取码规则,绝大多数汉字的取码都没有争议。

仓颉输入法支援的字库极大,能输入几乎所有系统能呈现的汉字,因此许多古文、汉字研究者使用此输入法,不少大字集数据库或研究专案也使用仓颉码作为检字工具,例如台湾的中文全字库(CNS11643)及汉字构形数据库。

有些输入法会利用一些特别手段,例如把规则简化、设置智慧选字选词、设置大量容错码或特别设计的简快码,以求容易上手,减少选字,提升输入效率。这些手段在某些特定场合可能挺有用,但也有相应的代价,比如:令重码率升高、需要时间让系统学习使用者的输入习惯、需要特别背诵学习简快码等。而这些功能,多半是针对现代白话文及常用字设计,对常用文言文、罕用字的人来说,效益就比较有限,反而常受高重码率影响,而不如传统仓颉输入法方便。

除此之外,市面上也有一些衍生自仓颉的输入法可用于特定场合。例如许多系统内建的“速成输入法”即是只取头尾码的仓颉输入法,在容易上手及输入效率上比较折衷;又如商业的“大新仓颉输入法”简化了传统仓颉输入法的规则且设计了大量的简快码,熟练者能每分钟输入238字,创下了台湾公开中文打字比赛中的最快纪录。有些使用者会在平时利用这些衍生输入法提升效率,而在特殊需要时转换到传统仓颉。

由于仓颉输入法开发甚早又甚为普及,有些竞争的形码输入法往往以攻击仓颉输入法作文宣,主观地丑化一些仓颉输入法的特点。例如攻击仓颉输入法不依书写的笔顺取码、取码时同一笔画可以剪开,是“违反汉字逻辑”。可是,笔顺往往因人、因地区、因时间而异,是主观的;仓颉输入法直接根据字形取码,是客观的。而字典的部首归部、文字学者分析构形字理,也一样会把笔画剪开和不依笔顺。可是这些批评者本身并没有好好了解汉字逻辑,对仓颉输入法的批评不公允。更有输入法的文宣无凭据攻击仓颉输入法难学、难记,但该输入法自己的字根却复杂繁琐,取码规则也自相矛盾。学习者在挑选输入法时,不应受这些失实文宣误导,应该用雪亮的眼睛分辨清楚。

本教科书的特色[编辑]

至今市面上已有大量介绍仓颉输入法的网站和书籍,为什么还要写这本教科书?本教科书的特点如下:

一、本教科书比照维基教科书之内容采自由授权,任何人皆可在创用CC 署名-相同方式共享 3.0协议授权下自由引用、复制、甚或改作本教科书的内容。

二、本教科书整合了各家教材之所长,并厘清各家理论的矛盾之处,也尽可能附上客观资料来源供后人查考。

三、大多数仓颉输入法教学不重视版本差异,本教科书则同时介绍最通行的“三代仓颉”(应用于“倚天”、“国乔”、“微软Windows”等系统)、“五代仓颉”及其他重要版本的取码规则,并仔细厘清各版本之间的编码差异。

四、由于历史因素,仓颉输入法易因取码字体差异、编码讹误等问题造成实际使用时的困惑,但大多数仓颉输入法教学不会提及这些问题。本教科书将于〈特别注意〉一章详细探讨这些问题。

五、即使已学会了各种规则,有些常用及罕用汉字在实际取码输入时仍易造成困惑。本教科书将于〈进阶知识及难拆字辨析〉一章介绍这类议题。

仓颉输入法版本简介[编辑]

仓颉输入法源远流长,版本众多,按发明人朱邦复提出时间,大略有以下版本:

  • 一代:1977年朱邦复在台湾发表第一代仓颉,根据一万二千字的《国语辞典》所设计。
  • 二代:1980年朱邦复发表第二代仓颉,仅将第一代仓颉略作调整。
  • 三代:1982年朱邦复发表第三代仓颉,自《康熙字典》选取四万字取码,并改良第二代的部分取码规则。
  • 四代:1985年朱邦复在美国发表第四代仓颉。
  • 五代
    • 1987年版:1987年朱邦复返中国深圳科技园,任两仪文化科技公司总经理,发表聚珍大字库及第五代仓颉输入法。1990年朱邦复书就《第五代仓颉输入法手册》并先后交由数个出版社出版。当时为因应通行的内码系统,将简体及繁体字分开编码推行,分别收一万余字及六千余字。
    • 1999年版:1999年5月《第五代仓颉输入法手册》由香港文化传信再版,内容与1990年版稍有不同,此版即该手册描述之内容。此版主要根据中国大陆的国标扩展码将繁简字统一编码,收二万余字,并与香港及马来西亚“仓颉之友”网站合作推行,但实际推出的输入法仍是分为繁体版及简体版。
    • 2003年版:朱邦复工作室推出“汉文库典”,以改版的五代仓颉码为检字依据。此版将繁简汉字统一编码,收录六万余字,并修改部分辅助字形及编码[2],后于2006年博硕文化出版了更新的《第五代仓颉输入法手册》。由于合作网站未完全跟进[3],目前很难见到完全采用此版规则的仓颉输入法。
  • 六代:2001年朱邦复将此版本更名为“苍颉检字法”,并据之发表中文电书规格及中文芯片。苍颉检字法未曾公开,仅供合作者使用,直至2013年才将部分资料释出予仓颉输入法爱好者,俗称“第六代仓颉输入法”。

目前最通行的仓颉输入法版本为第三代1999年版第五代。采用第三代仓颉输入法的主要有微软仓颉[4]仓颉之友·马来西亚发行的仓颉输入法、及一些改良版仓颉输入法(如自由仓颉、快速仓颉、大新仓颉等)。第五代仓颉输入法主要有仓颉之友·马来西亚发行的仓颉输入法、Linux内建输入法平台提供的仓颉输入法等。苹果电脑内建的仓颉输入法混合了第三代和第五代。

许多电脑或行动版输入法平台可套用不同输入法表格切换为不同输入法,其中多半有内建第三代或第五代仓颉输入法的选项,例如Google在Android系统使用的智慧键盘Gboard。一些民间开发的改良版仓颉输入法则是采三代、五代、或混合编码,具体可参照其说明文件。

本教科书主要根据朱邦复所著之《第五代仓颉输入法手册》(简称五代手册)、《仓颉第三代中文字母输入法》(简称三代手册)为主要架构介绍相关规则,有版本差异或与原著差异较大之部分则另行附注。

仓颉输入法取码概要[编辑]

如果说笔顺输入法像执笔写字,仓颉输入法就像用剪刀把汉字剪开[5]。要为汉字取码,首先凭视觉(而非字义或笔顺)观察汉字能否分割,无法分割的是整体字;可分割的则把汉字分割成字首字身,字首为最左、最上、最外部分,剩余部分为字身。字身若可再分割,则再分割为次字首次字身。各部分再分别根据字形取出有限个字码,而后按下空白键输出。

一个汉字最少用一码输入,最长五码。例如:

汉字 分割 取码 演示
串(限取 4 码) 中中(Cjrm-l0.svgCjrm-l0.svg;LL)    
鱼 . 里(限取 2 . 3 码) 弓火田土(Cjrm-n4.svgCjrm-f2.svg.Cjrm-w0.svgCjrm-g0.svg;NFWG)  
艹 . 女 . 古(限取 2 . 1 . 2 码) 廿女十口(Cjrm-t5.svg.Cjrm-v1.svg.Cjrm-j0.svgCjrm-r0.svg;TVJR) 廿 
木 . 五 . 口(限取 2 . 2 . 1 码) 木一一口 (Cjrm-d1.svg.Cjrm-m0.svgCjrm-m0.svg.Cjrm-r0.svg;DMMR)  

本教科书会就汉字的分割方法、取码原则、例外字及其他要注意的地方,逐章说明。

教科书目录[编辑]

  1. 仓颉字母与键位
  2. 辅助字形
  3. 汉字分割
  4. 基本取码
  5. 取码原则
  6. 例外字
  7. 特别注意
  8. 进阶知识
  9. 版本差异
  10. 相关资源

附注[编辑]

  1. 据输入法研究者泰瑞的统计[1][2],在Big5码字集的13053个汉字中,三代仓颉重码字组有500个,重码字有1034字,重码字比率为7.92%。五代仓颉重码字组有504个,重码字有1046字,重码字比率为8.01%。如果把取样汉字范围收窄或扩大,仓颉输入法仍有杰出的表现。例如以Big5码常用字区的5401字作取样范围,三代仓颉重码字有434个,重码率为8.04%。这数值低于统计中的其他输入法,甚至大胜一些自称选字选率低的输入法。
  2. 第五代仓颉码表说明
  3. 如马来西亚仓颉之友的程式便未完全采用2003年版的编码。[3]
  4. 微软早期与朱邦复合作开发微软中文视窗系统3.0,采用仓颉系统,但之后合作关系破裂,微软之后的Windows版本改采其他汉字编码系统,并自行更新仓颉输入法编码,用于Windows系统上的仓颉、新仓颉、速成输入法,通称“微软仓颉”,其编码规则大抵依照第三代仓颉,但常用字以外的内容混合了第四代仓颉及以后的编码。
  5. 仓颉输入法发明者朱邦复,在研发过程中,就买了多本字典,用剪刀把汉字剪碎。


  仓颉输入法
仓颉字母与键位