仓颉输入法/例外字

维基教科书,自由的教学读本
跳到导航 跳到搜索
 取码原则 仓颉输入法
例外字
特别注意 

95%以上的中文字,都可依据前述原则取码,其余约5%的字,若按同样规则取码,本来亦无不可,但顾及使用方便,特将一些字形做例外处理,这些字称做“例外字”,包括:[1]

  1. 复合字首:做字首或次字首时,视为一整体,只取头、尾两码。
  2. 复合字:一律视为一整体,只取头、尾两码。
  3. 难字:可用“难”码代替难取的部分。
  4. 特殊字:被其他部件横贯时,先取特殊字,再取重叠于上的部件,并且可与骨干的中竖重复。

注意以下例外字均已举全,不可凭个人主观自订例外字,否则会取不到正确字码。[2]

复合字首[编辑]

“复合字首”(或称“特别字首”)在做“字首”或“次字首”时,视为一整体,只取头、尾两码[3][4]

复合字首列表
版本 复合字首 图解 取码 字例 补充说明
三五 Cjhm-on.svg Cjhm-on-color.svg 人弓 人弓.火木)、人戈.人弓
三五 Cjhm-sm.svg Cjhm-sm-color.svg 尸一 尸一.中)、尸一.木竹水
三五 Cjhm-ic.svg Cjhm-ic-color.svg 戈金 戈金.女戈)、戈金.一口 按台湾标准字形,“”等字的字首应为“戈金”而非“戈木”,但微软仓颉采后者编码,详参〈特别注意〉一节。
三五 Cjhm-id.svg Cjhm-id-color.svg 戈木 戈木.竹戈)、戈木.一口
三五 Cjhm-mk.svg Cjhm-mk-color.svg 一大 一大.土)、一大.一田中
三五 Cjhm-mv.svg Cjhm-mv-color.svg 一女 一女.中一戈)、一女.木戈
三五 Cjhm-mf.svg Cjhm-mf-color.svg 一火 一火.心 五代手册未列此复合字首。[4]
三五 Cjh3m-mo.svg Cjh3m-mo-color.svg 一人 一人.竹日火 五代手册未列此复合字首。[4]
三  Cjh3m-md2.svg Cjh3m-md2-color.svg 一木 一木.卜中一)、一木.山戈戈 五代:一.木木.一)、一.木木.戈
三  Cjh3m-md.svg Cjh3m-md-color.svg 一木 一木.卜中一)、一木.日 五代:一.竹木.一)、一.竹木.日
三  Cjh3m-mf.svg Cjh3m-mf-color.svg 一火 一火.月山金 五代:一.人火.金
三  Cjh3m-mg.svg Cjh3m-mg-color.svg 一土 一土.月山金 五代:一.人土.金
三  Cjh3m-ig.svg Cjh3m-ig-color.svg 戈土 戈土.心)、戈土.竹日火 五代:戈.人土.心)、戈.人土.火
三  Cjh3m-ii.svg Cjh3m-ii-color.svg 戈戈 戈戈.人月人)、戈戈.火 五代:戈.人戈.月)、戈.人戈.火
 五 Cjh5m-or.svg Cjh5m-or-color.svg 人口 人口.手)、人口.月廿 三代:人.一.口手)、人.一.口廿
 五 Cjh5m-tj.svg Cjh5m-tj-color.svg 廿十 廿十.弓木)、廿十.口卜人 三代:廿.竹十.木)、廿.竹十.人

复合字首单独使用,或用做“字身”、“次字身”时,则依一般方式取码。例如:

戈.十金.金),廿.戈.十金),女.戈.十金);
一.日月.大),心.一.日大),手.一.日大);
一.一.一女),十.一.一女),女.一.一女);
人.一.弓),水.人.一弓),廿.人.一弓);
尸一.尸戈一),十水.尸一.一),竹尸.尸一.一)。
戈.人.木戈),人.戈.人戈),月.戈.人戈);
人.一.口),水.人.一口),竹.人.一口);
廿.竹口.十),𡤏女.廿.竹十),𨇨口一.廿.竹十)。

许多复合字首在书写时会视为整体形块。例如“愿”、“壓”、“辱”等字,有时作撇笔一撇到底,包住下方部件,有时则较短,使两字能上下切开,把它们定义作复合字首可避免字首应该取“厂”或取“原”、“厌”、“辰”的疑惑

另一些复合字首是为了减少重码。例如若不把“麻”定义作复合字首,“麻”部字得取“戈.十金.(尾码)”或“戈.木木.(尾码)”,许多字形只靠一个尾码便难以区分,会产生大量重码。同理“羽”、“气”、“薛”、“合”等皆有此作用。

复合字[编辑]

“复合字”不论是单独使用或与其他字形组合使用,一律只取其头、尾两码[5]

复合字列表
版本 复合字 图解 取码 字例 补充说明
三五 Cjcm-an.svg Cjcm-an-color.svg 日弓 日弓.口)、人.日弓
三五 Cjcm-ln.svg Cjcm-ln-color.svg 中弓 中弓.卜中月)、中弓.竹難山
三五 Cjcm-nl.svg Cjcm-nl-color.svg 弓中 弓中.人一木)、弓廿.弓中
三五 Cjcm-og.svg Cjcm-og-color.svg 人土 大戈.人土)、女火.人土 当中可以被其他成分夹杂,比如)。
三五 Cjcm-vi.svg Cjcm-vi-color.svg 女戈 女戈)、女戈竹戈 ”从“𢆶”从“戍”,因此下方亦按“戍”字取码,尾部分取“竹戈”不取“人”。
三五 Cjcm-yp.svg Cjcm-yp-color.svg 卜心 卜心.竹山)、卜心.尸一
三  Cjc3m-hi.svg Cjc3m-hi-color.svg 竹戈 土.竹戈)、廿.竹戈)、竹戈.十木 五代:竹山.戈)、土.竹山.戈)、廿.竹山.戈)、竹戈.十木
三  Cjc3m-yr.svg Cjc3m-yr-color.svg 卜口 卜口.月.月弓)、卜口.月.廿弓
 五 Cjc5m-ls.svg Cjc5m-ls-color.svg 中尸 中尸.日)、人.中尸 1987年版五代加入,1999年版移除。
无定义时:中戈尸)、人.中戈尸)。
 五 Cjc5m-yn.svg Cjc5m-yn-color.svg 卜弓 卜弓.月山金)、卜弓.廿手

难字[编辑]

有些字的部分形状过于琐碎,导致拆码繁琐。为了方便取码,特别规定了一些“难字”,以“难(X)”码代替难取部分。以下是难字列表:

  • 1.“头、难、尾”类:头、尾码好取,其余难取。
难字列表
难字 图解 取码 字例
Cjxm-hxh.svg Cjxm-hxh-color.svg 竹难竹 弓火.竹難竹)、金.竹難竹
Cjxm-ixe.svg Cjxm-ixe-color.svg 戈难水 木.戈難水)、廿手.戈難水
Cjxm-ixf.svg Cjxm-ixf-color.svg 戈难火 廿.戈難火)、廿十.戈難火
Cjxm-ixp.svg Cjxm-ixp-color.svg 戈难心 木木.戈難心)、戈心.土
Cjxm-lxh.svg Cjxm-lxh-color.svg 中难竹 女.中難竹)、竹.中難竹
Cjxm-lxl.svg Cjxm-lxl-color.svg 中难中 水.中難中)、女.中難中
Cjxm-txc2.svg Cjxm-txc2-color.svg 廿难金 月金.廿難金)、廿.廿難金
Cjxm-rxu.svg Cjxm-rxu-color.svg 口难山 女火.口難山)、土大.口難山
Cjxm-nxu.svg Cjxm-nxu-color.svg 弓难山 中弓.弓難山)、竹木.弓難山
Cjxm-hxu.svg Cjxm-hxu-color.svg 竹难山 竹難山)、𤒅火.竹難山
  • 2.“头、难”类:仅有头码好取
难字列表
难字 图解 取码 字例
Cjxm-hx.svg Cjxm-hx-color.svg 竹难 竹難竹山)、人.竹難山)、竹難人
Cjxm-hx2.svg Cjxm-hx2-color.svg 竹难 竹難中水)、竹難.月廿
Cjxm-hx3.svg Cjxm-hx3-color.svg 竹难 竹月.弓木)、竹月.一金.竹
Cjxm-hx4.svg Cjxm-hx4-color.svg 竹难 竹難卜金)、竹難月金)、輿竹難十金
Cjxm-lx.svg Cjxm-lx-color.svg 中难 廿.中難)、金.中難
Cjxm-nx.svg Cjxm-nx-color.svg 弓难
Cjxm-vx.svg Cjxm-vx-color.svg 女难
Cjxm-yx.svg Cjxm-yx-color.svg 卜难 水.卜難)、卜難火

特殊字[编辑]

有部件重叠在以下几种字形的中间时,规定先取特殊字,再取重叠于上的部件,并且可与骨干的中竖重复。[6]

特殊字列表
版本 特殊字 字例
三五 Cjsm-d.svg 木十)、木月)、木中)、木人人)、木田)、木田火)、竹木中)、竹木中心
三五 Cjsm-f.svgCjsm-f2.svg 火金.月)、火手.手
三五 Cjsm-i.svg 戈大.口.一)、金.戈手)、线女一.戈十
三五 Cjsm-k.svg 大大大大)、大一日日)、大弓)、大人人
三五 Cjsm-p.svgCjsm-p2.svg 心山[6]

注意特殊字的一些特性:

  • 重叠在特殊字上的字形可以计入中竖,且计入中竖的取码方式通常更符合字形特征原则而优先采用。例如“”字视为“”重叠在“”上,而非“”或“”重叠在“”上。
  • 特殊字只在内部允许重叠。例如若“”取码作“大月”(Cjrm-k0.svgCjrm-b8.svg),则并非使用特殊字,而是试图跨越取码(但实际上此字不符合跨越取码的条件,而取码作“中月大”),因为“Cjrm-b8.svg”不是在“Cjrm-k0.svg”的内部。
  • 特殊字无绝对优先权,具体取码仍须考量字形特征、精简、先繁后简等其他原则。例如“”取码作“十木”而非“木十”(使用特殊字),而“”取码作“木十”(使用特殊字)而非“十木”,因如此取码更能彰显字形特征。其他例子如“”取码作“手大日”而非“大手日”(使用特殊字)、“”取码作“十手大”而非“十大手”(使用特殊字);“”取码作“戈手”(使用特殊字)而非“戈手十心”;“”取码作“手人”而非“大十”(使用特殊字)。

注释[编辑]

  1. 五代手册原文将“例外字”分为“复合字”、“难字”、“特殊字”、“重复字”,“复合字”下又分“复合字首”、“复合字”。可见五代手册之“复合字”有广义与狭义之别。三代手册有“复合字”一词,但由于三代未直接定义“复合字首”,其实质内容相当于五代的狭义复合字。由于广义和狭义的“复合字”并存容易混淆,且广义的“复合字”极其罕用——五代手册除标题外未提及广义的“复合字”;一般使用者谈及“复合字”时也都是指三代或狭义的“复合字”——因此本教科书稍微调整架构,省去广义的“复合字”,以避免歧义。“重复字”主要用于仓颉系统,但目前主流系统一般改以选字处理重码字,本教科书遂将此部分移至〈进阶知识〉一节。
  2. 就使用者角度而言,例外字不得新增。若站在输入法或编码表开发者的角度,则可考虑比照原开发者的精神,适当创造新例外字,以便为罕用字、造字编码。
  3. 三代手册未直接谈及“复合字首”,但于第二章第一节介绍字首时提及“3.戈、戊、𢦏、㦰、产、麻、厭、厤、鴈、雁、辰、厥、羽、府、鹿、君等,为便于取码,亦视为字首。”此观念与五代之复合字首相类,本教科书将其中可归于汉字分割原则之字形归至该处,其余可能影响取码者视为三代定义之复合字首。
  4. 4.0 4.1 4.2 《第五代仓颉输入法手册》(1999年版五代)附录六〈第五代仓颉字码表〉列出“愿”(字形为“⿸原心”)编码为“一火心”、“鷢”(字形为“⿸厥鸟”)编码为“一人竹日火”,附录一〈第三代、第五代改码字字码对照表〉亦未提及相关改码字,可见五代“原”、“厥”与三代一样为复合字首。然而,五代手册于介绍复合字首时未将“原”、“厥”列入,与前者不一致,对此有两种解释:一是五代手册漏列此二复合字首;二是五代取消了此二复合字首,但将相关字之取码字形由“⿸原*”、“⿸厥*”改为“⿱原*”、“⿱厥*”以致取码未变,手册字形则是印刷错误。 又查汉文库典“愿”、“鷢”之六代编码分别为“一竹日心”、“一廿人片”,可见取码所据字形为“⿸原心”、“⿸厥鸟”(若所据字形为“⿱原心”、“⿱厥鸟”,则应取码“一火.心”、“一人.的片”;图为“⿱原心”、“⿱厥鸟”应属错误)。汉文库典五、六代共用图片,取码所据字形亦同,故知五代取码所据字形为“⿸原心”、“⿸厥鸟”,再次反驳了解释二。 总上所述,解释一显较解释二合理,五代仓颉应仍比照三代承认“原”、“厥”为复合字首;五代手册未将“原”、“厥”列入复合字首应属疏漏。
  5. 朱邦复于《第三代仓颉输手法手册》曾提及将“目”定为复合字取“月山”以免取“月一”时与“且”重码;然而其《第五代仓颉输手法手册》主张“目”取“月一”不符合完整原则。本教材采五代之说,不将“目”视为复合字。
  6. 6.0 6.1 《第五代仓颉输入法手册》将“Cjrm-p10.svg”列为特殊字,并于附表描述“屯”之取码是采用辅助字形“七凵”,可知是比照类似“朿”的原则取码。有论以为此特殊字只有“屯”一个应用实例,且不将“Cjrm-p10.svg”视为特殊字也能按〈跨越分则〉解释“屯”的取码,甚至加入此特殊字会导致“毛”、“尧”等字取码有争议,而主张此字形不应纳入特殊字[1]。该说可参,惟其所称争议并非无法圆说——“夫”(手人)未因“大”为特殊字而取“大十”,故“Cjrm-p10.svg”为特殊字也不足以导致“毛”必须取码“竹心十”;“尧”上为“Cjrm-p13.svg”非“Cjrm-p10.svg”而不适用此特殊字——又考虑不将“Cjrm-p10.svg”视为特殊字的跨越取码方式与〈跨越分则〉的典型实例较不似,且无法排除未来处理更大字集遇到更多应用实例之可能,此从原说将“Cjrm-p10.svg”定为特殊字。


 取码原则 仓颉输入法
例外字
特别注意