仓颉输入法/例外字

维基教科书,自由的教学读本
 取码原则 仓颉输入法
例外字
特别注意 

95%以上中文字都可依据前述原则取码,其馀约5%的字,若按同样规则取码,本来亦无不可,但顾及使用方便,特别处理一些例外字形,这些字称做“例外字”,包括:[1]

  1. 复合字首:做字首或次字首时视为一整体,只取头、尾两码。
  2. 复合字:一律视为一整体,只取头、尾两码。
  3. 难字:难取部份以“难”码代替。
  4. 特殊字:被其他部件横贯时,先取特殊字,再取重叠于上的部件,并且可与骨干的中竖重复。

注意以下例外字均已举全,不可凭个人主观自订例外字,否则会取不到正确字码。[2]

复合字首[编辑]

“复合字首”(或称“特别字首”)在做“字首”或“次字首”时,视为一整体,只取头、尾两码[3][4]

复合字首列表
版本 复合字首 图解 取码 字例 补充说明
三五 气 气 人弓 人弓・火木)、人戈・人弓
三五 羽 羽 尸一 尸一・中)、尸一・木竹水
三五 麻 麻 戈金 戈金・女戈)、戈金・一口 按台湾标准字形,“”等字的字首应为“戈金”而非“戈木”,但微软仓颉采后者编码,详参〈特别注意〉一节。
三五 ⿸广林 ⿸广林 戈木 戈木・竹戈)、戈木・一口
三五 厭 厭 一大 一大・土)、一大・一田中
三五 辰 辰 一女 一女・中一戈)、一女・木戈
三五 厥 厥 一人 一人・竹日火 五代手册未列此复合字首。[5]
三  𠩵 𠩵 一木 一木・卜中一)、一木・山戈戈 五代:一・木木・一)、一・木木・戈
三  厤 厤 一木 一木・卜中一)、一木・日 五代:一・竹木・一)、一・竹木・日
三  鴈 鴈 一火 一火・月山金 五代:一・人火・金
三  雁 雁 一土 一土・月山金 五代:一・人土・金
三  䧹 䧹 戈土 戈土・心)、戈土・竹日火 五代:戈・人土・心)、戈・人土・火
三  府 府 戈戈 戈戈・人月人)、戈戈・火 五代:戈・人戈・月)、戈・人戈・火
三  卜人 卜人・月山金 五代:卜・女人・金[6]
 五 合 合 人口 人口・手)、人口・月廿 三代:人・一・口手)、人・一・口廿
 五 薛 薛 廿十 廿十・弓木)、廿十・口卜人 三代:廿・竹十・木)、廿・竹十・人

复合字首单独使用,或用做“字身”、“次字身”时,则依一般方式取码。例如:

戈・十金・金),廿・戈・十金),女・戈・十金);
一・日月・大),心・一・日大),手・一・日大);
一・一・一女),十・一・一女),女・一・一女);
人・一・弓),水・人・一弓),廿・人・一弓);
尸一・尸戈一),十水・尸一・一),竹尸・尸一・一)。
戈・人・木戈),人・戈・人戈),月・戈・人戈);
人・一・口),水・人・一口),竹・人・一口);
廿・竹口・十),𡤏女・廿・竹十),𨇨口一・廿・竹十)。

许多复合字首在书写时会视为整体形块。例如“愿”、“壓”、“辱”等字,有时作撇笔一撇到底,包住下方部件,有时则较短,使两字能上下切开,把它们定义作复合字首可避免字首应该取“厂”或取“原”、“厭”、“辰”的疑惑

另一些复合字首是为了减少重码。例如若不把“麻”定义作复合字首,“麻”部字得取“戈・十金・(尾码)”或“戈・木木・(尾码)”,许多字形只靠一个尾码便难以区分,会产生大量重码。同理“羽”、“气”、“薛”、“合”等皆有此作用。

复合字[编辑]

“复合字”不论是单独使用或与其他字形组合使用,一律只取其头、尾两码[7]

复合字列表
版本 复合字 图解 取码 字例 补充说明
三五 門 門 日弓 日弓・口)、人・日弓
三五 鬥 鬥 中弓 中弓・卜中月)、中弓・竹難山
三五 阝 阝 弓中 弓中・人一木)、弓廿・弓中 大陆视为两笔,不作复合字亦解得“弓中”。
三五 隹 隹 人土 大戈・人土)、女火・人土 不可依正常拆码(人卜手一)或取首尾(人一)。
当中可以被其他成份夹杂,比如)。
“佳”字则是取(人・土土)。
三五 畿-田 畿-田 女戈 女戈)、女戈竹戈 ”从“𢆶”从“戍”,因此下方亦按“戍”字取码,尾部份取“竹戈”不取“人”。
三五 虍 虍 卜心 卜心・竹山)、卜心・尸一
三  鬼 鬼 竹戈 土・竹戈)、廿・竹戈)、竹戈・十木 五代:竹山・戈)、土・竹山・戈)、廿・竹山・戈)、竹戈・十木
三  ⿱亡口 ⿱亡口 卜口 卜口・月・月弓)、卜口・月・廿弓
 五 门 门 中尸 中尸・日)、人・中尸 1987年版五代加入,1999年版移除。
无定义时:中戈尸)、人・中戈尸)。
 五 贏-貝 贏-貝 卜弓 卜弓・月山金)、卜弓・廿手

难字[编辑]

有些字的部份形状过于琐碎,拆码繁琐。为了方便取码,特别规定了一些“难字”,以“难(X)”码代替难取部份。以下是难字列表:

一、“首、难、尾”型:首、尾码好取,其馀难取。

“首、难、尾”型难字列表
难字 图解 取码 字例
身 身 竹难竹 弓火・竹難竹)、金・竹難竹
慶 慶 戈难水 木・戈難水)、廿手・戈難水
廌 廌 戈难火 廿・戈難火)、廿十・戈難火
鹿 鹿 戈难心 木木・戈難心)、戈心・土
𠂔 𠂔 中难竹 女・中難竹)、竹・中難竹
𣶒 𣶒 中难中 水・中難中)、女・中難中
兼 兼 廿难金 月金・廿難金)、廿・廿難金
黽 黽 口难山 女火・口難山)、土大・口難山
龜 龜 弓难山 中弓・弓難山)、竹木・弓難山
⻱ ⻱ 竹难山 竹難山)、𤒅火・竹難山

二、“首、难”型:仅有首码好取

“首、难”型难字列表
难字 图解 取码 字例
臼 臼 竹难 竹難竹山)、人・竹難山)、竹難人
𦥑 𦥑 竹难 竹難中水)、竹難・月廿
學-爻-冖-子 學-爻-冖-子 竹难 竹月・弓木)、竹月・一金・竹
興-同-八 興-同-八 竹难 竹難卜金)、竹難月金)、輿竹難十金
肅 肅 中难 廿・中難)、金・中難
卍 卍 弓难
卐 卐 女难
齊 齊 卜难 水・卜難)、卜難火

特殊字[编辑]

有部件重叠在以下几种字形的中间时,可先取特殊字,再取重叠于上的部件。[8]

特殊字列表
版本 特殊字 字例
三五 木 木十)、木月)、木中)、木人人)、木田)、木田火)、竹木中)、竹木中心
三五 火火(首二笔为上至下,呈“八”形) 火金・月)、火手・手
三五 戈 戈大・口・一)、金・戈手)、线女一・戈十
三五 大 大大大大)、大一日日)、大弓)、大人人
三五 七(首笔为斜)七(首笔为横) 心山[8]

注意特殊字的一些特性:

  • 重叠在特殊字上的字形可以计入中竖,且计入中竖的取码方式通常优先采用。例如“”字视为“”重叠在“”上,取码“木田”;而非“”或“”重叠在“”上,取码“木日”。
  • 只有在特殊字内部重叠字形时适用特殊字的规则。例如若“”取码作“大月”(),则并非使用特殊字规则(因为“”不是在“”的内部),而是试图跨越取码(但此字不符合跨越取码的条件,因而实际取码是按区块取码作“中月大”)。
  • 特殊字无绝对优先权,具体取码仍须考量精简、字形特征、先繁后简等其他原则。其中,特殊字会优先(但非必定)选择让横笔对应原字最长、最突出的横,以彰显字形特征。例如:
    • ”取码作“十木”而非“木十”(使用特殊字),而“”取码作“木十”(使用特殊字)而非“十木”,因如此取码更能彰显字形特征(“木”横笔对应原字最长横)。
    • ”取码作“手大日”而非“大手日”(使用特殊字)、“”取码作“十手大”而非“十大手”(使用特殊字),因前者更符合字形特征原则(若取“大手日”则“大”横笔并非对应原字最长横)与先繁后简原则。
    • ”取码作“手人”而非“大十”(使用特殊字),因前者更符合字形特征原则(若取“大十”则“大”横笔并非对应原字最长横)与先繁后简原则。
    • ”取码作“竹手山”而非“竹心十”(使用特殊字),因前者更符合字形特征原则(若取“竹心十”则“七”横笔并非对应原字最长横)与先繁后简原则。
    • ”取码作“十心・一山”而非“心十・一山”(使用特殊字),因前者较符合字形特征原则(区块分割优先)。
    • ”取码作“戈十”(使用特殊字)而非“戈手心”、“”取码作“戈手”(使用特殊字)而非“戈手十心”,因前者较符合精简原则与先繁后简原则。

注释[编辑]

  1. 五代手册原文将“例外字”分为“复合字”、“难字”、“特殊字”、“重复字”,“复合字”下又分“复合字首”、“复合字”。可见五代手册之“复合字”有广义与狭义之别。三代手册有“复合字”一词,但由于三代未直接定义“复合字首”,其实质内容相当于五代的狭义复合字。由于广义和狭义的“复合字”并存容易混淆,且广义的“复合字”极其罕用——五代手册除标题外未提及广义的“复合字”;一般使用者谈及“复合字”时也都是指三代或狭义的“复合字”——因此本教科书稍微调整架构,省去广义的“复合字”,以避免歧义。“重复字”主要用于仓颉系统,但目前主流系统一般改以选字处理重码字,本教科书遂将此部分移至〈进阶知识〉一节。
  2. 就使用者角度而言,例外字不得新增。若站在输入法或编码表开发者的角度,则可考虑比照原开发者的精神,适当创造新例外字,以便为罕用字、造字编码。
  3. 1994年版三代手册未谈及“复合字首”,但于第三章第三节介绍字首时提及“3.戊、戈、𢦏、㦰、产、麻、䧹、厭、厤、鴈、辰、厥、羽、府、鹿、亥、老、包、君‥等字,虽不能作上下或左右一次分离,然为了取码方便,一律定义之为字首。”(1984年版之同一节字例尚有“雁”字),观念与五代之复合字首相当。本教科书将其中可直接以汉字分割原则解释者省略或于〈汉字分割〉一节讨论,其馀则视为三代定义之复合字首。
  4. 五代仓颉实际上有哪些复合字首有争议,官方五代手册影印版和电子版列出的“复合字首”不一致,后者将“春”、“登”列为复合字首。因两者在〈第三代、第五代改码字〉皆把“蠢”、“凳”等相关字列为“五、取码原则不一致者,使其统一”而非“三、增加复合字首或改变原复合字的取码,以避免重复字者”,本教科书主要采影印版之说。其馀细节可参见〈争议编码〉一节。
  5. 《第五代仓颉输入法手册》(1999年版五代)附录六〈第五代仓颉字码表〉列出“鷢”(字形为“⿸厥鳥”)编码为“一人竹日火”,附录一〈第三代、第五代改码字字码对照表〉亦未提及相关改码字,可见五代“厥”与三代一样为复合字首。然而,五代手册于介绍复合字首时未将“厥”列入,与前者不一致,对此有两种解释:一是五代手册漏列此复合字首;二是五代取消了此二复合字首,唯将相关字之取码字形由“⿸厥*”改为“⿱厥*”以致取码未变,手册字形则是印刷错误。解释二需要较多巧合同时成立,可能性较低。 查汉文库典“鷢”、“憠”、“橛”、“蟨”之六代编码分别为“一廿人片”、“一廿人心”、“一廿人木”、“一廿人戈”,可见取码所据字形为“⿸厥鳥”、“⿸厥心”、“⿸厥木”、“⿸厥虫”(若所据字形为“⿱厥鳥”、“⿱厥心”、“⿱厥木”、“⿱厥虫”,则应取码“一廿山片”、“一廿山心”、“一廿山木”、“一廿山戈”),汉文库典字形图片显示“⿱厥*”应属错误。汉文库典为五、六代共用系统,取码所据字形相同,又汉文库典与五代手册皆属五代仓颉,绝大部分取码所据字形相同,因此五代仓颉之取码所据字形当为“⿸厥*”,再次反驳了解释二。 总上所述,解释一显较解释二合理,五代仓颉应仍比照三代承认“厥”为复合字首;五代手册未将“厥”列入复合字首应属疏漏。
  6. 1994年版三代于字首一节有谈及“亥”字特别定义为字首,并有例字“⿱亥月”。五代手册于复合字首一节未提及此字形,改码字一节未谈及相关改码,亦无相关字例。查汉文库典(2003年版五代)将“賌”编码为“卜女人金”,可见五代不将此字型认定为复合字首。
  7. 朱邦复于《第三代仓颉输手法手册》曾提及将“目”定为复合字取“月山”以免取“月一”时与“且”重码;然而其《第五代仓颉输手法手册》主张“目”取“月一”不符合完整原则。本教材采五代之说,不将“目”视为复合字。
  8. 8.0 8.1 《第五代仓颉输入法手册》将“”列为特殊字,并于附表描述“屯”之取码是采用辅助字形“七凵”,可知是比照类似“朿”的原则取码(但有论以为视为“七屮”更佳)。有论以为此特殊字只有“屯”一个应用实例,不将“”视为特殊字也能按〈跨越分则〉解释“屯”的取码,且加入此特殊字会导致“毛”、“尧”等字取码有争议,而主张此字形不应纳入特殊字[1]。该说可参,惟其所称争议并非不能用其他原则解释,又考虑不将“”视为特殊字的跨越取码方式与〈跨越分则〉的典型实例较不似,且无法排除未来处理更大字集遇到更多应用实例之可能,此仍从原说将“”列为特殊字。


 取码原则 仓颉输入法
例外字
特别注意