倉頡輸入法/例外字

維基教科書,自由的教學讀本
跳至導覽 跳至搜尋
 取碼原則 倉頡輸入法
例外字
特別注意 

95%以上的中文字,都可依據前述原則取碼,其餘約5%的字,若按同樣規則取碼,本來亦無不可,但顧及使用方便,特將一些字形做例外處理,這些字稱做「例外字」,包括:[1]

  1. 複合字首:做字首或次字首時,視爲一整體,只取頭、尾兩碼。
  2. 複合字:一律視爲一整體,只取頭、尾兩碼。
  3. 難字:可用「難」碼代替難取的部份。
  4. 特殊字:被其他部件橫貫時,先取特殊字,再取重疊於上的部件,並且可與骨幹的中豎重複。

注意以下例外字均已舉全,不可憑個人主觀自訂例外字,否則會取不到正確字碼。[2]

複合字首[編輯]

「複合字首」(或稱「特別字首」)在做「字首」或「次字首」時,視爲一整體,只取頭、尾兩碼[3][4]

複合字首列表
版本 複合字首 圖解 取碼 字例 補充說明
三五 Cjhm-on.svg Cjhm-on-color.svg 人弓 人弓.火木)、人戈.人弓
三五 Cjhm-sm.svg Cjhm-sm-color.svg 尸一 尸一.中)、尸一.木竹水
三五 Cjhm-ic.svg Cjhm-ic-color.svg 戈金 戈金.女戈)、戈金.一口 按台灣標準字形,「」等字的字首應爲「戈金」而非「戈木」,但微軟倉頡採後者編碼,詳參〈特別注意〉一節。
三五 Cjhm-id.svg Cjhm-id-color.svg 戈木 戈木.竹戈)、戈木.一口
三五 Cjhm-mk.svg Cjhm-mk-color.svg 一大 一大.土)、一大.一田中
三五 Cjhm-mv.svg Cjhm-mv-color.svg 一女 一女.中一戈)、一女.木戈
三五 Cjhm-mf.svg Cjhm-mf-color.svg 一火 一火.心 五代手冊未列此複合字首。[4]
三五 Cjh3m-mo.svg Cjh3m-mo-color.svg 一人 一人.竹日火 五代手冊未列此複合字首。[4]
三  Cjh3m-md2.svg Cjh3m-md2-color.svg 一木 一木.卜中一)、一木.山戈戈 五代:一.木木.一)、一.木木.戈
三  Cjh3m-md.svg Cjh3m-md-color.svg 一木 一木.卜中一)、一木.日 五代:一.竹木.一)、一.竹木.日
三  Cjh3m-mf.svg Cjh3m-mf-color.svg 一火 一火.月山金 五代:一.人火.金
三  Cjh3m-mg.svg Cjh3m-mg-color.svg 一土 一土.月山金 五代:一.人土.金
三  Cjh3m-ig.svg Cjh3m-ig-color.svg 戈土 戈土.心)、戈土.竹日火 五代:戈.人土.心)、戈.人土.火
三  Cjh3m-ii.svg Cjh3m-ii-color.svg 戈戈 戈戈.人月人)、戈戈.火 五代:戈.人戈.月)、戈.人戈.火
 五 Cjh5m-or.svg Cjh5m-or-color.svg 人口 人口.手)、人口.月廿 三代:人.一.口手)、人.一.口廿
 五 Cjh5m-tj.svg Cjh5m-tj-color.svg 廿十 廿十.弓木)、廿十.口卜人 三代:廿.竹十.木)、廿.竹十.人

複合字首單獨使用,或用做「字身」、「次字身」時,則依一般方式取碼。例如:

戈.十金.金),廿.戈.十金),女.戈.十金);
一.日月.大),心.一.日大),手.一.日大);
一.一.一女),十.一.一女),女.一.一女);
人.一.弓),水.人.一弓),廿.人.一弓);
尸一.尸戈一),十水.尸一.一),竹尸.尸一.一)。
戈.人.木戈),人.戈.人戈),月.戈.人戈);
人.一.口),水.人.一口),竹.人.一口);
廿.竹口.十),𡤏女.廿.竹十),𨇨口一.廿.竹十)。

許多複合字首在書寫時會視爲整體形塊。例如「愿」、「壓」、「辱」等字,有時作撇筆一撇到底,包住下方部件,有時則較短,使兩字能上下切開,把它們定義作複合字首可避免字首應該取「厂」或取「原」、「厭」、「辰」的疑惑

另一些複合字首是為了減少重碼。例如若不把「麻」定義作複合字首,「麻」部字得取「戈.十金.(尾碼)」或「戈.木木.(尾碼)」,許多字形只靠一個尾碼便難以區分,會產生大量重碼。同理「羽」、「气」、「薛」、「合」等皆有此作用。

複合字[編輯]

「複合字」不論是單獨使用或與其他字形組合使用,一律只取其頭、尾兩碼[5]

複合字列表
版本 複合字 圖解 取碼 字例 補充說明
三五 Cjcm-an.svg Cjcm-an-color.svg 日弓 日弓.口)、人.日弓
三五 Cjcm-ln.svg Cjcm-ln-color.svg 中弓 中弓.卜中月)、中弓.竹難山
三五 Cjcm-nl.svg Cjcm-nl-color.svg 弓中 弓中.人一木)、弓廿.弓中
三五 Cjcm-og.svg Cjcm-og-color.svg 人土 大戈.人土)、女火.人土 當中可以被其他成份夾雜,比如)。
三五 Cjcm-vi.svg Cjcm-vi-color.svg 女戈 女戈)、女戈竹戈 」從「𢆶」從「戍」,因此下方亦按「戍」字取碼,尾部份取「竹戈」不取「人」。
三五 Cjcm-yp.svg Cjcm-yp-color.svg 卜心 卜心.竹山)、卜心.尸一
三  Cjc3m-hi.svg Cjc3m-hi-color.svg 竹戈 土.竹戈)、廿.竹戈)、竹戈.十木 五代:竹山.戈)、土.竹山.戈)、廿.竹山.戈)、竹戈.十木
三  Cjc3m-yr.svg Cjc3m-yr-color.svg 卜口 卜口.月.月弓)、卜口.月.廿弓
 五 Cjc5m-ls.svg Cjc5m-ls-color.svg 中尸 中尸.日)、人.中尸 1987年版五代加入,1999年版移除。
無定義時:中戈尸)、人.中戈尸)。
 五 Cjc5m-yn.svg Cjc5m-yn-color.svg 卜弓 卜弓.月山金)、卜弓.廿手

難字[編輯]

有些字的部份形狀過於瑣碎,導致拆碼繁瑣。爲了方便取碼,特別規定了一些「難字」,以「難(X)」碼代替難取部份。以下是難字列表:

  • 1.「頭、難、尾」類:頭、尾碼好取,其餘難取。
難字列表
難字 圖解 取碼 字例
Cjxm-hxh.svg Cjxm-hxh-color.svg 竹難竹 弓火.竹難竹)、金.竹難竹
Cjxm-ixe.svg Cjxm-ixe-color.svg 戈難水 木.戈難水)、廿手.戈難水
Cjxm-ixf.svg Cjxm-ixf-color.svg 戈難火 廿.戈難火)、廿十.戈難火
Cjxm-ixp.svg Cjxm-ixp-color.svg 戈難心 木木.戈難心)、戈心.土
Cjxm-lxh.svg Cjxm-lxh-color.svg 中難竹 女.中難竹)、竹.中難竹
Cjxm-lxl.svg Cjxm-lxl-color.svg 中難中 水.中難中)、女.中難中
Cjxm-txc2.svg Cjxm-txc2-color.svg 廿難金 月金.廿難金)、廿.廿難金
Cjxm-rxu.svg Cjxm-rxu-color.svg 口難山 女火.口難山)、土大.口難山
Cjxm-nxu.svg Cjxm-nxu-color.svg 弓難山 中弓.弓難山)、竹木.弓難山
Cjxm-hxu.svg Cjxm-hxu-color.svg 竹難山 竹難山)、𤒅火.竹難山
  • 2.「頭、難」類:僅有頭碼好取
難字列表
難字 圖解 取碼 字例
Cjxm-hx.svg Cjxm-hx-color.svg 竹難 竹難竹山)、人.竹難山)、竹難人
Cjxm-hx2.svg Cjxm-hx2-color.svg 竹難 竹難中水)、竹難.月廿
Cjxm-hx3.svg Cjxm-hx3-color.svg 竹難 竹月.弓木)、竹月.一金.竹
Cjxm-hx4.svg Cjxm-hx4-color.svg 竹難 竹難卜金)、竹難月金)、輿竹難十金
Cjxm-lx.svg Cjxm-lx-color.svg 中難 廿.中難)、金.中難
Cjxm-nx.svg Cjxm-nx-color.svg 弓難
Cjxm-vx.svg Cjxm-vx-color.svg 女難
Cjxm-yx.svg Cjxm-yx-color.svg 卜難 水.卜難)、卜難火

特殊字[編輯]

有部件重疊在以下幾種字形的中間時,規定先取特殊字,再取重疊於上的部件,並且可與骨幹的中豎重複。[6]

特殊字列表
版本 特殊字 字例
三五 Cjsm-d.svg 木十)、木月)、木中)、木人人)、木田)、木田火)、竹木中)、竹木中心
三五 Cjsm-f.svgCjsm-f2.svg 火金.月)、火手.手
三五 Cjsm-i.svg 戈大.口.一)、金.戈手)、线女一.戈十
三五 Cjsm-k.svg 大大大大)、大一日日)、大弓)、大人人
三五 Cjsm-p.svgCjsm-p2.svg 心山[6]

注意特殊字的一些特性:

  • 重疊在特殊字上的字形可以計入中豎,且計入中豎的取碼方式通常更符合字形特徵原則而優先採用。例如「」字視爲「」重疊在「」上,而非「」或「」重疊在「」上。
  • 特殊字只在內部允許重疊。例如若「」取碼作「大月」(Cjrm-k0.svgCjrm-b8.svg),則並非使用特殊字,而是試圖跨越取碼(但實際上此字不符合跨越取碼的條件,而取碼作「中月大」),因為「Cjrm-b8.svg」不是在「Cjrm-k0.svg」的內部。
  • 特殊字無絕對優先權,具體取碼仍須考量字形特徵、精簡、先繁後簡等其他原則。例如「」取碼作「十木」而非「木十」(使用特殊字),而「」取碼作「木十」(使用特殊字)而非「十木」,因如此取碼更能彰顯字形特徵。其他例子如「」取碼作「手大日」而非「大手日」(使用特殊字)、「」取碼作「十手大」而非「十大手」(使用特殊字);「」取碼作「戈手」(使用特殊字)而非「戈手十心」;「」取碼作「手人」而非「大十」(使用特殊字)。

註釋[編輯]

  1. 五代手冊原文將「例外字」分為「複合字」、「難字」、「特殊字」、「重複字」,「複合字」下又分「複合字首」、「複合字」。可見五代手冊之「複合字」有廣義與狹義之別。三代手冊有「複合字」一詞,但由於三代未直接定義「複合字首」,其實質內容相當於五代的狹義複合字。由於廣義和狹義的「複合字」並存容易混淆,且廣義的「複合字」極其罕用——五代手冊除標題外未提及廣義的「複合字」;一般使用者談及「複合字」時也都是指三代或狹義的「複合字」——因此本教科書稍微調整架構,省去廣義的「複合字」,以避免歧義。「重複字」主要用於倉頡系統,但目前主流系統一般改以選字處理重碼字,本教科書遂將此部分移至〈進階知識〉一節。
  2. 就使用者角度而言,例外字不得新增。若站在輸入法或編碼表開發者的角度,則可考慮比照原開發者的精神,適當創造新例外字,以便為罕用字、造字編碼。
  3. 三代手冊未直接談及「複合字首」,但於第二章第一節介紹字首時提及「3.戈、戊、𢦏、㦰、产、麻、厭、厤、鴈、雁、辰、厥、羽、府、鹿、君等,為便於取碼,亦視為字首。」此觀念與五代之複合字首相類,本教科書將其中可歸於漢字分割原則之字形歸至該處,其餘可能影響取碼者視為三代定義之複合字首。
  4. 4.0 4.1 4.2 《第五代倉頡輸入法手冊》(1999年版五代)附錄六〈第五代倉頡字碼表〉列出「愿」(字形為「⿸原心」)編碼為「一火心」、「鷢」(字形為「⿸厥鳥」)編碼為「一人竹日火」,附錄一〈第三代、第五代改碼字字碼對照表〉亦未提及相關改碼字,可見五代「原」、「厥」與三代一樣為複合字首。然而,五代手冊於介紹複合字首時未將「原」、「厥」列入,與前者不一致,對此有兩種解釋:一是五代手冊漏列此二複合字首;二是五代取消了此二複合字首,但將相關字之取碼字形由「⿸原*」、「⿸厥*」改為「⿱原*」、「⿱厥*」以致取碼未變,手冊字形則是印刷錯誤。 又查漢文庫典「愿」、「鷢」之六代編碼分別為「一竹日心」、「一廿人片」,可見取碼所據字形為「⿸原心」、「⿸厥鳥」(若所據字形為「⿱原心」、「⿱厥鳥」,則應取碼「一火.心」、「一人.的片」;圖為「⿱原心」、「⿱厥鳥」應屬錯誤)。漢文庫典五、六代共用圖片,取碼所據字形亦同,故知五代取碼所據字形為「⿸原心」、「⿸厥鳥」,再次反駁了解釋二。 總上所述,解釋一顯較解釋二合理,五代倉頡應仍比照三代承認「原」、「厥」為複合字首;五代手冊未將「原」、「厥」列入複合字首應屬疏漏。
  5. 朱邦復於《第三代倉頡輸手法手冊》曾提及將「目」定為複合字取「月山」以免取「月一」時與「且」重碼;然而其《第五代倉頡輸手法手冊》主張「目」取「月一」不符合完整原則。本教材採五代之說,不將「目」視為複合字。
  6. 6.0 6.1 《第五代倉頡輸入法手冊》將「Cjrm-p10.svg」列為特殊字,並於附表描述「屯」之取碼是採用輔助字形「七凵」,可知是比照類似「朿」的原則取碼。有論以為此特殊字只有「屯」一個應用實例,且不將「Cjrm-p10.svg」視為特殊字也能按〈跨越分則〉解釋「屯」的取碼,甚至加入此特殊字會導致「毛」、「尧」等字取碼有爭議,而主張此字形不應納入特殊字[1]。該說可參,惟其所稱爭議並非無法圓說——「夫」(手人)未因「大」為特殊字而取「大十」,故「Cjrm-p10.svg」為特殊字也不足以導致「毛」必須取碼「竹心十」;「尧」上為「Cjrm-p13.svg」非「Cjrm-p10.svg」而不適用此特殊字——又考慮不將「Cjrm-p10.svg」視為特殊字的跨越取碼方式與〈跨越分則〉的典型實例較不似,且無法排除未來處理更大字集遇到更多應用實例之可能,此從原說將「Cjrm-p10.svg」定為特殊字。


 取碼原則 倉頡輸入法
例外字
特別注意