倉頡輸入法/特別注意

维基教科书,自由的教学读本
跳转至: 导航搜索

本章會說明倉頡輸入法取碼時可能遇到的其他問題,包括字體差異編碼訛誤簡化字取碼等。

字體問題[编辑]

倉頡輸入法是形碼輸入法,即是根據漢字的字形取碼。因此,除了字根、取碼規則外,字的寫法、形狀,也會影響使用者取碼是否成功。

坊間有人說倉頡輸入法不支援異體字。其實,倉頡輸入法本來應用於倉頡系統上,它是支援異體字的。不但如此,倉頡系統的輸入碼(倉頡碼)就是內碼,在字型顯示和輸入編碼上能取得一致。例如輸入「戈.十金.金」會得出「」字,輸入「戈.木.木」會得出「」字。如果使用者在鍵盤上敲打「戈十金金」,螢幕顯示出的必定是「」字,不會變形作「」字。反之亦然。

可是,在其他作業平臺上,只採用Big5Unicode作內碼,許多異體字都被合併作同一個字元,有些漢字甚至不予支援。例如上述的兩個「麻」字,無論是Big5還是Unicode,都合併作同一個字元。作業系統採用它們作內碼,就自然削去了倉頡輸入法本來對異體字的支援。好像在微軟Windows裏,使用者只能用「戈十金金」來輸入「麻」字,不能使用「戈木木」這編碼。這問題對用戶帶來不便,用戶即是準確掌握了字根和取碼規則,仍然無法輸入想要的漢字。

幸而坊間有一些倉頡輸入法版本,已對異體字加入容錯碼。比如有些給Windows、Linux等系統使用的五代倉頡,已加入了好些異體容錯編碼。這樣的話,輸入「戈木金金」或「戈木木」皆能得出「麻」字。雖然這「麻」字顯示出來的字樣不一定與編碼取形相同,但起碼能打出這漢字。

但若使用者使用缺少異體容錯碼的版本,例如微軟Windows內建的倉頡輸入法,就得記住該版本取碼所依據的字形,才可以正確拆碼。有人把這問題歸咎於倉頡輸入法。但考其原由,乃係作業系統改變了內碼、削減了倉頡輸入法本來支援的字庫後,才會出現的問題。

Unicode欠缺的異體字[编辑]

今天的中文系統,大多採用Unicode編碼,同時支援正簡日韓等多地的漢字字元。可是,爲着節省碼位,Unicode會把同一字在不同地區的寫法合併作一碼,這做法把許多異體字摒諸門外,令使用者無法使用異體寫法。但,Unicode同時又基於「字源分離原則」,使有些字在不同地區的寫法得到保留,造成分合無章、雙重標準的局面。

下表依微軟倉頡編碼排序,擧出一些Unicode缺收字形的例子:

收錄字 微軟倉頡編碼 缺收字 依缺收字編碼 補充說明
日戈.尸中 Cjvk-hssl.png 三代:竹卜.尸中
五代:竹尸.尸中
同類字有「」等。依字源,「Cjvk-hssl.png」字從「Cjvk-has.png」,「Cjvk-has.png」爲盛載食物的器皿,Unicode缺收者較正統。另外,見本表「」字條。
月.土.口 Cjvk-bqr.png 月.手口 同類字有「調」等。依字源,「Cjvk-bqr.png」是篆形寫法,「」是楷書習慣寫法。
金田.日 Cjvk-cwfa.png 金.田火.日 依字源,「Cjvk-cwfa.png」是篆形寫法,「」是楷書習慣寫法。
木中.尸竹.金 木中.弓月金 同類字有「」等。依字源,「」字從「」,「」聲。「刀」在右旁變形成「刂」,在右上角可寫回「刀」形。Unicode收錄者較正統。
竹日.心 Cjvk-has.png 三代:竹日卜卜
五代:竹日尸
」字是「Cjvk-has.png」的異體,前者是篆形寫法,後者依甲骨文、金文的字形演變。另外,Unicode收錄了部份從「」形的字,作爲從「Cjvk-avi.png」形的字之異體,如「」等,但收得不齊全,仍有些字遭合併。見本表「」字條。
竹水.卜 Cjvk-heim.png 竹水.戈一 同類字有「」等。依字源,「」字從「」,Unicode缺收者較正統。
戈火.中田中 Cjvk-mflwl.png 一火.中田中 同類字有「」偏旁的字。依字源,「Cjvk-mflwl.png」是原形寫法,「」是楷書習慣寫法。
十月一一 Cjvk-jbuv.png 十月山女 同類字有「」等。依字源,「Cjvk-jbuv.png」是原形寫法,Unicode缺收者較正統。另外,基於「字源分離原則」,Unicode收了「」作爲「」的異體。
十大日 Cjvk-jkia.png 十大戈日 同類字有「」等。依字源,「Cjvk-jkia.png」字從「Cjvk-jki.png」從「」,「Cjvk-jki.png」與「」(「老」字之省形,通稱「老字頭」)相異。Unicode缺收者較正統。另外,基於「字源分離原則」,Unicode收了「」作爲「」的異體。
十.廿金.卜 Cjvk-jtcm.png 十.廿金.一 依字源,「」字從「」,Unicode缺收者較正統。
弓日竹山 Cjvk-shahu.png 尸竹.日竹山 同類字有「」等。依字源,「」字不從「刀」,Unicode收錄者較正統。
三代:弓山.戈
五代:弓日竹戈
Cjvk-shahi.png 尸竹.日竹戈 同類字有「」等。依字源,「」字不從「刀」,Unicode收錄者較正統。
弓月山金 Cjvk-shbuc.png 尸竹.月山金 同類字有「」等。依字源,「」字不從「刀」,Unicode收錄者較正統。注意的是,「」字不從「負」,右上從「刀」,詳見本表「」字條。
弓戈.手 Cjvk-heq.png 竹水.手 同類字有「」等。依字源,「Cjvk-heq.png」字從「」(或說從「夊」,但「夊」爲「夂」的篆變,故字源歸「夂」)從「」,Unicode缺收者較正統。
弓一.弓戈一 Cjvk-nhnhh.png 弓竹.弓竹竹 同類字有「」等。依字源,「Cjvk-nhnhh.png」是原形寫法,「」是楷書習慣寫法。
人.戈.弓戈 Cjvk-omsl.png 人.一.尸中 同類字有「」等。依字源,「Cjvk-omsl.png」字從「Cjvk-om.png」從「Cjvk-sl.png」,Unicode缺收者較正統。
人.戈.日戈 Cjvk-omas.png 三代:人.一.日卜
五代:人.一.日尸
同類字有「」等。依字源,「Cjvk-omas.png」字從「Cjvk-om.png」,從「Cjvk-as.png」(「Cjvk-has.png」省去撇筆),Unicode缺收者較正統。另外,基於「字源分離原則」,Unicode收了「」作爲「」的異體。
尸一.尸戈一 Cjvk-shshh.png 尸竹.尸竹竹 同類字有「」等。依字源,「Cjvk-shshh.png」是原形寫法,「」是楷書習慣寫法。
廿.金.月廿 Cjvk-cmct.png 金.一.金廿 同類字有「」等。依字源,「」字從「」從橫臥的「」,兩種寫法的上方都是「水」的變形,無分正俗。
廿金.口山 Cjvk-tcsu.png 廿金.尸山 同類字有「」等。依字源,「」字從「」,「」聲,兩種寫法的下方都是「邑」的變形。
廿金田一 Cjvk-cmcw.png 金.一金田 同類字有「」等。依字源,「Cjvk-cmcw.png」字從「」從「」,Unicode缺收者較正統。
廿心竹人 Cjvk-cmso.png 金.一尸人 同類字有「」等。依字源,「Cjvk-cmso.png」字從「」從「」,Unicode缺收者較正統。
卜口.手一.月 Cjvk-yrqmb.png 卜口.手一.月 同類字有「」等。依字源,「」字從「」(即「丹」字)不從「月」,Unicode缺收者較正統。另外,基於「字源分離原則」,Unicode收了「」作爲「」的異體。

Big5欠缺的異體字[编辑]

早期的正體中文系統,大都採用Big5內碼。這套內碼收字範圍較少,不收錄異體字,也缺少香港地區用字、科技用字,過往使用者經常碰到缺字問題。有些使用者不明箇中原由,會誤怪了輸入法,以爲輸入法功能欠佳,不知道是內碼之過。

今天,大多作業系統都經已使用收字較多的Unicode作內碼,棄用Big5,但在好些情況下,使用者仍無法使用非Big5收錄的字。例如使用者設定了輸入法只輸出Big5字(可能使用者自己也不知道),或在一些只支援Big5的平台上,使用者就不能使用Big5不收錄的異體字,只能以Big5內的寫法代替。

下表依微軟倉頡編碼排序,擧出一些Big5缺收字形的例子:

收錄字 微軟倉頡編碼 缺收字 依缺收字編碼 補充說明
日.竹女.中 日.一.尸中 Unicode已同時收錄兩種寫法。依字源,「」字從「」,「」聲,Big5收錄者較正統。
日弓.水.竹口 水.日弓.口 Unicode已同時收錄兩種寫法。依字源,「」字從「」,「」聲,Big5收錄者較正統。
月.金口.中 月.土戈.中 Unicode已同時收錄兩種寫法。依字源,「」字不從「去」,Big5收錄者較正統。
月大.人土 月大.竹日火 Unicode已同時收錄兩種寫法。依字源,皆形聲字,無正俗之分。
月.尸木 弓尸木 Unicode已同時收錄兩種寫法。依字源,「」字從「」,與另一手爭物,Big5收錄者爲正。
月廿 月月一 Unicode已同時收錄兩種寫法。依字源,皆象形字,無正俗之分。
金.木田火 金.木田 Unicode已同時收錄兩種寫法。依字源,「」字從「」聲,Big5收錄者較正統。
金.十月金 金.心.月金 Unicode已同時收錄兩種寫法。依字源,「」字從「」在像鼎形物件之上,Big5缺收者較正統。
金.十戈.土 金.竹手人 Unicode已同時收錄兩種寫法。二字皆形聲字,Big5收錄者較正統。
金.心口 金.心戈 Unicode已同時收錄兩種寫法。香港用「」,台灣用「」。
金口.尸中 土戈.尸中 Unicode已同時收錄兩種寫法。依字源,「」字不從「去」,Big5收錄者較正統。
木.木戈 心山.弓中 Unicode已同時收錄兩種寫法。香港以「」命名現代屋邨,以「」命名鄉村,用法有異。
木水.心口山 大.心口山 Unicode已同時收錄兩種寫法。二字皆形聲字。
木.土.口土 木.戈口 Unicode已同時收錄兩種寫法。二字皆形聲字。
木.竹日 木.一日 Unicode已同時收錄兩種寫法。二字皆形聲字,但有些知名人士以其中一種寫法作名字,便應名隨主人。
木.十月金 木.心.月金 Unicode已同時收錄兩種寫法。依字源,「」字從「」在像鼎形物件之上,Big5缺收者較正統。
水.木大 戈一.木大 Unicode已同時收錄兩種寫法。依字源,「」字從「」(氵),Big5收錄者較正統。此外,微軟「」字編碼有誤,詳見微軟倉頡的編碼訛誤一節。
水.土.田金 戈一.土.田金 Unicode已同時收錄兩種寫法。依字源,「」字從「」(氵),Big5收錄者較正統。此外,微軟「」字編碼有誤,詳見微軟倉頡的編碼訛誤一節。
水.戈竹.口 戈一.戈竹.口 Unicode已同時收錄兩種寫法。依字源,「」字從「」(氵),Big5收錄者較正統。此外,微軟「」字編碼有誤,詳見微軟倉頡的編碼訛誤一節。
水.中 戈一.中 Unicode已同時收錄兩種寫法。依字源,「」字從「」(氵),Big5收錄者較正統。此外,微軟「」字編碼有誤,詳見微軟倉頡的編碼訛誤一節。
水.弓.水 水.竹弓.水 Unicode已同時收錄兩種寫法。依字源,「」字不從「殳」,Big5收錄者較正統。
水.手大.大 戈一.手大.大 Unicode已同時收錄兩種寫法。依字源,「」字從「」(氵),Big5收錄者較正統。此外,微軟「」字編碼有誤,詳見微軟倉頡的編碼訛誤一節。
水.口竹山 戈一.口竹山 Unicode已同時收錄兩種寫法。依字源,「」字從「」(氵),Big5收錄者較正統。此外,微軟「」字編碼有誤,詳見微軟倉頡的編碼訛誤一節。
水.田中.十 水.尸人 Unicode已同時收錄兩種寫法。二字皆形聲字,Big5收錄者較正統。「」爲日本漢字寫法。
水.田人.廿 水.日.月廿 Unicode已同時收錄兩種寫法。香港用「」,台灣用「」。
水.卜.口火 戈一.卜.口火 Unicode已同時收錄兩種寫法。依字源,「」字從「」(氵),Big5收錄者較正統。此外,微軟「」字編碼有誤,詳見微軟倉頡的編碼訛誤一節。
火.月.一水 火.十.一一 Unicode已同時收錄兩種寫法。二字在人名上不相通。
火木.十.一火 火木.山金.水 Unicode已同時收錄兩種寫法。香港用「」,台灣用「」。
火.一田.土 火.田大 Unicode已同時收錄兩種寫法。依字源,皆形聲字。
土.日.一竹 土.人.日竹 Unicode已同時收錄兩種寫法。
土.十月金 土.心.月金 Unicode已同時收錄兩種寫法。依字源,「」字從「」在像鼎形物件之上,Big5缺收者較正統。
土.中田中 卜尸.土 Unicode已同時收錄兩種寫法。二字在人名上不相通。
竹金.手 竹金.手 Unicode已同時收錄兩種寫法。依字源,「」字從「」。「」的手變形,而「」的手並沒有變形,Big5缺收者較正統。
禿 竹木.竹山 竹木.竹弓 Unicode已同時收錄兩種寫法。依字源,「禿」字從「」,Big5收錄者較正統。
竹木.中.弓 弓木.中.弓 Unicode已同時收錄兩種寫法。依字源,「」字上方象形,Big5收錄者較正統。
竹.竹大 口.廿大 Unicode已同時收錄兩種寫法。有人以「」字專指花開義。用於日本人名、地名時,二字不相通。
竹竹.竹弓.木 竹竹.弓尸.木 Unicode已同時收錄兩種寫法。依字源,「」字上方象形,Big5收錄者較正統。
竹.戈 女戈 Unicode已同時收錄兩種寫法。依字源,「」字爲正寫,像細小絲線形,Big5缺收者較正統。
竹戈.竹日火 竹戈.竹日火 Unicode已同時收錄兩種寫法。兩種寫法的分別是部件擺放位置不同。
竹弓.木 弓尸.木 Unicode已同時收錄兩種寫法。依字源,「」字上方象形,Big5收錄者較正統。
竹弓.一日火 竹弓.竹日火 Unicode已同時收錄兩種寫法。依字源,「」字從「」,「」聲,Big5收錄者較正統。
竹人.木手.弓 竹人.木月.弓 Unicode已同時收錄兩種寫法。香港用「」,台灣用「」。
竹土.口 竹手口 Unicode已同時收錄兩種寫法。香港用「」,台灣用「」。依字源,「」爲正寫,Big5缺收者較正統。
竹.心.日 竹.尸大 Unicode已同時收錄兩種寫法。依字源,「」字從「」,「」聲,Big5收錄者較正統。
竹口.人大 竹大.口 Unicode已同時收錄兩種寫法。兩種寫法的分別是部件擺放位置不同。
竹尸.戈大 竹尸.大 Unicode已同時收錄兩種寫法。依字源,「」字從「」從「」,Big5收錄者較正統。
竹山.一月金 竹弓.一月金 Unicode已同時收錄兩種寫法。依字源,「禿」字從「」,Big5收錄者較正統。
竹尸 戈尸 Unicode已同時收錄三種寫法。但其他從「戶」的字,如「」等,都只收錄頭碼爲「竹」者。依字源,「」字象形,Big5收錄者較正統。
一尸
戈.月金.弓 一.月金.弓 Unicode已同時收錄兩種寫法。依字源,「」字從「广」,「」聲,Big5收錄者較正統。
戈.木 女一.木 Unicode已同時收錄兩種寫法。依字源,「」字從「」從「」,Big5缺收者較正統。
戈.木.月山 一.木.月山 Unicode已同時收錄兩種寫法。依字源,「」字從「广」,「」聲,Big5收錄者較正統。
戈.火月.大 一.火月.大 Unicode已同時收錄兩種寫法。依字源,「」字從「广」,「」聲,Big5收錄者較正統。
戈.土廿.戈 一.一廿.戈 Unicode已同時收錄三種寫法。依字源,「」字從「广」,「」聲,Big5收錄者較正統。
一.土廿.戈
戈十金 戈木 Unicode已同時收錄兩種寫法。依字源,「」字不從「木」,Big5收錄者較正統。
戈.十金.金 廿.戈.十金 Unicode已同時收錄兩種寫法。但在微軟倉頡裏,要使用大陸規範的「」字這寫法,取「廿.戈.木木」。
戈大弓火 月.竹弓火 Unicode已同時收錄兩種寫法。依字源,「」字從「」,牽着下方的「」字變體。Big5缺收者較正統。
戈.一山.水 一.一山.水 Unicode已同時收錄兩種寫法。依字源,「」字從「广」,「」聲,Big5收錄者較正統。
戈一.卜.田木 戈一.卜.田火 Unicode已同時收錄兩種寫法。依字源,「」字從「」,Big5收錄者較正統。此外,微軟「」字編碼有誤,詳見微軟倉頡的編碼訛誤一節。
十月一金 心.月山金 Unicode已同時收錄兩種寫法。依字源,「」字從「」在像鼎形物件之上,Big5缺收者較正統。
十金.一月金 心金.一月金 Unicode已同時收錄兩種寫法。依字源,「」字從「」在像鼎形物件之上,Big5缺收者較正統。
十木.人大 大木.人大 Unicode已同時收錄兩種寫法。依字源,「」字從「𡥉」不從「孝」,Big5缺收者較正統。
十十.弓人 十十.一月.大 Unicode已同時收錄兩種寫法。依字源,「」字從「」從「」,Big5缺收者較正統。
十弓.一田中 十弓.一中尸 Unicode已同時收錄兩種寫法。二字皆形聲字。此外,微軟對「」部首的編碼有些爭議,詳見編碼據形與台標字形的差異一節。
十弓.心.火木 十弓.廿田;
十水.廿田
Unicode已同時收錄兩種寫法。二字皆形聲字。此外,微軟對「」部首的編碼有些爭議,詳見編碼據形與台標字形的差異一節。
十.廿月戈 十.廿月山 Unicode已同時收錄兩種寫法。依字源,「」字從「」聲,「」從「兔足」。Big5收錄者較正統。
大金.戈心.一 大木.戈心.一 Unicode已同時收錄兩種寫法。依字源,「」字從「」,Big5收錄者較正統。
大金.中.弓 大木.中.弓 Unicode已同時收錄兩種寫法。依字源,「」字從「」,Big5收錄者較正統。
中土.田.一 一.山.田 Unicode已同時收錄兩種寫法。依字源,「」字從「」(手拿着筆或竹枝之形)從「」畫田界,Big5收錄者較正統,缺收者則省去手拿着竹之形。
一土.弓月.水 一土.卜.口火 Unicode已同時收錄兩種寫法。依字源,「」字從「」,「」聲,Big5收錄者較正統。
一.戈戈.日 一金.日 Unicode已同時收錄兩種寫法。依字源,「」字從「」從「」,「臸」字雖有省略,但仍應保留其輪廓。Big5收錄者較正統。
一中月人 一山月 Unicode已同時收錄兩種寫法。在香港,重量單位用「」字;二義用「」,二字並非異體。在台灣,台標以「兩」代「両」。
一口.一廿 一口.一十.十 Unicode已同時收錄兩種寫法。依字源,「」字從「」不從「开」(「开」的字源爲「井」之省形),Big5缺收者較正統。
一田.田人.廿 一田.日.月廿 Unicode已同時收錄兩種寫法。香港用「」,台灣用「」。
弓.戈.中戈 弓.口.中戈 Unicode已同時收錄兩種寫法。
弓人.中一戈 弓人.日.一 Unicode已同時收錄兩種寫法。依字源,「」字從「」,Big5收錄者較正統。
弓人.一.口弓 木.弓人.弓 Unicode已同時收錄兩種寫法。二字皆形聲字。
人木.人大 人木.卜水 Unicode已同時收錄三種寫法。
人木.水
人.戈大火 人.月.竹火 Unicode已同時收錄兩種寫法。依字源,「」字從「」,牽着下方的「」字變體。Big5缺收者較正統。
人.一.月弓 人.一.月女 Unicode已同時收錄兩種寫法。依字源,「」字右下從「」不從「刂」,Big5缺收者較正統。
人弓.田人.廿 人弓.日.月廿 Unicode已同時收錄兩種寫法。香港用「」,台灣用「」。
心.十月金 心.心.月金 Unicode已同時收錄兩種寫法。依字源,「」字從「」在像鼎形物件之上,Big5缺收者較正統。
心大大 心大.心 Unicode已同時收錄兩種寫法。依字源,「」字從「」,形聲字,Big5缺收者較正統。
手.月.人山 手.月.人山 Unicode已同時收錄兩種寫法。依字源,「」字從「」,「」聲,不從「爪」,Big5收錄者較正統。
手.金.弓人 手.木木.火 Unicode已同時收錄兩種寫法。
手.戈大大 手.大水 Unicode已同時收錄兩種寫法。依字源,「」字從「」,「」聲,Big5收錄者較正統。
手.大山.尸 手.大弓.尸 Unicode已同時收錄兩種寫法。依字源,「」字從「」,Big5收錄者較正統。
手.中月山 手.一口.水 Unicode已同時收錄兩種寫法。
手中.口 土口.土.口 Unicode已同時收錄兩種寫法。二字在人名上不相通。
手一.月 手一.月中一 Unicode已同時收錄兩種寫法。依字源,「」字從「」(即「丹」字)不從「月」,Big5缺收者較正統。
手.山.人月 手.人土.尸 Unicode已同時收錄兩種寫法。依字源,「」字從「」,Big5收錄者較正統。
手.田人.廿 手.日.月廿 Unicode已同時收錄兩種寫法。香港用「」,台灣用「」。
口一.竹弓.木 口一.弓尸.木 Unicode已同時收錄兩種寫法。依字源,「」字上方象形,Big5收錄者較正統。
口一.竹人.人 口一.十.一火 Unicode已同時收錄兩種寫法。二字皆形聲字。
口一.卜中金 卜.卜中金 Unicode已同時收錄兩種寫法。二字皆形聲字。
口.心竹竹 月.心竹.口 Unicode已同時收錄兩種寫法。有人以「」字專指吻合義。
口.卜心.一 口.卜心.金 Unicode已同時收錄兩種寫法。此外,微軟「」字編碼有誤,詳見微軟倉頡的編碼訛誤一節。
尸.水.人土 水.尸人土 Unicode已同時收錄兩種寫法。依字源,「」字從「」,「」聲,Big5收錄者較正統。
尸火.田中.十 尸火.尸人 Unicode已同時收錄兩種寫法。二字皆形聲字,Big5收錄者較正統。「」爲日本漢字寫法。
尸竹.戈大大 尸竹.大水 Unicode已同時收錄兩種寫法。依字源,「」字從「」,「」聲,Big5收錄者較正統。
尸中.人 尸中.卜 Unicode已同時收錄兩種寫法。依字源,「」字從「」從「」,Big5收錄者較正統。
尸口.廿手 尸口.廿手 Unicode已同時收錄兩種寫法。香港用「」,台灣用「」。
廿.竹田.心 廿.心大.心 Unicode已同時收錄兩種寫法。二字皆形聲字。
廿.十大日 廿手月山 Unicode已同時收錄兩種寫法。在香港,著作、顯著義用「」字;接觸、感受、下子、策略等義,或動詞後,用「」,二字並非異體。在台灣,台標以「著」代「着」。
山.竹水.十 山.竹水.十 Unicode已同時收錄兩種寫法。兩種寫法的分別是部件擺放位置不同。
山.十金.金 山.心金.金 Unicode已同時收錄兩種寫法。依字源,「」字從「」在像鼎形物件之上,Big5缺收者較正統。
女火.竹日.水 女火.戈.戈 Unicode已同時收錄兩種寫法。依字源,兩字皆正確,無分正俗。
女火.中難 女火.竹木.尸 Unicode已同時收錄兩種寫法。依字源,皆形聲字。
女火.尸竹.山 女火.弓日山 Unicode已同時收錄兩種寫法。依字源,「」字從「」,不從「色」,Big5收錄者較正統。
女戈.戈大 女戈.大 Unicode已同時收錄兩種寫法。依字源,「」字從「」,Big5收錄者較正統。
女.一廿 女.一十.十 Unicode已同時收錄兩種寫法。依字源,「」字從「」不從「开」(「开」的字源爲「井」之省形),Big5缺收者較正統。
田木 廿.田木 Unicode已同時收錄兩種寫法。表示手製食物時,如「米菓」、「茶菓」、「粉菓」等,只能用「」字,而「果然」、「如果」等詞則只能用「」字,二字不一定是異體關係。
田.口 月.口山 Unicode已同時收錄三種寫法。
三代:田.卜卜中
五代:田.尸中
田.田田.一 水.水水.一 Unicode已同時收錄三種寫法。
日.日日.一
田中.人人人 竹廿.人竹人 Unicode已同時收錄兩種寫法。依字源,「」字從橫「」從三「」,Big5收錄者較正統。此外,微軟「」字編碼有誤,詳見微軟倉頡的編碼訛誤一節。
田中.尸手火 口口.尸手火 Unicode已同時收錄兩種寫法。依字源,「」字從「」(「网」的變形),Big5收錄者較正統。
卜.竹日 弓大.竹日 Unicode已同時收錄兩種寫法。依字源,「」字從「」,Big5收錄者較正統。
卜.中田 弓大.中田 Unicode已同時收錄兩種寫法。依字源,「」字從「」,Big5收錄者較正統。
卜心.廿一 卜心.廿金 Unicode已同時收錄兩種寫法。此外,微軟「」字編碼有誤,詳見微軟倉頡的編碼訛誤一節。
卜.女.女女 弓大.女.女女 Unicode已同時收錄兩種寫法。依字源,「」字從「」,Big5收錄者較正統。
卜.田口 弓大.田口 Unicode已同時收錄四種寫法。依字源,「」字從「」,Big5收錄者較正統。
三代:卜.田卜中
五代:卜.田尸中
三代:弓大.田卜中
五代:弓大.田尸中
卜.田口.木 卜.田口.火 Unicode已同時收錄兩種寫法。依字源,「」字從「」,Big5收錄者較正統。

Big5欠缺的常用字及香港字[编辑]

Big5內碼由台灣廠商製訂,除了缺乏異體字外,亦缺收一些常用字,尤其是香港地區常用的字,以及粵語用字。這些缺收的字,並無異體可以取代,因此早期在使用者造字區補充字元的「香港字集」甚爲流行,不同製作者的字集有不同編碼和收字,造成混亂。今天已以香港政府中諮會頒佈者取代之,並已過渡至Unicode。

下表擧出一些Big5缺收的常見字,及其倉頡編碼:

缺收字 標準編碼 微軟倉頡編碼 補充說明
日中 日中 用例如「曱甴」,即蟑螂。Unicode已收錄此字。
月.日弓.土 月.日弓.土 意指動物肝臟,用例如「豬膶」。Unicode已收錄此字。
月.竹木.弓 月.竹木.弓 意指舌頭,用例如「鴨脷洲」。Unicode已收錄此字。
月中一 月中一 意指日元。另外,它也是「丹」的異體。Unicode已收錄此字。
月山.卜口.中 月山.卜口.中 意指睡、睏,用例如「瞓覺」、「眼瞓」。Unicode已收錄此字。
金.一火 金.一火 一種放射性元素。Unicode已收錄此字。
金.一.尸山 金.一.尸山 意指鐲子,用例如「手鈪」。Unicode已收錄此字。
金.田人.中 金.田人.中 意指割,用例如「鎅刀」。Unicode已收錄此字。
木.月山山 木.月山山 意指皂,用例如「番梘」。Unicode已收錄此字。
木.卜.弓月 木.卜.弓月 一種樹,用例如「樋屋」。Unicode已收錄此字。
火木.廿.女戈 火木.廿.女戈 意指糰子,用例如「糯米糍」。Unicode已收錄此字。
火.廿田.女 火.廿田.女 意指燒焦,用例如「煲燶粥」。Unicode已收錄此字。
火.田 火.田 意指旱田,多用於日本人名、地名,例如「小畑健」。Unicode已收錄此字。
𤓓 火.田中.土 火.田中.土 意指嚴重燒焦,用例如「𤓓味」。Unicode已收錄此字。
火田.中.弓 火田.中.弓 意指大刀割開,用例如「劏魚肚」。Unicode已收錄此字。
土水.火 土水.水 意指熱燙,亦指生氣,用例如「天口㷫」、「又紅又㷫」。Unicode已收錄此字。
土口.中.弓 土口.中.弓 意指刺、插,用例如「將針筒㓤入皮膚」。Unicode已收錄此字。
土.卜中竹 土.卜中竹 意指碼頭,由「埠」字轉注而來,但粵音只讀「bou6」或「bou2」不讀「fau6」(上述拼音爲粵拼)。用例如「深水埗」。Unicode已收錄此字。
竹弓.卜中一 竹弓.卜中一 意指無風、風不吹動,多用於日本人名,例如「三千院凪」。Unicode已收錄此字。
竹.心廿 竹.心廿 意指細竹,多用於日本人名、地名,例如「笹瀨川佐佐美」。Unicode已收錄此字。
十水.大尸 十水.大尸 意指疲累,用例如「攰到死」。Unicode已收錄此字。
十十.大戈 十十.大戈 意指汽車的舵,用例如「軚盤」。Unicode已收錄此字。
𨋢 十十.卜廿 十十.卜廿 意指升降機,用例如「傷健人士專用𨋢」。Unicode已收錄此字。
中日 中日 用例如「曱甴」,即蟑螂。Unicode已收錄此字。
中.竹月廿 中.竹月廿 意指襯衫,用例如「裇衫」。Unicode已收錄此字。
一土.卜大 一土.卜大 意指玉的紋理,又指玫瑰,亦作「珉」的異體指像玉的石頭。多用於人名,例如「李玟」。Unicode已收錄此字。
一口.弓 一口.弓 意指小石,多用於韓國人名,例如「李世乭」。Unicode已收錄此字。
弓木.月山金 弓木.月山金 意指揹,用例如「孭書包」。Unicode已收錄此字。
弓.水 弓.水 意指水窪,用例如「氹仔」。Unicode已收錄此字。
弓火.月金.弓 弓火.月金.弓 一種魚,用例如「鰂魚涌」。Unicode已收錄此字。
弓火.中田 弓火.中田 一種魚,用例如「紅鮋」。Unicode已收錄此字。
弓火.弓木.廿 弓火.弓木.廿 一種魚,用例如「泥鯭」。Unicode已收錄此字。
弓火.人.戈口 弓火.人.戈口 一種魚,用例如「食人䱽」。Unicode已收錄此字。
弓火.女女女 弓火.女女女 一種魚,用例如「赤鱲角」。Unicode已收錄此字。
人.竹土.尸 人.竹土.尸 意指勞動。Unicode已收錄此字。
人戈.卜.廿大 人戈.卜.廿大 意指菜式,用例如「煮餸」。Unicode已收錄此字。
心木.田卜戈 心木.田卜戈 意指雌性,用例如「雞乸」。Unicode已收錄此字。
手.日月.廿 手.日月.廿 意指拔,用例如「擝雜草」、「將聖劍擝出來」。Unicode已收錄此字。
手.木.日一;
手.木.月一
手.木.日一;
手.木.月一
意指拿着,用例如「揸住酒杯」。Unicode已收錄此字。此字右旁可作「」或「」,因此有兩種編碼。
手.十金.人 手.十金.人 意指抓,用例如「搲損皮膚」。Unicode已收錄此字。
𢱕 手.大.尸十 手.大.尸十 意指搥,用例如「𢱕釘」。Unicode已收錄此字。
手.弓木.廿 手.弓木.廿 意指拉拽,用例如「掹掹扯扯」、「掹車邊」。Unicode已收錄此字。
手.田中.土 手.田中.土 意指拿,用例如「攞住食物」。Unicode已收錄此字。
口.日戈.山 口.日戈.山;
口.竹心山
意指的,用例如「我嘅食物」。Unicode已收錄此字。此字右旁可作「」或「」,因此有兩種編碼。
口.金中 口.金中 助語詞。Unicode已收錄此字。
口.土土.卜 口.土土.卜 助語詞,表示不肯定。Unicode已收錄此字。
口.十大日 口.十大日 用例如「啫喱」,即果凍。又助語詞。Unicode已收錄此字。
口.土.心木 口.土.心木 用於代詞後,意指們,由文言「等」字演化成,用例如「我哋」。Unicode已收錄此字。
口.竹日.戈 口.竹日.戈 意指一些,用例如「啲蛋糕」。Unicode已收錄此字。
口.竹月.口 口.竹月.口 意指在,用例如「响棵樹下面」。Unicode已收錄此字。
口.竹大.心;
口.一大.心
口.竹大.心;
口.一大.心
助語詞。Unicode已收錄此字。
口.十.竹心 口.十.竹心 擬聲詞,又指驚諤,又爲「吒」異體。Unicode已收錄此字。
口.大一 口.大一 用於動詞後,意指了,即過去式,用例如「食咗飯」。Unicode已收錄此字。
口.大口.木 口.大口.木 助語詞。Unicode已收錄此字。
口一.一火.口 口一.一火.口 意指蹲,用例如「踎天橋底」。Unicode已收錄此字。
口一.月.尸木 口一.月.尸木;
口一.弓.尸木
意指腳跟,用例如「高踭鞋」。Unicode已收錄此字。此字右旁可作「」或「」,因此有兩種編碼。
口一.田十.金 口一.田十.金 意指摔交跌倒,用例如「躀低」。Unicode已收錄此字。
口.人.竹火 口.人.竹火 意指在,用例如「喺棵樹下面」。Unicode已收錄此字。
口.弓一.心 口.弓尸.心 意指手提公事包,用例如「皮喼」。Unicode已收錄此字。此字右旁取碼有爭議,詳見編碼據形與台標字形的差異的「急」字註釋。
三代:口.人.一一
五代:口.人口.一
口.人.一一;
口.人口.一
意指說話,帶貶義,用例如「亂噏」。Unicode已收錄此字。
三代:口.人.一手
五代:口.人口.手
口.人.一手 助語詞。Unicode已收錄此字。
口.人.田口 口.人.田口 意指那裏、那個,用例如「嗰個人」、「嗰年」。Unicode已收錄此字。
口.心木 口.心木 助語詞或擬聲詞。Unicode已收錄此字。
口.廿十.尸 口.廿十.尸 助語詞。Unicode已收錄此字。
口.廿.人難 口.廿.人難 量詞,用例如「一嚿飯」。Unicode已收錄此字。
口.山.一口 口.山.一口 意指正確、匹配,用例如「啱音」。Unicode已收錄此字。
口.田土.弓 口.田土.弓 意指東西、物件,用例如「嗰件嘢」。Unicode已收錄此字。
口.竹人.人 口.竹人.人 意指浪費,用例如「嘥錢」。Unicode已收錄此字。
女.戈.十金 金.戈.木木 意指祖母,用例如「嫲嫲」。Unicode已收錄此字。此字右旁取碼有爭議,詳見編碼據形與台標字形的差異的「麻」字註釋。
𠝹 田中.中.弓 田中.中.弓 「鎅」的異體字,見本表「鎅」字的解釋。Unicode已收錄此字。

編碼據形與台標字形的差異[编辑]

倉頡輸入法發展較早,1977年,朱邦復發表第一代倉頡。1982年,發表改良後的第三代倉頡,選《康熙字典》中之四萬字爲取碼範圍。朱邦復所依據的字形,是當時社會上的通行楷書寫法。這種寫法也是不同地域的上一輩華人,通行已久的習慣字形。然而,1982年,台灣敎育部公佈國字標準字體(下稱「台標」),成爲台灣的字形標準,這新字形標準把明體(宋體)等印刷字形改成楷書式的新字形,引來爭議,部份漢字的字形變成台灣獨門寫法。此標準之後經過數次小幅修改。

因此,公佈得較早的倉頡輸入法,有些字取碼所據字形,與後來台灣敎育部公佈的國字標準字體不同,是正常的事。可是,目前微軟Windows的系統內建字形,包括微軟正黑體標楷體新版本的新細明體,都盡量以台標字形爲準。就連其他作業系統字形,如思源黑體的正體中文版,也盡量貼近台標寫法。結果,這就做成了系統字形與取碼據形不一致,使用者取碼時必須留意。

有些學習者還是不明白這件事。我們就以竹水)爲例,情況大致如下:

  1. 朱邦復依據早期的字體或習慣寫法,編碼爲「竹水」,他們設計的字形產生器產生的字體結構約相似於「」。
  2. 後來台灣敎育部公佈新的標準字體。新的電腦系統字體中,只有新細明體「」和標楷體「」的字樣。
  3. 後來的系統設計者,可能沒注意到字體的變化會影響倉頡輸入法的取碼,也可能因其他因素不便更改字體(修改新細明體與標楷體,使之符合相應的倉頡編碼)或更改編碼(把「竹水」改爲「一水」,使之符合新的字體)。
  4. 結果,現在系統的呈現字形是「」,看起來編碼應該是「一水」,但實際編碼卻爲拆解「」這個寫法的「竹水」。

下表依微軟倉頡編碼排序,擧出一些編碼與字形差異的字例:

台標形 依台標形編碼 取碼形 微軟倉頡編碼 五代倉頡編碼 補充說明
月山.女一弓 Cjvk-buvml.png 月山.女一中 月山.女一中;
月山.女一弓
依字源,兩者都是「鼎」的象形,無分正俗。香港用「Cjvk-buvml.png」,台灣用「」。
水.竹.人月 水.人.中月 水.竹.人月 」是「」的訛字,部份早期系統只收其一,後來才加收另一字,結果造成字樣顯示與編碼取形不一。倚天系統中,二字皆依台標字編碼,並無微軟之問題。
水.人.中月 水.人.中月 水.人.中月
一水 竹水 竹水 同類字有:「」等。但「」來自日語,日本所有字體右旁皆書如「」,微軟倉頡編碼作「土.一水」,五代倉頡仍統一作「土.竹水」。蒼頡檢字法同時支援兩種寫法。依字源,「」字從「」從「」,拆作「一水」者爲正。
一土戈 竹土戈 一土戈 Big5只有「」字,「」字爲後來Unicode加收,結果造成字樣顯示與編碼取形不一。五代倉頡「」取「一土戈」,「」取「竹土戈」。此外,「」也是Unicode加收,但微軟倉頡、五代倉頡都只取「金.竹土戈」。依字源,「」字從「」從「」,拆作「一土戈」者爲正。
一十竹難 竹十竹難 竹十竹難 同類字有「」等。依字源,「」字從「」從「」,拆作「一十竹難」者爲正。
一十口 竹十口 竹十口 同類字有「」等。依字源,「」以拆作「一十口」者爲正。它與「」等字所從之「」(即「𠯑」的異體)不同,這些字的「」偏旁只能取「竹十口」,不能寫作「」。
一大.心 Cjvk-hkp.png 竹大.心 一大.心;
竹大.心
同類字有「」等。依字源,「」字從「」,「」聲,拆作「一大心」者爲正。
一大.口 竹大.口 一大.口 同類字有「」等,皆爲Big5所無。這些Unicode加收字,其右旁的「」,微軟都取「一大.口」而不取「竹大.口」。依字源,「」字從「」,「」聲,拆作「一大口」者爲正。
三代:竹難.卜心.女
五代:竹難.尸女.女
竹難.女卜.女 竹難.女卜.女 同類字有「」等。依字源,兩者皆鼠腳象形,無分正俗。
戈.十金.金 戈.十金.金 戈.十金.金;
戈.木.木
同類字有:「」等。微軟倉頡中,除「」作「戈.十金.金」外,其他字以「麻」作字首時,皆取「戈木」,令人莫衷一是。五代倉頡同時支援兩種寫法。依字源,「」不從「林」,以取「戈十金金」者爲正。
戈金.女戈 戈木.女戈 戈金.女戈;
戈木.女戈
十水.一田中 Cjvk-jnmwl.png 十弓.一田中 十水.一田中 Big5原收錄者,有「」等字。Unicode加收者,有「」等字。初時在微軟倉頡,對於Unicode加收者,字首皆取「十水」,後來才加入「十弓」作容錯碼。Big5原收錄者則只能取「十弓」,不能取「十水」。
十水.一中尸 Cjvk-jnmls.png 十弓.一中.尸;
十水.一中尸
十水.一中尸
十人.竹水 Cjvk-joni.png 十人.弓戈 十人.竹水;
十人.弓戈
依字源,「Cjvk-dohe.png」字上方從「」,下方從「」(或說從「夊」,但「夊」爲「夂」的篆變,故字源歸「夂」)。據之當取「木人竹水」(視作組合字)或「木人人水」(視作整體字)。但只有蒼頡檢字法,才增添了對從「來」的整體字之支援。
大.中田女 大.中田山 大.中田山 同類字有:「」等。蒼頡檢字法同時支援兩種寫法。
中中一弓 Cjvk-llml.png 中中一中 中中一弓;
中中一中
同類字有「」等。
一土.竹水 一土.人大 一土.竹水;
一土.人大
五代倉頡同時支援兩種寫法。依字源,「」之右半應爲「」(「竹水」)而非「」(「人大」)。
一水月 一中月卜 一中月卜 五代新增了「水」的輔助字形「Cjr5k-e1.png」,若依楷體寫法,推論上「Cjr5k-e2.png」形也應適用,但後者並沒實際應用在五代編碼中。直至蒼頡檢字法才同時支援兩種拆法。
一大.心 一弓.心 一弓.心 Cjvk-mnk.png」字依形應取「一.弓大」,「Cjrk-n10.png」不適用包含省略原則,作字首時應爲「一大」。微軟編碼採用「」之寫法,取「一.竹弓戈」,包含省略原則在此形適用,作字首時則是「一弓」。同類字有:「」等。蒼頡檢字法同時支援兩種寫法。依字源,「Cjvk-mnk.png」不從「凡」,以取「一弓大」者爲正。
弓一.心 弓尸.心 弓一.心;
弓尸.心
中橫穿頭者,包含省略原則不適用,故字首的尾碼是「一」。中橫不穿頭者,套用包含省略原則,字首的尾碼取「尸」。五代倉頡同時支援兩種寫法。依字源,「」中間是一隻手,如「」之頂部,以中橫穿頭者爲正。
人.一.日口 人.戈.日口 人.戈.日口 同類字有:「」等。但「」等字則取「人.一」開頭。判斷方式是:如果「一」之後的筆劃爲左向右的橫筆,書寫時常因手順將「一」寫成「丶」,因此取碼爲「人戈」;其餘則爲「人一」。有些字爲後來Unicode加收,編碼則爲「人一」,如「」等。
人女.尸中 人一.尸中 人一.尸中 同類字有:「」等。依字源,「」字從「」,以底橫向左出頭者爲正。
人.口.竹女 人.口.竹山 人.口.竹山 同類字有:「」等。蒼頡檢字法同時支援兩種寫法。
心.一一 心.戈一 心.一一 同類字有「」等。「」字爲後來Unicode加收,微軟的拆法是誤解了「卜」的輔助字形,並不可取,詳見微軟倉頡的編碼訛誤一節。作偏旁時,五代倉頡同時支援兩種寫法(除了本身是簡化字的「」字,這字只支援簡化字形,拆作「人心.心戈一」);獨用時,五代倉頡「」取「心.一一」,「」取「心.戈一」。依字源,從「一一」者較吻合古形。
心.戈一 心.卜 心.戈一
手.火月竹 手.火月手 手.火月竹 Big5只有「」字,「」字爲後來Unicode加收,結果造成字樣顯示與編碼取形不一。
手.火月手 手.火月手 手.火月手
手.日.土 手.竹難.一 手.日.土 Big5只有「」字,「」字爲後來Unicode加收,結果造成字樣顯示與編碼取形不一。
手.竹難.一 手.竹難.一 手.竹難.一
三代:手一.田十
五代:手一.田十竹
手一.田卜戈 手一.田卜戈 有些版本的五代倉頡還支援「手一.田十」和「手一.田十竹」,作異體容錯碼。
廿一田金 廿一田金 廿一中金 微軟倉頡依台標字形「」,五代倉頡則依傳承寫法「」。台標編製者稱,其寫法是依《說文》解釋,「田」的中豎上方不穿頭。可是《說文》的解釋不符本身的篆形,亦已被文字學界公認是錯誤的。台標字形成爲台灣的獨門寫法,不適用於其他使用漢字的地區[1]
廿竹.一 廿手.一 廿手.一 同類字有:「」等。有些版本的五代倉頡還支援「廿竹.一」,作異體容錯碼。
大戈.月 卜戈.月 卜戈.月 同類字有:「」等。台標編製者稱,「」字頂部爲倒轉的「子」字,因此要以三筆寫完。但根據多部經典字書,「」字都收在肉部的四畫字中,而相傳多年的彫版書籍和碑帖,書家或刻版家都把這部件寫作四筆。台標字形成爲台灣的獨門寫法,不適用於其他使用漢字的地區[2]
卜大.一.竹竹 卜竹.竹竹竹 卜大.一.竹竹 Big5只有「」字,「」字爲後來Unicode加收,結果造成字樣顯示與編碼取形不一。微軟對「」字的拆法,是把它誤當成整體字,並不可取,詳見微軟倉頡的編碼訛誤一節。依字源,「」之上方應爲「」。
卜竹.竹.竹竹 卜廿竹竹 卜竹.竹竹竹
三代:卜口.月.月大
五代:卜大.月山金
卜口.月.月弓 卜弓.月山金 」字右下角爲「Cjvk-nk.png」,依形應取「弓大」,「Cjrk-n10.png」不適用包含省略原則,尾碼應取「大」。然而,微軟編碼採用「」之寫法,右下作「」,取「竹弓戈」,包含省略原則在此形適用,尾碼取「」。同類字有:「」等。蒼頡檢字法同時支援兩種寫法。依字源,「𦝠」不從「凡」,以取「卜大」者爲正。
卜口.卜大.竹 卜口.卜竹.竹 卜口.卜大.竹;
卜口.卜竹.竹
同類字有「」等。有些字爲後來Unicode加收,這些字的字身,微軟編碼爲符合台標寫法的「卜大.竹」,如卜.卜大.竹)。
卜大.一.竹一 卜竹.竹手一 卜大.一.竹一 Big5只有「」字,「」字爲後來Unicode加收,結果造成字樣顯示與編碼取形不一。微軟對「」字的拆法,是把它誤當成整體字,並不可取,詳見微軟倉頡的編碼訛誤一節。依字源,「」之上方應爲「」。
卜竹.竹手一 卜廿竹一 卜竹.竹手一
金.卜大.一 金.卜竹.一 金.卜大.一;
金.卜竹.一
同類字有「」等。有些字爲後來Unicode加收,這些字的字身,微軟編碼爲符合台標寫法的「卜大.一」,如手.卜大.一)」。
卜戈.中田人 卜戈.竹難人 卜戈.中田人 Big5只有「」字,「」字爲後來Unicode加收,結果造成字樣顯示與編碼取形不一。
卜戈.竹難人 卜戈.竹難人 卜戈.竹難人

微軟倉頡的編碼訛誤[编辑]

由於Windows爲目前中文電腦之主流作業系統,連帶其內建的中文輸入法也被最多人使用。今日所稱的「倉頡輸入法」、「三代倉頡」、「微軟倉頡」多是指Windows系統內建的倉頡輸入法。但事實上,Windows系統的倉頡輸入法編碼,有部份並不標準

早期正體中文版本的微軟Windows系統,使用收納字數較少的Big5作內碼。這一萬三千字的倉頡碼,微軟基本上都依照朱邦復所公佈的編碼,比較準確。然而,1990年代初,微軟因Windows中文化版本問題,與朱邦復的合作關係破裂,微軟在Windows 2000以後的版本,開始支援Unicode時,就自行擴充非Big5字(多爲簡化字及罕用字)的倉頡編碼。這些編碼的釐定,並沒有與朱邦復合作,是微軟人員自行編成的。可是,可能因編碼者不清楚編碼規則,或缺乏查對,造成某些字編碼錯誤,不符合原先的(理論上的)編碼規律。

下表依微軟倉頡編碼排序,擧出一些編碼訛誤的字例:

例字 三代理論編碼 微軟倉頡編碼 補充說明
日.廿.中大 日.廿.大月 違反「中月大)」字的拆碼,詳見特殊字規則。
月山.中月大 月山.大月 違反「中月大)」字的拆碼,詳見特殊字規則。
月月.尸一.竹 月月.尸卜.竹 誤把「Cjwk-im.png」當成是「卜」的輔助字形。實際上,「Cjwk-im.png」應拆作「戈一」。
金.竹木.尸 金.竹木.竹 違反「弓竹尸)」字的拆碼。「」爲「」的異體字。
人心.尸一.竹 人心.尸卜.竹 誤把「Cjwk-im.png」當成是「卜」的輔助字形。但其繁體字「鏐」卻編碼正確,取「金.尸一竹」。
金.廿.中大 金.廿.大月 違反「中月大)」字的拆碼。
𨭱 金.十戈.土 金.土戈.土 違反「𢦏十戈)」的拆碼。詳見區塊分則中的「哉」字例。
木.廿.中大 木.廿.大月 違反「中月大)」字的拆碼。
火.尸一.竹 火.尸卜.竹 誤把「Cjwk-im.png」當成是「卜」的輔助字形。
竹廿.人竹人 竹月廿人 錯誤分割字形。這字可拆作字首「」和字身「」,微軟編碼者卻誤當它是整體字。詳見漢字分割規則。
竹女.月山山 竹女.月山 違反「月山竹山)」字的拆碼。
竹田.土廿十 竹田.土廿戈 疑爲手民之誤,在設定尾碼的編碼時按錯鍵。
戈戈一 戈卜 誤把「Cjwk-im.png」當成是「卜」的輔助字形。
一土.口女心 一土.口山心 誤把「女」的輔助字形「Cjrk-v7.png」當成是「山」的輔助字形。只有原本寫作「Cjrk-u2.png」,但因書法美觀而讓右屈鉤寫作「Cjrk-u5.png」的筆畫才會取「山」。
人.戈.弓戈 人弓.一一戈 錯誤分割字形。這字屬多層形,字首爲「Cjrk-o3.png」,次字首爲「Cjrk-i1.png」,其餘部份爲次字身。微軟編碼者卻誤當「」是字首。詳見漢字分割規則。
人.卜廿竹 人.卜竹.竹 錯誤分割字形。這字的字身「」可再拆作次字首「」和次字身「」。微軟編碼者卻誤當「」是整體字。詳見漢字分割規則。
心戈一 心卜 誤把「Cjwk-im.png」當成是「卜」的輔助字形。微軟另收異體「」字,但編碼也有問題,見編碼字形差異
口一.尸一.竹 口一.尸卜.竹 誤把「Cjwk-im.png」當成是「卜」的輔助字形。
口.卜心.金 口.卜心.一 誤把「Cjwk-llc.png」當成是「廿」的輔助字形。見下方「」字。
尸火.中月大 尸火.大月 違反「中月大)」字的拆碼,詳見特殊字規則。
廿.竹女心 廿.竹山心 誤把「女」的輔助字形「Cjrk-v7.png」當成是「山」的輔助字形。
廿中.一十 中一卜手 此字有許多異體字,微軟收了「」(中一卜手)、「」(廿手)二字;倉頡系統則收了「」(廿中.手)、「」(廿中.一十)、「」(廿手)等。由於「Cjrk-t6.png」是「廿」的輔助字形,不論怎麼寫,都不可以拆作「中一卜」,否則就違反了精簡原則
女.口女心 女.口山心 誤把「女」的輔助字形「Cjrk-v7.png」當成是「山」的輔助字形。
女.廿中大 女.廿大月 違反「中月大)」字的拆碼。
田.口女心 田.口山心 誤把「女」的輔助字形「Cjrk-v7.png」當成是「山」的輔助字形。
田.尸一.竹 田.尸卜.竹 誤把「Cjwk-im.png」當成是「卜」的輔助字形。
田卜卜中 田尸中 誤用五代倉頡編碼。在三代倉頡中,「Cjr5k-s1.png」應拆成「卜卜」。它在五代倉頡裏才新增作「尸」的輔根。
戈一.木大 卜.木大;
戈一.木大
誤把「Cjwk-im.png」當成是「卜」的輔助字形。
戈一.土.田金 卜.土.田金;
戈一.土.田金
誤把「Cjwk-im.png」當成是「卜」的輔助字形。
戈一.戈竹.口 卜.戈竹.口;
戈一.戈竹.口
誤把「Cjwk-im.png」當成是「卜」的輔助字形。
戈一.中 卜.中;
戈一.中
誤把「Cjwk-im.png」當成是「卜」的輔助字形。
戈一.一田木 卜.一田木;
戈一.一田木
誤把「Cjwk-im.png」當成是「卜」的輔助字形。
卜心.廿金 卜心.廿一 誤把「Cjwk-llc.png」當成是「廿」的輔助字形。事實上,只有「Cjrk-t10.png」才是「廿」的輔助字形。「」應拆「廿金」。
戈一.手大.大 卜.手大.大;
戈一.手大.大
誤把「Cjwk-im.png」當成是「卜」的輔助字形。
戈一.口竹山 卜.口竹山;
戈一.口竹山
誤把「Cjwk-im.png」當成是「卜」的輔助字形。
卜尸.人.卜人 卜尸.卜.人人 Cjrk-o6.png」部件移了位。
卜竹.竹.竹竹 卜廿竹竹 錯誤分割字形。這字可拆作字首「」和字身「」,微軟編碼者卻誤當它是整體字。詳見漢字分割規則。微軟另收異體「」字,但編碼也有問題,見編碼字形差異
卜竹.竹手一 卜廿竹一 錯誤分割字形。這字可拆作字首「」和字身「」,微軟編碼者卻誤當它是整體字。詳見漢字分割規則。微軟另收異體「」字,但編碼也有問題,見編碼字形差異
戈一.卜.口火 卜.卜.口火;
戈一.卜.口火
誤把「Cjwk-im.png」當成是「卜」的輔助字形。
戈一.卜.田火 卜.卜.田火;
戈一.卜.田火
誤把「Cjwk-im.png」當成是「卜」的輔助字形。

簡化字的編碼[编辑]

簡化字的編碼規則,原則上和正體字相同。但早期的中文作業系統大都分開正、簡版本,當時的正、簡漢字是各自編碼的。坊間最普及的三代倉頡,公佈於1982年,當時朱邦復選《康熙字典》中之四萬字爲取碼範圍,這版本只有編入正體字。直至五代倉頡,才正式把正、簡兩種字合併在一起編碼,並對外公佈。

同一個漢字,有正、簡異寫者,五代倉頡都盡量支援兩種寫法。比如「麻」字,不管使用者以正體字標準「」,取「戈十金金」,還是以簡化字標準「」,取「戈木木」,都能輸入正確的字。想用標準倉頡編碼輸入簡化字的使用者,應選擇使用五代倉頡編碼的輸入法。

而微軟本來使用三代倉頡。在Windows擴充至支援Unicode字集時,微軟的人員自行對簡化字編碼,因此規則較爲混亂,甚至有不少錯訛的編碼。此外,微軟也沒有爲正簡不同寫法的字,添加依據簡化字形的取碼。這令簡化字用戶根據簡化字形拆字時常常碰釘。

微軟的簡化字編碼訛誤[编辑]

下表依微軟倉頡編碼排序,擧出一些較不易理解的簡化字的編碼:

例字 五代編碼 微軟編碼 補充說明
人.一心 金;
人.一心
微軟的「」字首,多爲「人心」和「」兩者皆有。可是,事實上「」並不是「金」的輔助字形,作字首時理應只能取「人心」。發明人朱邦復解釋,不把「」視作「金」的輔助字形,是因爲要避免正、簡字經常重碼。許多金旁的字,簡化了的就只有這字首。要是每次輸入時,都變成重碼,將帶來許多不便。
人心.日心竹 金.日心竹;
人心.日心竹
戈女大水 火大水;
戈女大水
」只有五畫,筆畫「Cjrk-v3.png」在轉角處沒有斷開作兩筆。將其上方看作「Cjrk-f5.png」而取「火大水」並不合理,違反了轉角分則
水.戈女水 水.女戈水 字身「」的點筆在右上角,應當視爲位於最高位置,要先取這一點,不可以先取「Cjrk-v3.png」。同類字有:「」等。微軟編碼違反了拆字取碼時要注意的地方
火.大女金 火.手木 所取的字根爲「Cjrk-f1.png.Cjrk-k2.pngCjrk-v3.pngCjrk-c4.png」。字身部份若獨立拆碼,全取是「Cjrk-k2.pngCjrk-v3.pngCjrk-s3.pngCjrk-c4.png」,唯作字身時第三碼省略。同類字有:「」等。微軟編碼違反了轉角分則,在「Cjrk-s3.png」的轉角位斷開。
火月.弓木 戈月.弓木 Cjrk-f4.png」應一次過取,不應拆作「Cjrk-i1.pngCjrk-i1.pngCjrk-h3.png」。微軟編碼違反精簡原則
戈木尸 戈木木;
戈木尸
「木」的輔助字形「Cjrk-d5.png」和「Cjrk-d6.png」後無鉤,故「戈木木」這編碼並不合理。
戈大尸戈 戈大尸戈;
戈大弓戈
「戈大弓戈」編碼違反了轉角分則,在「Cjrk-s4.png」的轉角位斷開。
戈十 戈一 同類字有:「线」等。微軟編碼違反了特殊字原則。
戈.弓女 戈.弓 微軟的「」字首編碼不統一,有作「戈弓」,或作「戈山」,或二者皆有,但皆爲錯誤拆法。「」的第二筆並非「弓」的輔助字形,要拆成「弓女」 (Cjrk-n11.png.Cjrk-v8.png) 才正確。同時,這偏旁的寫法已被規定,本身就是以「Cjrk-v8.png」結尾,它不是讓右屈鉤而成,並沒有尾部作「Cjrk-u2.png」的寫法,因此不能視爲「山」的輔助字形。
戈女.人 戈弓.人;
戈山.人
中戈尸;
中尸
中尸;
心人
」曾被視作複合字,取首尾碼「中尸」。後來統一編碼,廢除其複合字地位,全字由左至右取「中戈尸」,但作字首時只取首尾碼,因此仍爲「中尸」。微軟編碼不統一,有作「中尸」,或「戈尸」,或二者皆有。同類字有:「」等。這個系列有很多錯碼,尤其是「戈尸」爲字首的字,如:心人)、戈尸)、戈尸一)、戈尸人)、戈尸一一一)、戈尸一十)、戈尸木竹)、戈尸口)……好像在編碼表上,字碼與對應的字被人移了位似的。相較之下,取「中尸」者多爲正常,但還是有錯誤,如「中尸木竹)」。
中尸.日 中尸.日;
戈尸.日
尸一 弓尸.一 五代加了一個輔助字型「Cjr5k-s2.png」去處理「」字。若沒有此輔助字形,理應作爲整體字,拆爲「弓女尸一」。微軟卻視作組合字,並不妥當。
尸一.十心 弓一.十心
心人 心人;
人心卜口女
所取的字根爲「Cjrk-p12.pngCjrk-o9.png」。同類字有「」等。而「人心卜口女」應是「」的編碼。
中戈一 卜中;
戈一中
同類字有:「」等。「」的豎筆最高,根據「由上至下,由左至右」原則,應先取較高者,故取「中戈一」才正確。
中一.土 卜中.土

微軟欠收的簡化字形取碼[编辑]

由於微軟沒有爲正、簡異寫字添加依據簡化字形的取碼,簡化字使用者在使用微軟倉頡時,得依據正體字的常見寫法,才能輸入該漢字。使用者如果想依中國大陸的規範字形拆碼,應選擇使用五代倉頡編碼的輸入法,不要用微軟倉頡。

下表依微軟倉頡編碼排序,擧出一些微軟欠收的簡化字形取碼:

陸規形 依陸規形編碼 取碼形 微軟倉頡編碼 五代倉頡編碼 補充說明
廿大 Cjvk-cmk.png 金一大 廿大 其他從「」的字,如「」等,並無同類問題,它們的「」偏旁都取「廿大」。
沿 水.竹弓.口 沿 水.金口 水.金口;
水.竹弓.口
同類字有:「」等。五代倉頡同時支援兩種寫法。依字源,「」字上方示意被水沖毀,不從「几」。
土.月.一弓 土.月.竹弓 土.月.竹弓 「殼」在「几」部件上應有一橫。但簡化字除了砍掉右旁外,還把那一橫偷走了。
土人.尸山 土人.口山 土人.口山;
土人.尸山
兩種寫法的分別是形聲字的聲旁不同。
手尸.人大 土尸.人大 土尸.人大;
手尸.人大
同類字有:「」等。五代倉頡同時支援兩種寫法。
竹水.卜 竹水.人 竹水.人;
竹水.卜
同類字有:「」等。五代倉頡同時支援兩種寫法。依字源,「」和「」字從「」爲正。
竹.一.竹弓 竹.一.弓十 竹.一.弓十;
竹.一.竹弓
依字源,「」字爲正。
竹心.戈 竹心.一 竹心.一;
竹心.戈
同類字有:「」等。五代倉頡同時支援兩種寫法。依字源,「」字下從「」爲正。
戈尸.卜竹尸 竹尸.卜竹尸 竹尸.卜竹尸;
戈尸.卜竹尸
同類字有:「」等。五代倉頡同時支援兩種寫法。依字源,「」是象形字,傳統正體字寫法較存古形。
戈.木.木 戈.十金.金 戈.十金.金;
戈.木.木
同類字有:「」等。五代倉頡同時支援兩種寫法。依字源,「」字不從「木」,以傳統正體字寫法爲正。
戈大水 戈大大 戈大大;
戈大水
同類字有:「」等。五代倉頡同時支援兩種寫法。依字源,「」字從「」不從「友」,以傳統正體字寫法爲正。
十金.竹田.水 十金.竹田.大 十金.竹田.大;
十金.竹田.水
五代倉頡同時支援兩種寫法。依字源,「」字像窗框與窗花之形,傳統正體字寫法較存古形。
大木.竹弓.水 大金.竹弓.水 大金.竹弓.水;
大木.竹弓.水
同類字有:「」等。五代倉頡同時支援兩種寫法。依字源,「」字從「」。
弓月手 弓月土 弓月土;
弓月手
同類字有:「」等。五代倉頡同時支援兩種寫法。依字源,「」是象形字,以傳統正體字寫法較存古形。
弓大.竹卜女 弓大.竹卜一 弓大.竹卜一;
弓大.竹卜女
同類字有:「」等。五代倉頡同時支援兩種寫法。依字源,「」字從「」,以底橫向左出頭者爲正。
手.口.大尸 手.口.尸竹 手.口.尸竹;
手.口.大尸
五代倉頡同時支援兩種寫法。依字源,「」字不從「另」。
口.一土 口.竹土 口.竹土;
口.一土
同類字有:「」等。五代倉頡同時支援兩種寫法。依字源,「」字從「𡈼」,以傳統正體字寫法爲正。
尸口.一土 尸口.竹土 尸口.竹土;
尸口.一土
同類字有:「」等。五代倉頡同時支援兩種寫法。依字源,「」字從「𡈼」,以傳統正體字寫法爲正。
山.大.火 山.一.火 山.一.火;
山.大.火
同類字有:「」等。五代倉頡同時支援兩種寫法。依字源,「」字從「」從「」,不從「灰」。
卜月.一土 卜月.竹土 卜月.竹土;
卜月.一土
五代倉頡同時支援兩種寫法。依字源,「」字從「𡈼」,以傳統正體字寫法爲正。
卜.戈木 卜.戈十金 卜.戈十金;
卜.戈木
同類字有:「」等。五代倉頡同時支援兩種寫法。依字源,「」字不從「木」,以傳統正體字寫法爲正。
卜心.竹弓 卜心.竹山 卜心.竹山;
卜心.竹弓
同類字有:「」等。五代倉頡同時支援兩種寫法。依字源,「」字從「」,以傳統正體字寫法爲正。
卜.口.月弓 卜.口.月山 卜.口.月山;
卜.口.月弓
同類字有:「」等。五代倉頡同時支援兩種寫法。依字源,「」字從「」,以傳統正體字寫法爲正。

附註[编辑]

  1. 《漢典》「黃」字字形對比,不論中國大陸、香港、韓國乃至《康熙》傳承字形,都寫作取「廿一中金」之形。
  2. 《漢典》「育」字字形對比,不論中國大陸、香港、日本、韓國乃至《康熙》傳承字形,都寫作取「卜戈」之形。

返回[编辑]

按此返回本敎科書目錄