討論:倉頡輸入法

維基教科書,自由的教學讀本
跳到: 導覽搜尋

待加強部分[編輯]

  • 【倉頡字母與輔助字形】:重新挑選例字,並用顏色標出例字上的字根。
    • 例字選取原則為:1.具有代表性,能反映該字根的特色。2.盡量選常用字。3.除該字根外,其他部分應盡量簡單。
  • 【取碼原則】:字形特徵原則重新挑選例字,並調整格式,仿照包含省略的例字說明形式呈現。
  • 【例外字】:特殊字的部分改寫。
  • 【特別注意】:擴充更多字。字形差異的部分,例字改用圖片,用顏色標出主要的差異之處。
  • 【難拆字綜合辨析】擴充。

--ceku 2008年9月23日 (二) 12:20 (UTC)

【特別注意】一段編輯討論[編輯]

雖然當初是有將這部分留在維基百科的打算,但隨着教科書的完善,在下現在認為還是一併放在教科書較好,只須在百科那邊加上一段引言即可。

這部分在教科書本有其他的編寫想法,但網友熱心地在百科那部分做了不少修訂,暫時將之移到此處,做為日後修改的參考。

在下的想法是,「特別注意」一段的讀者應是設定在已對倉頡輸入法的編碼規則有足夠瞭解的人士,沒有必要為每個字的取碼加上圖解,只須用文字適當解釋即可。況且使用太大的圖片,會佔用較多版面,反而不容易做個全盤瀏覽。如要用圖片,在下以為針對二者的「差異之處」特別標以不同顏色,更能反映二者的不同點。--ceku 2008年9月24日 (三) 11:06 (UTC)


以下內容轉貼自維基百科的倉頡輸入法條目:


注意事項[編輯]

三代與五代編碼差異[編輯]

倉頡輸入法最新的公開版本為五代,繁簡漢字的編碼規則較統一,重碼字、訛誤字亦少。但目前最通行之倉頡輸入法為微軟三代倉頡及新倉頡輸入法。兩者之主要差異為:

五代新增二輔助字形[編輯]

五代新增輔助字形 字例
輔助字形 所屬字碼 例字 三代取碼 圖示 五代取碼 圖示
「水」的第五代倉頡新增輔助字形 尸.卜卜手 「犀」的第三代倉頡取碼 尸.水竹手 「犀」的第五代倉頡取碼
尸.卜卜戈 「屬」的第三代倉頡取碼 尸.水田戈 「屬」的第五代倉頡取碼
「屍」的第五代倉頡新增輔助字形 竹尸 「乍」的第三代倉頡取碼 人尸 「乍」的第五代倉頡取碼
一田卜中 「面」的第三代倉頡取碼 一田尸中 「面」的第五代倉頡取碼
中一.卜卜卜 「非」的第三代倉頡取碼 中一.尸卜 「非」的第五代倉頡取碼
人.口卜.水 「假」的第三代倉頡取碼 人.口尸.水 「假」的第五代倉頡取碼

五代修改複合字規定[編輯]

  • 五代取消了「鬼」,並將「吂」改為「贏(去貝)」
    • 如「鬼」:竹戈 → 竹山.戈;「魄」:竹日.竹戈 → 竹日.竹山.戈
    • 如「贏」:卜口.月.月弓 → 卜弓.月山金;「羸」:卜口.月.廿弓 → 卜弓.廿手

五代修改複合字首規定[編輯]

  • 五代取消了「應(去心)」、「府」、「暦(去日)」、「厤」;增加「合」、「春」、「冬」、「登」、「薛」
    • 如「應」:戈土.心 → 戈.人土.心;「鷹」:戈土.火 → 戈.人土.火
    • 如「歷」:一木.卜中一 → 一.竹木.一;「曆」:一木.日 → 一.竹木.日
    • 如「拿」:人.一.口手 → 人口.手;「盒」:人.一.口廿 → 人口.月廿
    • 如「蠢」:手大.日.中戈 → 手日.中戈.戈
    • 如「凳」:弓人.一.口弓 → 弓廿.竹弓
    • 如「孽」:廿.竹十.木 → 廿十.弓木

五代取消某些特殊規定,以使編碼統一[編輯]

  • 「工」、「王」在五代不再適用包含省略原則
    • 如「滏」:水.金大土 → 水.金大金;「瑩」:火火.月.一土 → 火火.月.一戈;「靈」:一月.口口.一 → 一月.口口.人
  • 三代將「兔」視為組合字,五代改為視為整體字
    • 如「兔」:弓山.戈 → 弓日竹戈;「冤」:月.弓山.戈 → 月.弓日戈
  • 三代將「函」視為整體字,五代改為視為組合字
    • 如「函」:弓山水 → 山.弓水;「涵」:水.弓山水 → 水.山.弓水

五代統一簡化字的編碼[編輯]

  • 「马」:弓尸.一 →→ 中女尸一 → 弓女尸一 → 尸一[1]
  • 「驰」之字首:弓一 →→ 中一 → 弓一 → 尸一
  • 「钅」:金、人.一心 → 人.一心
  • 「铁」之字首:金、人心 → 人心
  • 「讠」:戈.弓、戈.山 → 戈.弓女
  • 「认」之字首:戈弓、戈山 → 戈女

五代將一些字重新根據標準字體取碼[編輯]

  • 如「黃」:廿.一.田金 → 廿.一中金;「廣」:戈.廿.一金 → 戈.廿.中金
  • 如「麵」:十弓.一田中 → 十水.一田中

字體問題[編輯]

新細明體差異[編輯]

倉頡以正楷體(如標楷體或多數手寫體)做為取碼標準。但目前廣泛使用的新細明體來自日本漢字的字模,因此許多字與標準字體不同。

以下列表為常見的此類字,倉頡系統的輸入碼(倉頡碼)即是內碼,二種字體都列入編碼;而目前的 Big5Unicode 只取「標準字體」編入內碼,微軟倉頡也未加入容錯碼,因此只能用標準字體的編碼輸入:

標準字體 標準字體編碼 新細明體 新細明體編碼 補充說明
月金.廿難金 月金.竹竹金 類字:廉、簾
水.月.竹山 水.月.竹弓 「冗」仍作「月.竹弓」
竹.日戈.中 竹.竹心.中 類字:概、溉、鄉、卿
竹口.人大 竹大.口 兩字內碼不同,但新細明體二字皆作「啟」。
戈火.土 一火.土 類字:禍、視、祝、禎
少數字如神、禙、祧無此問題。
「麻」的倉頡標準字體編碼 戈.十金.金 「麻」的倉頡新細明體編碼 戈.木.木 麼、摩、磨、魔等衍生字,理論上字首應拆「戈金」,但目前主流編碼皆編作「戈木」。
「為」的倉頡標準字體編碼 戈大弓火 「為」的倉頡新細明體編碼 月.竹弓火 兩字內碼不同,但新細明體二字皆作「為」。
戈.中.戈中 竹.中.戈中 類字:辨
「直」的倉頡標準字體編碼 十月一一 「直」的倉頡新細明體編碼 十月山女 類字:植、值
「麥」的倉頡標準字體編碼 十人.弓戈 十人.竹水
「殺」的倉頡標準字體編碼 大金.竹弓.水 「殺」的倉頡新細明體編碼 大木.竹弓.水 類字:述、怵
「免」的倉頡新細明體編碼 弓日竹山 「免」的倉頡新細明體編碼 尸竹日山
弓大.竹卜一 弓大.竹卜女 類字:涎
弓中.廿心人 弓中.金.一人 類字:遂
弓一.弓戈一 弓竹.弓竹竹 類字:溺
人.戈.弓戈 人.戈.尸中 類字:領、零
前二碼為「人戈」而非「人一」,參考#編碼字形差異一節的「倉」字。
手.廿廿 手.竹十.十 類字:迸、胼
廿.一.田金 廿.一中金 五代改為「廿一中金」。
廿手.尸一一 廿手.尸竹竹 類字:翁、詡、翅
廿難金 金.一難金
弓山水 五代為「山.弓水」。
倉頡系統不收後者。

編碼字形差異[編輯]

倉頡輸入法發展較早,有些字取碼所據字形與後來教育部公布的標準字形不同,取碼時須留意。

  • 以下幾個字,須以「取碼字形」取碼才能輸入。
標準字形 標準字形編碼 取碼字形 取碼字形編碼 補充說明
「反」的倉頡標準字形編碼 一水 「反」的倉頡取碼字形編碼 竹水 類字:飯、板、
「麵」的倉頡標準字形編碼 十水.一田中 「麵」的倉頡取碼字形編碼 十弓.一田中 五代已統一改為「十水」。
Unicode 後加收的字如「麫」(「麵」的異體字)、「麯」、「麱」等皆作「十水」,其中新細明體的「麪」、「麬」、「麳」左側顯示為「麥」。
「麴」的倉頡標準字形編碼 十水.心火木 「麴」的倉頡取碼字形編碼 十弓.心火木 五代已統一改為「十水」。
「片」的倉頡標準字形編碼 中中一尸 「片」的倉頡取碼字形編碼 中中一中 類字:版、牘、牌
一土.竹水 一土.人大 文字學考據,「致」之右半應為「夊」而非「攴(攵)」。
「倉」的倉頡標準字形編碼 人.一.日口 「倉」的倉頡取碼字形編碼 人.戈.日口 類字:食、養、餐、今、令
但俞、命等字為「人一」。
「勻」的倉頡標準字形編碼 心一一 「匀」的倉頡取碼字形編碼 心戈一 Unicode 加收了「匀」字,見#編碼訛誤一節。
手一.田十 手一.田卜戈
大戈.月 卜戈.月 類字:統、銃、流、梳、硫
手.一十難 手.竹十難 類字:鍤
  • 以下幾個字,以「捏」為例,倉頡輸入法原先採「揑」作為編碼字形並編為「手竹難一」,後由於 Big5 只收「捏」字,相應的倉頡碼也未更改,因而本應作「手日土」的「捏」被誤植為「揑」的編碼(手竹難一)。而 Unicode 加收的「揑」字編碼就沒有錯誤。餘字同理。
標準字形 標準字形編碼 取碼字形 取碼字形編碼 補充說明
「潃」的倉頡標準字形編碼 水.竹.人月 「滫」的倉頡取碼字形編碼 水.人.中月
「撐」的倉頡標準字形編碼 手.火月竹 「撑」的倉頡取碼字形編碼 手.火月手
手.日.土 手.竹難.一
「螤」的倉頡標準字形編碼 卜戈.中田人 「斔」的倉頡取碼字形編碼 卜戈.竹難人
卜大.一.竹竹 卜竹.竹竹竹 Unicode 加收了「彦」字,見#編碼訛誤一節。
卜大.一.竹一 卜竹.竹手一 Unicode 加收了「産」字,見#編碼訛誤一節。

簡化字的編碼[編輯]

簡化字的編碼規則原則上和正體字相同,但倉頡直至五代才開始對簡化字編碼,而微軟自行在擴充 Unicode 字集時對簡化字編碼,因此規則較為混亂,甚至有不少錯碼,以下列出較不易理解的簡化字的編碼。

例字 標準編碼 圖示 微軟編碼 圖示 補充說明
火.大女金 火.手木 類字:拣、练等。
戈十 戈一 類字:线、钱等。
戈.弓女 「訁」的倉頡簡化字標準編碼 戈.弓 「訁」的倉頡簡化字微軟編碼
戈女.人 戈弓.人;
戈山.人
微軟的「讠」字首編碼不統一,有作「戈弓」,或作「戈山」,或二者皆有。
中戈一 卜中;
戈一中
中一.土 卜中.土 類字:状、妆、浆、酱等。
人.一心 金;
人.一心
人心.日心竹 金.日心竹;
人心.日心竹
微軟的「钅」多為「人心」或「金」二者皆有。
尸一 「馬」的倉頡簡化字標準編碼 弓尸.一 「馬」的倉頡簡化字微軟編碼
尸一.心木 弓一.心木 微軟的「钅」多為「人心」或「金」二者皆有。
火月.弓木 「学」的倉頡簡化字標準編碼 戈月.弓木 「学」的倉頡簡化字微軟編碼
戈木尸 戈木木;
戈木尸
「木」的輔助字形後無鈎,故「戈木木」編碼不合理。
戈女大水 「发」的倉頡簡化字標準編碼 火大水 「发」的倉頡簡化字微軟編碼 「发」只有五劃,將「发」上方看作「倉頡輔助字形 火於光.jpg」的「火大水」編碼不合理。
戈大尸戈 戈大尸戈;
戈大弓戈
依字形特徵原則,「戈大弓戈」編碼不合理。
大木 「东」的倉頡簡化字微軟編碼
廿大 「关」的倉頡簡化字標準編碼 金一大 「关」的倉頡簡化字標準編碼

微軟三代倉頡的編碼訛誤[編輯]

朱邦復放棄倉頡輸入法版權後,微軟自行修改了三代倉頡編碼。但可能因編碼者不清楚編碼規則,或缺乏查對,造成某些字編碼錯誤。這些訛誤多半發生在 Unicode 擴充的非 Big5 字,多為簡化字及罕用字(簡化字見上)。

例字 標準編碼 圖示 微軟編碼 圖示 補充說明
月月.尸一.竹 月月.尸卜.竹
金.竹木.尸 「銹」的倉頡標準編碼 金.竹木.竹 「銹」的倉頡微軟編碼 「銹」為「鏽」的異體字
微軟倉頡軟入法「金.竹木.竹」碼只能輸入簡化字「锈」。
竹.火 「灬」的倉頡標準編碼 火.戈 「灬」的倉頡微軟編碼
竹.一.竹弓 「筑」的倉頡標準編碼 竹.一.弓十 「筑」的倉頡微軟編碼
竹女.月山山 「覣」的倉頡標準編碼 竹女.月山 「覣」的倉頡微軟編碼
竹田.土廿十 「睾」的倉頡標準編碼 竹田.土廿戈 微軟編碼錯誤不明。
戈戈一 「疒」的倉頡標準編碼 戈卜 「疒」的倉頡微軟編碼 「卜」的輔助字型「倉頡輔助字形 卜於冬.jpg」用於長點,但此為短點,故拆為「戈戈」。
戈.戈.一 「氵」的倉頡標準編碼 卜.一 「氵」的倉頡微軟編碼 「卜」的輔助字型「倉頡輔助字形 卜於冬.jpg」用於長點,但此為短點,故拆為「戈戈」。
一土.口女心 一土.口山心
心戈一 「匀」的倉頡標準編碼 心卜 較常用的異體字「勻」見#編碼字形差異一節。
廿金.人.戈弓 廿金.人.一弓
廿.竹女心 「芪」的倉頡標準編碼 廿.竹山心
廿中.一十 中一卜手 此字有許多異體字,微軟收了「羋」(新細明體下作「手」,標楷體下作「干」)、「芈」(廿手)二字;倉頡系統收了「羋」(廿中.手)、「羋(下作干)」(廿中.一十)、「芈」(廿手)、「芈(中豎短於卝)」(廿手)四字。
卜竹.竹竹竹 卜廿竹竹 較常用的異體字「彥」見#編碼字形差異一節。
卜竹.竹手一 卜廿竹一 較常用的異體字「產」見#編碼字形差異一節。
卜尸.人.卜人 「旞」的倉頡標準編碼 卜尸.卜.人人 「旞」的倉頡微軟編碼

容易拆錯的字[編輯]

以下為初學者容易拆錯的字,通常是規則不熟練所致。

例字 正確取碼 圖示 錯誤取碼 圖示 補充說明
月尸尸 「凸」的倉頡正確取碼 尸月尸 「凸」的倉頡錯誤取碼
金十戈土 「鐵」的倉頡正確取碼 金土戈土 「鐵」的倉頡錯誤取碼 依照字形原則:
 1.取碼時,儘可能不取重疊字形。
 2.將兩相接的字形在同一直線上分割取碼。
 3.避免在轉角處分割字形。
以前者為正確。「戴」、「載」等字同理。
火金月 「脊」的倉頡正確取碼 金人月 「脊」的倉頡錯誤取碼
尸尸山 「凹」的倉頡正確取碼 尸山尸 「凹」的倉頡錯誤取碼
廿人人土 「難」的倉頡正確取碼 「難」的倉頡錯誤取碼 「難」根僅用於特殊規則,「難」字本身應以正規方式取碼。

練習[編輯]

正在書寫……
引用錯誤:<ref>標籤存在,但沒有找到<references/>標籤