跳至內容

倉頡輸入法

維基教科書,自由的教學讀本
  倉頡輸入法
倉頡字母與鍵位 
維基百科中的相關條目:

特色

倉頡輸入法原名形意檢字法,是最早的電腦中文輸入法,由朱邦復在1976年發明,屬於形碼輸入法

時至今日,電腦上的中文輸入法已達一百多種,各有不同的長處和缺點。有的易學但效率差;有的效率好但難學;有的商業輸入法自稱易學又快速,但需要付費且安裝、使用不便,即使如此尚有入門者抱怨凌亂難學。倉頡輸入法並非公認易學的輸入法,主因是規則多,且倉頡輸入法版本多、敎材種類也多,不易選擇。但我們相信只要有良好的敎材和足夠的練習,入門門檻可大大降低。

倉頡輸入法的最大優勢是普及。由於倉頡輸入法發明得早,且發明人公開放棄專利權,今日幾乎所有電腦、手機、甚至電子辭典及其他小型機器,都內建倉頡輸入法,不必擔心學了英雄無用武之地。相較之下,非內建輸入法就有很多問題:商業輸入法須付費購買,且往往只能安裝在一台或少數機器上。有些輸入法可在網上免費下載試用版或完整版,但可能因未支援特定平台、公司限制員工上網、插隨身碟、安裝程式等因素無法使用。即使可以,使用者也往往必須自備安裝程式,相較內建輸入法不便甚多。

發明倉頡輸入法的最初目的是檢索漢字,對許多形近漢字有極佳的區辨能力。若不計算特別設計的簡快碼,倉頡輸入法的重碼率為主流中文輸入法中最低[1][2]。就一般輸入場合而言,重碼率低意味著選字率低,選字率低就容易「盲打」,不用頻繁看螢幕選字,可減少眼睛負擔,也在某種程度上提升了輸入效率。

也因自始至終就著眼於檢索漢字,倉頡輸入法支援的字庫極大,大部分罕用字皆能比照一般規則取碼,是許多古文、漢字硏究者的首選中文輸入法,一些大字集資料庫或研究專案也使用倉頡碼作為檢字工具,例如Unihan資料庫中文全字庫CNS11643中文標準交換碼)、及漢字構形資料庫

有些輸入法會利用簡化的規則、智慧選字選詞、大量的容錯碼、或特別設計的簡快碼以求容易上手、減少選字、及提升輸入效率。這些做法在特定場合有其價值,但也有相應的代價,例如重碼率上升、需要時間讓系統學習使用者的輸入習慣、需要特別背誦學習簡快碼等。此外這些功能多是針對現代白話文及常用字設計,對常用文言文、罕用字的人而言效益亦較有限。

市面上還有一些衍生自倉頡的輸入法可用於特定場合,如許多系統內建的「速成輸入法」即是只取頭尾碼的倉頡輸入法,在容易上手及輸入效率比較折衷;又如商業的「大新倉頡輸入法」簡化了傳統倉頡輸入法的規則且設計了大量的簡快碼,熟練者能每分鐘輸入238字,創下了台灣公開中文打字比賽中的最快紀錄。平時利用這些衍生輸入法提升效率,而在特殊需要時轉換到傳統倉頡,也是可考慮的選擇。

本書特色

至今市面上已有大量介紹倉頡輸入法的網站和書籍,爲甚麼還要寫這本敎科書?本敎科書的特點如下:

一、本教科書比照維基教科書之內容採自由授權,任何人皆可在創用CC 署名-相同方式共享 3.0協議授權下自由引用、複製、甚或改作本教科書的內容。

二、本教科書整合了各家教材之所長,並釐清各家理論的矛盾之處,也盡可能附上客觀資料來源供後人查考。

三、大多數倉頡輸入法敎學不重視版本差異,本敎科書則同時介紹最通行的「三代倉頡」(應用於「倚天」、「國喬」、「微軟Windows」等系統)、「五代倉頡」及其他重要版本的取碼規則,並仔細釐清各版本之間的編碼差異。

四、由於歷史因素,倉頡輸入法易因取碼字體差異、編碼訛誤等問題造成實際使用時的困惑,但大多數倉頡輸入法敎學不會提及這些問題。本教科書將於〈特別注意〉一章詳細探討這些問題。

版本簡介

倉頡輸入法源遠流長,版本眾多,按發明人朱邦復提出時間,大略有以下版本:

  • 一代:1977年朱邦復在台灣發表第一代倉頡,根據一萬二千字的《國語辭典》所設計。
  • 二代:1980年朱邦復發表第二代倉頡,僅將第一代倉頡略作調整。
  • 三代:1982年朱邦復發表第三代倉頡,自《康熙字典》選取四萬字取碼,並改良第二代的部分取碼規則。
  • 四代:1985年朱邦復在美國發表第四代倉頡。
  • 五代
    • 1987年版:1987年朱邦復返中國深圳科技園,任兩儀文化科技公司總經理,發表聚珍大字庫及第五代倉頡輸入法。1990年朱邦復書就《第五代倉頡輸入法手冊》並先後交由數個出版社出版。當時為因應通行的內碼系統,將簡體及繁體字分開編碼推行,分別收一萬餘字及六千餘字。
    • 1999年版:1999年5月《第五代倉頡輸入法手冊》由香港文化傳信再版,內容與1990年版稍有不同,此版即該手冊描述之內容。此版主要根據中國大陸的國標擴展碼將繁簡字統一編碼,收二萬餘字,並與香港及馬來西亞「倉頡之友」網站合作推行,但實際推出的輸入法仍是分為繁體版及簡體版。
    • 2003年版:朱邦復工作室推出「漢文庫典」,以改版的五代倉頡碼為檢字依據。此版將繁簡漢字統一編碼,收錄六萬餘字,並修改部分輔助字形及編碼[3],後於2006年博碩文化出版了更新的《第五代倉頡輸入法手冊》。由於合作網站未完全跟進[4],目前很難見到完全採用此版規則的倉頡輸入法。
  • 六代:2001年朱邦復將此版本更名為「蒼頡檢字法」,並據之發表中文電書規格及中文晶片。蒼頡檢字法未曾公開,僅供合作者使用,直至2013年才將部分資料釋出予倉頡輸入法愛好者,俗稱「第六代倉頡輸入法」。

目前最通行的倉頡輸入法版本為第三代1999年版第五代。採用第三代倉頡輸入法的主要有微軟倉頡[5]倉頡之友·馬來西亞發行的倉頡輸入法、及一些改良版倉頡輸入法(如自由倉頡、快速倉頡、大新倉頡等)。第五代倉頡輸入法主要有倉頡之友·馬來西亞發行的倉頡輸入法、Linux內建輸入法平台提供的倉頡輸入法等。蘋果電腦內建的倉頡輸入法混合了第三代和第五代。

許多電腦或行動版輸入法平台可套用不同輸入法表格切換為不同輸入法,其中多半有內建第三代或第五代倉頡輸入法的選項,例如Google在Android系統使用的智慧鍵盤Gboard。一些民間開發的改良版倉頡輸入法則是採三代、五代、或混合編碼,具體可參照其說明文件。

本教科書主要根據發明人朱邦復及主要助手沈紅蓮之說法(簡稱「官方說法」)為主要架構介紹相關規則,其中主要參考發明人的著作《第五代倉頡輸入法手冊》(簡稱五代手冊)、《倉頡第三代中文字母輸入法》(簡稱三代手冊)、以及朱邦復工作室公開發表過的資料。官方說法不夠詳細或有爭議者,再參酌其他客觀資料(如官方實際取碼字例)微調或補充,並另行附註。

取碼概要

如果說筆順輸入法像執筆寫字,倉頡輸入法就像用剪刀把漢字剪開。要為漢字取碼,首先憑視覺(而非字義或筆順)觀察漢字能否分割,無法分割的是整體字;可分割的則把漢字分割成字首字身,字首爲最左、最上、最外部份,剩餘部份爲字身。字身若可再分割,則再分割爲次字首次字身。各部份再分別根據字形取出有限個字碼,而後按下空白鍵輸出。

一漢字最少用一碼輸入,最多五碼,如:

漢字 分割 取碼 演示
串(最多取四碼) 中中(;LL)    
魚里(最多取二.三碼) 弓火田土(;NFWG)  
艹女古(最多取二.一.二碼) 廿女十口(;TVJR) 廿 
木五口(最多取二.二.一碼) 木一一口(;DMMR)  

本敎科書會就漢字的分割方法、取碼原則、例外字及其他要注意的地方,逐章說明。

教科書目錄

  1. 倉頡字母與鍵位
  2. 輔助字形
  3. 漢字分割
  4. 基本取碼
  5. 取碼原則
  6. 例外字
  7. 特別注意
  8. 版本差異
  9. 進階知識
  10. 相關資源

附註

  1. 據輸入法硏究者泰瑞統計[1][2]大五碼字集的13053漢字中,三代倉頡有500組重碼字,有1034字重碼,重碼字比率爲7.92%;五代倉頡有504組重碼字,有1046字重碼,重碼字比率爲8.01%。如果把取樣漢字範圍收窄或擴大,倉頡輸入法仍有傑出表現。如以大五碼常用字區的5401字作取樣範圍,三代倉頡有434字重碼,重碼率爲8.04%,數值低於統計中的其他輸入法,甚至大勝一些自稱選字選率低的輸入法。
  2. 據統計,徐碼輸入法重碼率較倉頡輸入法略低[3],唯徐碼輸入法普及率較低,尚未成為主流輸入法。
  3. 第五代倉頡碼表說明
  4. 如馬來西亞倉頡之友的程式便未完全採用2003年版的編碼。[4]
  5. 微軟早期與朱邦復合作開發微軟中文視窗系統3.0,採用倉頡系統,但之後合作關係破裂,微軟之後的Windows版本改採其他漢字編碼系統,並自行更新倉頡輸入法編碼,用於Windows系統上的倉頡、新倉頡、速成輸入法,通稱「微軟倉頡」,其編碼規則大抵依照第三代倉頡,但常用字以外的內容混合了第四代倉頡及以後的編碼。
  倉頡輸入法
倉頡字母與鍵位