五筆字型輸入法/取碼原則
五筆將漢字筆劃分為五個區:即:橫(同提)、豎、撇、捺(同點)、折五區。把字根或碼元按一定規律分布在25個字母鍵上(即標準的QWERTY鍵盤,不包括Z)。取碼時最長四碼,最短一碼。
2006年12月,王永民又在此基礎上,研究出用於手機輸入的基於6個碼元和「右手法則——前四末一」取碼法的數字王碼。[1]
鍵名字
[編輯]鍵名是指各鍵位左上角的黑體字根,它們是組字頻度較高,而形體上又有一定代表性的字根,它們中絕大多數本身就是漢字,只要把它們所在鍵連擊四次就可以了。如:王:11 11 11 11(GGGG)
成字字根
[編輯]在每個鍵位上,除了一個鍵名字根外,還有數量不等的幾種其它字根,它們中間的一部分其本身也是一個漢字,我們稱之為成字字根。 輸入方法:鍵名代碼(該字所在鍵)+首筆代碼(該字第一筆)+次筆代碼(該字第二筆)+末筆代碼(該字末筆)(如果該字根只有兩筆畫,則補空格鍵結束)。 註:五筆存在「補碼字根」,即有兩個編碼的字根(如:犭QT、礻PY、衤PU)
86版五筆字根
- 1區橫起筆 11G 王旁青頭戔(兼)五一 12F 土士二干十寸雨 13D 大犬三(羊)古石廠 14S 木丁西 15A 工戈草頭右框七
- 2區豎起筆 21H 目具上止卜虎皮 22J 日早兩豎與蟲依 23K 口與川,字根稀 24L 田甲方框四車力 25M 山由貝,下框幾
- 3區撇起筆 31T 禾竹一撇雙人立,反文條頭共三一 32R 白手看頭三二斤 33E 月彡(衫)乃用家衣底 34W 人和八,三四里 35Q 金勺缺點無尾魚,犬旁留兒一點夕,氏無七(妻)
- 4區點起筆 41Y 言文方廣在四一,高頭一捺誰人去 42U 立辛兩點六門疒(病) 43I 水旁興頭小倒立 44O 火業頭,四點米 45P 之字軍蓋道建底,摘礻(示)衤(衣)
- 5區折起筆 51N 已半巳滿不出己,左框折屍心和羽 52B 子耳了也框向上 53V 女刀九臼山朝西 54C 又巴馬,丟矢矣 55X 慈母無心弓和匕,幼無力
98版五筆字根
- 1區橫起筆 11 G 王旁青頭五夫一 12 F 土干十寸未甘雨 13 D 大犬戊其古石廠 14 S 木丁西甫一四里 15 A 工戈草頭右框七
- 2區豎起筆 21 H 目上卜止虎頭具 22 J 日早兩豎與蟲依 23 K 口中兩川三個豎 24 L 田甲方框四車裡 25 M 山由貝骨下框裡
- 3區撇起筆 31 T 禾竹反文雙人立 32 R 白斤氣丘叉手提 33 E 月用力豸毛衣臼 34 W 人八登頭單人幾 35 Q 金夕鳥兒犭邊魚
- 4區點起筆 41 Y 言文方點誰人去 42 U 立辛六羊病門裡 43 I 水族三點鱉頭小 44 O 火業廣鹿四點米 45 P 之字寶蓋補礻衤
- 5區折起筆 51 N 已類左框心屍羽 52 B 子耳了也乃框皮 53 V 女刀九艮山西倒 54 C 又巴牛厶馬失蹄 55 X 么母貫頭弓和匕
新世紀版五筆字根
- 1區橫起筆 11 G 王旁青頭五一提 12 F 土士二干十寸雨 13 D 大三肆頭古石廠 14 S 木丁西邊要無女 15 A 工戈草頭右框七
- 2區豎起筆 21 H 目止具頭卜虎皮 22 J 日曰兩豎與蟲依 23 K 口中兩川三個豎 24 L 田框四車甲單底 25 M 山由貝骨下框裡
- 3區撇起筆 31 T 禾竹牛旁臥人立 32 R 白斤氣頭叉手提 33 E 月舟衣力豕豸臼 34 W 人八登祭風頭幾 35 Q 金夕犭兒包頭魚
- 4區點起筆 41 Y 言文方點在四一 42 U 立帶兩點病門裡 43 I 水邊一族三點小 44 O 火變三態廣二米 45 P 之字寶蓋補示衣
- 5區折起筆 51 N 已類左框心屍羽 52 B 子耳了也乃齒底 53 V 女刀九巡錄無水 54 C 又巴甬矣馬失蹄 55 X 么母絞絲弓三匕
單字輸入
[編輯]除鍵名字和成字字根漢字之外的漢字,如果一個字可以取夠四個字根(取第一、第二、第三和末字根),就全部用字根鍵入,只有在不足四個字根的情況下,才有必要追加識別碼。
末筆字型識別碼
[編輯]當一個字拆不夠4個碼元時,它的輸入編碼是:先打完碼元,再追加一個「末筆字型識別碼」,簡稱「識別碼」。末筆字型識別碼由漢字的末筆畫代碼和字型代碼組成。
末筆畫代碼看這個字的最後一個字根的末筆畫的結構來決定的:
- 橫 1
- 豎 2
- 撇 3
- 捺 4
- 折 5
字型代碼是看此字的結構來的決定的:
- 左右結構型 1
- 上下結構型 2 (注意:像「午」這樣頭部為兩筆或大於兩筆的字可以拆為「」和「十」,視為上下結構型字;小於兩筆的字,如「自」,則不能拆為「丿」和「目」,視為其他結構型字)
- 其他結構型 3
最後組合起來就是識別碼。例如"好"字,他最後筆畫為「一」,所以末筆畫代碼就是「1」,好是左右型結構的漢字,所以「好」字的字型代碼也是「1」,所以「好」識別碼就是「11」,在「G」鍵上。 注意:諸如「延」「辻」「國」這樣的(半)包圍結構字,視其內部被包圍的部位為末字根,如「延」「辻」「國」的末筆畫代碼應為折、豎、點。
拆分原則
[編輯]- 書寫順序:即按照一般漢字書寫順序取字根。(註:86版中,像「戈」這樣的部分視右下的「丿」為末筆,「萬」視右下的折為末筆,「匕」視豎彎鈎為末筆,等等)
- 能散不連
- 兼顧直觀:諸如「國」這樣的字應拆為「囗」「王」「丶」,而非「冂」「王」「丶」「一」;「兆」字拆為兩側的四個點和中間的「兒」。即要兼顧直觀。
- 能連不交
- 取大優先:即按照書寫順序,字根筆畫數應儘量取多,總字根數儘量少,但仍要遵守「能散不連,能連不交」的原則。
詞組的錄入
[編輯]- 雙字詞
取第一字的前兩位編碼和第二字的前兩位編碼,如「北」(UXN)+「京」(YIU)=「北京」(UXYI)
- 三字詞
取第一字的第一位編碼,第二位的第一位編碼,第三字的前兩位編碼,如「毛」(TFNV)+「澤」(ICFH)+「東」(AII)=「毛澤東」(TIAI)
- 四字詞
取每一個字的第一位編碼,如「六」(UYGY)+「十」(FGH)+「四」(LHNG)+「卦」(FFHY)=「六十四卦」(UFLF)
- 多字詞
取一、二、三、末字的第一位編碼,如「中」(KHK)+「國」(LGYI)+「共」(AWU)+「產」(UTE)+「黨」(IPKQ)=「中國共產黨」(KLAI)
簡碼字
[編輯]指一些較常用字可以用一、二或三字母編碼打出,分別稱為一、二、三級簡碼
一級簡碼包含漢語(尤其是官方語體)最常用字中的25個,為了儘可能全面地安排最常用的漢字,部分一級簡碼並非是該字全碼的首位。
但所有的二級或三級簡碼均為該字全碼的前二或三位
一級簡碼如下,86版、98版和新世紀版通用
編碼 | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
文字 | 工 | 了 | 以 | 在 | 有 | 地 | 一 | 上 | 不 | 是 | 中 | 國 | 同 | 民 | 為 | 這 | 我 | 的 | 要 | 和 | 產 | 發 | 人 | 經 | 主 |
速記口訣:一地在要工 上是中國同 和的有人我 主產不為這 民了發以經