五笔字型输入法/取码原则
五笔将汉字笔划分为五个区:即:横(同提)、竖、撇、捺(同点)、折五区。把字根或码元按一定规律分布在25个字母键上(即标准的QWERTY键盘,不包括Z)。取码时最长四码,最短一码。
2006年12月,王永民又在此基础上,研究出用于手机输入的基于6个码元和“右手法则——前四末一”取码法的数字王码。[1]
键名字
[编辑]键名是指各键位左上角的黑体字根,它们是组字频度较高,而形体上又有一定代表性的字根,它们中绝大多数本身就是汉字,只要把它们所在键连击四次就可以了。如:王:11 11 11 11(GGGG)
成字字根
[编辑]在每个键位上,除了一个键名字根外,还有数量不等的几种其它字根,它们中间的一部分其本身也是一个汉字,我们称之为成字字根。 输入方法:键名代码(该字所在键)+首笔代码(该字第一笔)+次笔代码(该字第二笔)+末笔代码(该字末笔)(如果该字根只有两笔画,则补空格键结束)。 注:五笔存在“补码字根”,即有两个编码的字根(如:犭QT、礻PY、衤PU)
86版五笔字根
- 1区横起笔 11G 王旁青头戋(兼)五一 12F 土士二干十寸雨 13D 大犬三(羊)古石厂 14S 木丁西 15A 工戈草头右框七
- 2区竖起笔 21H 目具上止卜虎皮 22J 日早两竖与虫依 23K 口与川,字根稀 24L 田甲方框四车力 25M 山由贝,下框几
- 3区撇起笔 31T 禾竹一撇双人立,反文条头共三一 32R 白手看头三二斤 33E 月彡(衫)乃用家衣底 34W 人和八,三四里 35Q 金勺缺点无尾鱼,犬旁留儿一点夕,氏无七(妻)
- 4区点起笔 41Y 言文方广在四一,高头一捺谁人去 42U 立辛两点六门疒(病) 43I 水旁兴头小倒立 44O 火业头,四点米 45P 之字军盖道建底,摘礻(示)衤(衣)
- 5区折起笔 51N 已半巳满不出己,左框折尸心和羽 52B 子耳了也框向上 53V 女刀九臼山朝西 54C 又巴马,丢矢矣 55X 慈母无心弓和匕,幼无力
98版五笔字根
- 1区横起笔 11 G 王旁青头五夫一 12 F 土干十寸未甘雨 13 D 大犬戊其古石厂 14 S 木丁西甫一四里 15 A 工戈草头右框七
- 2区竖起笔 21 H 目上卜止虎头具 22 J 日早两竖与虫依 23 K 口中两川三个竖 24 L 田甲方框四车里 25 M 山由贝骨下框里
- 3区撇起笔 31 T 禾竹反文双人立 32 R 白斤气丘叉手提 33 E 月用力豸毛衣臼 34 W 人八登头单人几 35 Q 金夕鸟儿犭边鱼
- 4区点起笔 41 Y 言文方点谁人去 42 U 立辛六羊病门里 43 I 水族三点鳖头小 44 O 火业广鹿四点米 45 P 之字宝盖补礻衤
- 5区折起笔 51 N 已类左框心尸羽 52 B 子耳了也乃框皮 53 V 女刀九艮山西倒 54 C 又巴牛厶马失蹄 55 X 幺母贯头弓和匕
新世纪版五笔字根
- 1区横起笔 11 G 王旁青头五一提 12 F 土士二干十寸雨 13 D 大三肆头古石厂 14 S 木丁西边要无女 15 A 工戈草头右框七
- 2区竖起笔 21 H 目止具头卜虎皮 22 J 日曰两竖与虫依 23 K 口中两川三个竖 24 L 田框四车甲单底 25 M 山由贝骨下框里
- 3区撇起笔 31 T 禾竹牛旁卧人立 32 R 白斤气头叉手提 33 E 月舟衣力豕豸臼 34 W 人八登祭风头几 35 Q 金夕犭儿包头鱼
- 4区点起笔 41 Y 言文方点在四一 42 U 立带两点病门里 43 I 水边一族三点小 44 O 火变三态广二米 45 P 之字宝盖补示衣
- 5区折起笔 51 N 已类左框心尸羽 52 B 子耳了也乃齿底 53 V 女刀九巡录无水 54 C 又巴甬矣马失蹄 55 X 幺母绞丝弓三匕
单字输入
[编辑]除键名字和成字字根汉字之外的汉字,如果一个字可以取够四个字根(取第一、第二、第三和末字根),就全部用字根键入,只有在不足四个字根的情况下,才有必要追加识别码。
末笔字型识别码
[编辑]当一个字拆不够4个码元时,它的输入编码是:先打完码元,再追加一个“末笔字型识别码”,简称“识别码”。末笔字型识别码由汉字的末笔画代码和字型代码组成。
末笔画代码看这个字的最后一个字根的末笔画的结构来决定的:
- 横 1
- 竖 2
- 撇 3
- 捺 4
- 折 5
字型代码是看此字的结构来的决定的:
- 左右结构型 1
- 上下结构型 2 (注意:像“午”这样头部为两笔或大于两笔的字可以拆为“”和“十”,视为上下结构型字;小于两笔的字,如“自”,则不能拆为“丿”和“目”,视为其他结构型字)
- 其他结构型 3
最后组合起来就是识别码。例如"好"字,他最后笔画为“一”,所以末笔画代码就是“1”,好是左右型结构的汉字,所以“好”字的字型代码也是“1”,所以“好”识别码就是“11”,在“G”键上。 注意:诸如“延”“辻”“国”这样的(半)包围结构字,视其内部被包围的部位为末字根,如“延”“辻”“国”的末笔画代码应为折、竖、点。
拆分原则
[编辑]- 书写顺序:即按照一般汉字书写顺序取字根。(注:86版中,像“戈”这样的部分视右下的“丿”为末笔,“万”视右下的折为末笔,“匕”视竖弯钩为末笔,等等)
- 能散不连
- 兼顾直观:诸如“国”这样的字应拆为“囗”“王”“丶”,而非“冂”“王”“丶”“一”;“兆”字拆为两侧的四个点和中间的“儿”。即要兼顾直观。
- 能连不交
- 取大优先:即按照书写顺序,字根笔画数应尽量取多,总字根数尽量少,但仍要遵守“能散不连,能连不交”的原则。
词组的录入
[编辑]- 双字词
取第一字的前两位编码和第二字的前两位编码,如“北”(UXN)+“京”(YIU)=“北京”(UXYI)
- 三字词
取第一字的第一位编码,第二位的第一位编码,第三字的前两位编码,如“毛”(TFNV)+“泽”(ICFH)+“东”(AII)=“毛泽东”(TIAI)
- 四字词
取每一个字的第一位编码,如“六”(UYGY)+“十”(FGH)+“四”(LHNG)+“卦”(FFHY)=“六十四卦”(UFLF)
- 多字词
取一、二、三、末字的第一位编码,如“中”(KHK)+“国”(LGYI)+“共”(AWU)+“产”(UTE)+“党”(IPKQ)=“中国共产党”(KLAI)
简码字
[编辑]指一些较常用字可以用一、二或三字母编码打出,分别称为一、二、三级简码
一级简码包含汉语(尤其是官方语体)最常用字中的25个,为了尽可能全面地安排最常用的汉字,部分一级简码并非是该字全码的首位。
但所有的二级或三级简码均为该字全码的前二或三位
一级简码如下,86版、98版和新世纪版通用
编码 | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
文字 | 工 | 了 | 以 | 在 | 有 | 地 | 一 | 上 | 不 | 是 | 中 | 国 | 同 | 民 | 为 | 这 | 我 | 的 | 要 | 和 | 产 | 发 | 人 | 经 | 主 |
速记口诀:一地在要工 上是中国同 和的有人我 主产不为这 民了发以经