五笔字型输入法/取码原则

维基教科书,自由的教学读本

五笔将汉字笔划分为五个区:即:横(同提)、竖、撇、捺(同点)、折五区。把字根或码元按一定规律分布在25个字母键上(即标准的QWERTY键盘,不包括Z)。取码时最长四码,最短一码。

2006年12月,王永民又在此基础上,研究出用于手机输入的基于6个码元和“右手法则——前四末一”取码法的数字王码。[1]

键名字[编辑]

键名是指各键位左上角的黑体字根,它们是组字频度较高,而形体上又有一定代表性的字根,它们中绝大多数本身就是汉字,只要把它们所在键连击四次就可以了。如:王:11 11 11 11(GGGG)

成字字根[编辑]

在每个键位上,除了一个键名字根外,还有数量不等的几种其它字根,它们中间的一部分其本身也是一个汉字,我们称之为成字字根。 输入方法:键名代码(该字所在键)+首笔代码(该字第一笔)+次笔代码(该字第二笔)+末笔代码(该字末笔)(如果该字根只有两笔画,则补空格键结束)。 注:五笔存在“补码字根”,即有两个编码的字根(如:犭QT、礻PY、衤PU)

86版五笔字根

  • 1区横起笔 11G 王旁青头戋(兼)五一 12F 土士二干十寸雨 13D 大犬三(羊)古石厂 14S 木丁西 15A 工戈草头右框七
  • 2区竖起笔 21H 目具上止卜虎皮 22J 日早两竖与虫依 23K 口与川,字根稀 24L 田甲方框四车力 25M 山由贝,下框几
  • 3区撇起笔 31T 禾竹一撇双人立,反文条头共三一 32R 白手看头三二斤 33E 月彡(衫)乃用家衣底 34W 人和八,三四里 35Q 金勺缺点无尾鱼,犬旁留儿一点夕,氏无七(妻)
  • 4区点起笔 41Y 言文方广在四一,高头一捺谁人去 42U 立辛两点六门疒(病) 43I 水旁兴头小倒立 44O 火业头,四点米 45P 之字军盖道建底,摘礻(示)衤(衣)
  • 5区折起笔 51N 已半巳满不出己,左框折尸心和羽 52B 子耳了也框向上 53V 女刀九臼山朝西 54C 又巴马,丢矢矣 55X 慈母无心弓和匕,幼无力

98版五笔字根

  • 1区横起笔 11 G 王旁青头五夫一 12 F 土干十寸未甘雨 13 D 大犬戊其古石厂 14 S 木丁西甫一四里 15 A 工戈草头右框七
  • 2区竖起笔 21 H 目上卜止虎头具 22 J 日早两竖与虫依 23 K 口中两川三个竖 24 L 田甲方框四车里 25 M 山由贝骨下框里
  • 3区撇起笔 31 T 禾竹反文双人立 32 R 白斤气丘叉手提 33 E 月用力豸毛衣臼 34 W 人八登头单人几 35 Q 金夕鸟儿犭边鱼
  • 4区点起笔 41 Y 言文方点谁人去 42 U 立辛六羊病门里 43 I 水族三点鳖头小 44 O 火业广鹿四点米 45 P 之字宝盖补礻衤
  • 5区折起笔 51 N 已类左框心尸羽 52 B 子耳了也乃框皮 53 V 女刀九艮山西倒 54 C 又巴牛厶马失蹄 55 X 幺母贯头弓和匕

新世纪版五笔字根

  • 1区横起笔 11 G 王旁青头五一提 12 F 土士二干十寸雨 13 D 大三肆头古石厂 14 S 木丁西边要无女 15 A 工戈草头右框七
  • 2区竖起笔 21 H 目止具头卜虎皮 22 J 日曰两竖与虫依 23 K 口中两川三个竖 24 L 田框四车甲单底 25 M 山由贝骨下框里
  • 3区撇起笔 31 T 禾竹牛旁卧人立 32 R 白斤气头叉手提 33 E 月舟衣力豕豸臼 34 W 人八登祭风头几 35 Q 金夕犭儿包头鱼
  • 4区点起笔 41 Y 言文方点在四一 42 U 立带两点病门里 43 I 水边一族三点小 44 O 火变三态广二米 45 P 之字宝盖补示衣
  • 5区折起笔 51 N 已类左框心尸羽 52 B 子耳了也乃齿底 53 V 女刀九巡录无水 54 C 又巴甬矣马失蹄 55 X 幺母绞丝弓三匕

单字输入[编辑]

除键名字和成字字根汉字之外的汉字,如果一个字可以取够四个字根(取第一、第二、第三和末字根),就全部用字根键入,只有在不足四个字根的情况下,才有必要追加识别码。

末笔字型识别码[编辑]

当一个字拆不够4个码元时,它的输入编码是:先打完码元,再追加一个“末笔字型识别码”,简称“识别码”。末笔字型识别码由汉字的末笔画代码和字型代码组成。

末笔画代码看这个字的最后一个字根的末笔画的结构来决定的:

  • 横 1
  • 竖 2
  • 撇 3
  • 捺 4
  • 折 5

字型代码是看此字的结构来的决定的:

  • 左右结构型 1
  • 上下结构型 2 (注意:像“午”这样头部为两笔或大于两笔的字可以拆为“”和“十”,视为上下结构型字;小于两笔的字,如“自”,则不能拆为“丿”和“目”,视为其他结构型字)
  • 其他结构型 3

最后组合起来就是识别码。例如"好"字,他最后笔画为“一”,所以末笔画代码就是“1”,好是左右型结构的汉字,所以“好”字的字型代码也是“1”,所以“好”识别码就是“11”,在“G”键上。 注意:诸如“延”“辻”“国”这样的(半)包围结构字,视其内部被包围的部位为末字根,如“延”“辻”“国”的末笔画代码应为折、竖、点。

拆分原则[编辑]

  • 书写顺序:即按照一般汉字书写顺序取字根。(注:86版中,像“戈”这样的部分视右下的“丿”为末笔,“万”视右下的折为末笔,“匕”视竖弯钩为末笔,等等)
  • 能散不连
  • 兼顾直观:诸如“国”这样的字应拆为“囗”“王”“丶”,而非“冂”“王”“丶”“一”;“兆”字拆为两侧的四个点和中间的“儿”。即要兼顾直观。
  • 能连不交
  • 取大优先:即按照书写顺序,字根笔画数应尽量取多,总字根数尽量少,但仍要遵守“能散不连,能连不交”的原则。

词组的录入[编辑]

  • 双字词

取第一字的前两位编码和第二字的前两位编码,如“北”(UXN)+“京”(YIU)=“北京”(UXYI

  • 三字词

取第一字的第一位编码,第二位的第一位编码,第三字的前两位编码,如“毛”(TFNV)+“泽”(ICFH)+“东”(AII)=“毛泽东”(TIAI

  • 四字词

取每一个字的第一位编码,如“六”(UYGY)+“十”(FGH)+“四”(LHNG)+“卦”(FFHY)=“六十四卦”(UFLF

  • 多字词

取一、二、三、末字的第一位编码,如“中”(KHK)+“国”(LGYI)+“共”(AWU)+“产”(UTE)+“党”(IPKQ)=“中国共产党”(KLAI

简码字[编辑]

指一些较常用字可以用一、二或三字母编码打出,分别称为一、二、三级简码

一级简码包含汉语(尤其是官方语体)最常用字中的25个,为了尽可能全面地安排最常用的汉字,部分一级简码并非是该字全码的首位。

但所有的二级或三级简码均为该字全码的前二或三位

一级简码如下,86版、98版和新世纪版通用

编码 A B C D E F G H I J K L M N O P Q R S T U V W X Y
文字

速记口诀:一地在要工 上是中国同 和的有人我 主产不为这 民了发以经