用户:Ceku/五代争议取码案/特别注意

维基教科书,自由的教学读本
跳到导航 跳到搜索

争议编码[编辑]

有些字的编码虽是由朱邦复团队亲自釐定,但其作法与其他相似字颇不一致,因而一般认为可能有疏失或错误。一些仓颉输入法开发者,为便利使用者,会修改有争议的官方编码,或加上容错码。

五代字首分割争议编码[编辑]

因实务考量,“撇捺形状”或“盖子形状”字形,即“𠆢”、“八”、“大”、“夭”、“天”、“冖”、“宀”、“癶”、“𡗗”、“夂”、“⿳亠丷冖”等字形,虽轻微遮住下部字形,仍统一将其下缘视为可一刀分离,如“贫”之字首取“八”不取“分”、“奋”之字首取“大”不取“奞”、“乔”之字首取“夭”不取“呑”等等。三代手册于介绍字首时明言“八、人、父、𡗗、⿱十冖𦥯⿱⿻十口冖、龹、龸等,当作上下分离的字首。”举例中也列出了“癶”是字首,增订版的举例中还列出了“⿳亠丷冖”是字首。

五代手册移除了以上叙述,大部分“撇捺形状”或“盖子形状”的下缘仍比照三代视为可以“一刀分离”,但“癶”、“𡗗”、“夂”、“⿳亠丷冖”类字形当中,有一部分则有所更动。五代手册于介绍字首字身时提到按“于可横向一次截然分离处分出字首”的原则,视“螽”的字首是“冬”不是“夂”,却同时认为“基”字的“其”能一次横向分离作字首。附录中的“第三代、第五代改码字字码对照表”亦提到基于“五、取码原则不一致者,使其统一”修改了“螽”、“凳”、“蠢”、“蠢”、“憃”的编码,把字首从“夂”、“癶”、“𡗗”改为“冬”、“登”、“春”、“舂”。还有些字做了类似更动,但未于改码表提及,例如“啻”把字首从“⿳亠丷冖”改为“帝”。尽管如此,五代的改码并不统一,“癶”、“𡗗”、“夂”、“⿳亠丷冖”类字形虽有些改将其下视为不可一刀分离,但也有不少字仍视为可一刀分离。

以下分类列出五代手册及汉文字典相关字的编码,包括被视为不可一刀分离而修改分割方式的字,以及仍视为可一刀分离(即“未更动”,仍按标准分割方式取码)的字:

五代字首分割争议字形列表
主字形 更动字首 字例 补充说明
夂 竹十.火
卜十.竹手.水 例外:五代手册除卜十.竹手.水)以外未列出其他相关字。汉文库典则皆按标准分割方式取码,包括卜十.竹水.水),以及:木.竹水.金)、𨼇弓中.竹水.一)、𠏤人.竹水.金)、𥫔卜十.竹水.金)。
竹口.水
竹口.心
十.竹口.心
竹田.心
卜.竹田.水
𨙅卜.竹田.人
竹卜.中戈.戈
竹卜.弓
未更动 竹水.一.竹一
Cjwm-niho.svg 木.弓廿.弓
弓廿.竹弓
𤼶弓廿.大尸
𤼷弓廿.廿
未更动 𤼴弓人.土戈.廿
弓人.竹弓.水
𣔽弓人.一大.木
𥙊弓人.一一.火
Cjwm-qk.svg 𪃣手日.竹日火
手日.中戈.戈
𧎌手日.中一戈
手日.心
𣌠手日.手日.日
𡆂口.手日.戈
𨙥卜.手日.戈
𡏑手木.土 例外:五代手册未列出相关字。汉文库典𡏑手木.土)视为不可一刀切开,但手大.竹木.木)则按标准分割方式取码。
𧢆手難.月山山
𦦾手難.土.弓戈
𪆊手難.竹日火
𦦱手難.一十難
手難.心
未更动 𥘿手大.一.一火
𠒏手大.一.一山
𩶓手大.弓田.火
⿳亠丷冖 𩪙月月.卜月.口
𨬙金.卜月.口
𣚌木.卜月.口
𣚌水.卜月.口
𢕮竹人.卜月.口
𪍼十水.卜月.口
𧝐中.卜月.口
𦔝手木.卜月.口
𢴨手.卜月.口
𨅙口一.卜月.口
𠽜口.卜月.口
𡡿女.卜月.口
卜月.口
卜月.女
𧬍卜口.卜月.口
𨗁卜.卜月.口
未更动

其他争议编码[编辑]

以下据五代仓颉编码排序,列出一些较有争议的例子:

争议编码列表
字元 字形 五代仓颉编码 其他仓颉编码 补充说明
田一 辅助字形独自成字时,普遍需要分割取码,“曰”字取“日”不符合此规律,且导致重码。但“曰”与“日”视觉上确实相似,有些古文的“曰”甚至呈狭长形、高大于宽,官方或因此等考量定为重复字。[1]
月一 月山 比照“目”取码“月山”而非“月一”,“囗”亦应取码“月山”而非“月一”。六代将此字编码改作“月山”,似乎默认过去编码有误。[2]
戈戈一 卜一 上部二点为“卜”的辅助字形,应比照“斗”“头”等字适用之。六代将此字编码改作“卜一”,似乎默认过去编码有误。[3]
竹人 辅助字形独自成字时,普遍需要分割取码,“乂”字取“大”不符合此规律,且导致重码。六代将此字编码改作“竹人”,似乎默认过去编码有误。
中中.女 十田日女 按台湾标准字形,视为整体字应较合理。比照“曲、西、丳”等字,应可允许“Cjrm-j0.svg”跨越“Cjrm-w1.svg”。[4]
中尸一一 廿廿廿一 比照“㐀”。当初可能未想到可利用“Cjrm-t6.svg”(廿)。[5]
中田中一 中田一 比照“曲、西、丳”等字,应可允许“Cjrm-l1.svg”跨越“Cjrm-w1.svg”,故取“中田一”即可,此取码与此规律不一致。[6]
一中中一 一中中廿 似乎于当初取码时未考虑到“廿”的辅助字形。衍生字如“哑”、“恶”、“壸”、“斲”等字同理。[7]
一中中一 一廿田 比照“曲、西、丳”等字,应可允许“Cjrm-t12.svg”跨越“Cjrm-w2.svg”,故应可取“一廿田”,此取码与此规律不一致。“壷”同理。[8]
一女尸 一尸 虽然仓颉输入法一般会要求保留转角特征,但不会为此增加取码数,如“东”取“大木”不取“大女木”,此取码与此规律不一致。此不一致有可能是五代仓颉的取码字形是将第二笔视作竖折折钩而非撇折折钩,故不适用“Cjrm-m3.svg”辅助字形而只能取“一女尸”(Cjrm-m0.svgCjrm-v5.svgCjrm-s4.svg),但汉文库典呈现的图片较似呈撇折折钩形。六代将此字编码改作“一尸”,似乎默认过去编码有误,或换了取码字形。衍生字如“兮”、“污”、“巧”、“朽”等字同理。[9]
弓戈.卜人 弓戈.人竹 官方把“癶”右半部的两撇为“卜”的辅助字形,但“卜”的辅助字形并无两撇的形状;且若允许此辅助字形,相似字形“形”可能也得比照改为“一廿.卜竹”。[10]
弓弓大 弓水 “弓大”即是“又”,为“水”的辅助字形,除“又”本字外皆应取“水”,不须分割作“弓大”,故“廴”应取“弓水”。六代将此字编码改作“弓水”,似乎默认过去编码有误。[11]
毋(田十竹) 田十竹 田十 即使是针对笔划突出的“毋(田十竹)”字形取码,比照“曲、西、丳”等字,应可允许“Cjrm-j1.svg”跨越“Cjrm-w3.svg”,故取“田十”即可,此取码与此规律不一致。[12]
田一中中 田一中 比照“曲、西、丳”等字,应可允许“Cjrm-l1.svg”跨越“Cjrm-w1.svg”,故取“田一中”即可,此取码与此规律不一致。[13]
  1. 相关讨论:[1]
  2. 相关讨论:[2]
  3. 相关讨论:[3]
  4. 相关讨论:[4]
  5. 相关讨论:[5]
  6. 相关讨论:[6]
  7. 相关讨论:[7]
  8. 相关讨论:[8]
  9. 相关讨论:[9]
  10. 相关讨论:[10]
  11. 相关讨论:[11]
  12. 相关讨论:[12]
  13. 相关讨论:[13]