User:Ceku/五代爭議取碼案/特別注意

维基教科书,自由的教学读本
跳到导航 跳到搜索

爭議編碼[编辑]

有些字的編碼雖是由朱邦復團隊親自釐定,但其作法與其他相似字頗不一致,因而一般認為可能有疏失或錯誤。一些倉頡輸入法開發者,為便利使用者,會修改有爭議的官方編碼,或加上容錯碼。

五代字首分割爭議編碼[编辑]

因實務考量,「撇捺形狀」或「蓋子形狀」字形,即「𠆢」、「八」、「大」、「夭」、「天」、「冖」、「宀」、「癶」、「𡗗」、「夂」、「⿳亠丷冖」等字形,雖輕微遮住下部字形,仍統一將其下緣視為可一刀分離,如「貧」之字首取「八」不取「分」、「奮」之字首取「大」不取「奞」、「喬」之字首取「夭」不取「呑」等等。三代手冊於介紹字首時明言「八、人、父、𡗗、⿱十冖𦥯⿱⿻十口冖、龹、龸等,當作上下分離的字首。」舉例中也列出了「癶」是字首,增訂版的舉例中還列出了「⿳亠丷冖」是字首。

五代手冊移除了以上敘述,大部分「撇捺形狀」或「蓋子形狀」的下緣仍比照三代視為可以「一刀分離」,但「癶」、「𡗗」、「夂」、「⿳亠丷冖」類字形當中,有一部分則有所更動。五代手冊於介紹字首字身時提到按「於可橫向一次截然分離處分出字首」的原則,視「螽」的字首是「冬」不是「夂」,卻同時認為「基」字的「其」能一次橫向分離作字首。附錄中的「第三代、第五代改碼字字碼對照表」亦提到基於「五、取碼原則不一致者,使其統一」修改了「螽」、「凳」、「蠢」、「惷」、「憃」的編碼,把字首從「夂」、「癶」、「𡗗」改為「冬」、「登」、「春」、「舂」。還有些字做了類似更動,但未於改碼表提及,例如「啻」把字首從「⿳亠丷冖」改為「帝」。儘管如此,五代的改碼並不統一,「癶」、「𡗗」、「夂」、「⿳亠丷冖」類字形雖有些改將其下視為不可一刀分離,但也有不少字仍視為可一刀分離。

以下分類列出五代手冊及漢文字典相關字的編碼,包括被視為不可一刀分離而修改分割方式的字,以及仍視為可一刀分離(即「未更動」,仍按標準分割方式取碼)的字:

五代字首分割爭議字形列表
主字形 更動字首 字例 補充說明
夂 竹十.火
卜十.竹手.水 例外:五代手冊除卜十.竹手.水)以外未列出其他相關字。漢文庫典則皆按標準分割方式取碼,包括卜十.竹水.水),以及:木.竹水.金)、𨼇弓中.竹水.一)、𠏤人.竹水.金)、𥫔卜十.竹水.金)。
竹口.水
竹口.心
十.竹口.心
竹田.心
卜.竹田.水
𨙅卜.竹田.人
竹卜.中戈.戈
竹卜.弓
未更動 竹水.一.竹一
Cjwm-niho.svg 木.弓廿.弓
弓廿.竹弓
𤼶弓廿.大尸
𤼷弓廿.廿
未更動 𤼴弓人.土戈.廿
弓人.竹弓.水
𣔽弓人.一大.木
𥙊弓人.一一.火
Cjwm-qk.svg 𪃣手日.竹日火
手日.中戈.戈
𧎌手日.中一戈
手日.心
𣌠手日.手日.日
𡆂口.手日.戈
𨙥卜.手日.戈
𡏑手木.土 例外:五代手冊未列出相關字。漢文庫典𡏑手木.土)視為不可一刀切開,但手大.竹木.木)則按標準分割方式取碼。
𧢆手難.月山山
𦦾手難.土.弓戈
𪆊手難.竹日火
𦦱手難.一十難
手難.心
未更動 𥘿手大.一.一火
𠒏手大.一.一山
𩶓手大.弓田.火
⿳亠丷冖 𩪙月月.卜月.口
𨬙金.卜月.口
𣚌木.卜月.口
𣚌水.卜月.口
𢕮竹人.卜月.口
𪍼十水.卜月.口
𧝐中.卜月.口
𦔝手木.卜月.口
𢴨手.卜月.口
𨅙口一.卜月.口
𠽜口.卜月.口
𡡿女.卜月.口
卜月.口
卜月.女
𧬍卜口.卜月.口
𨗁卜.卜月.口
未更動

其他爭議編碼[编辑]

以下據五代倉頡編碼排序,列出一些較有爭議的例子:

爭議編碼列表
字元 字形 五代倉頡編碼 其他倉頡編碼 補充說明
田一 輔助字形獨自成字時,普遍需要分割取碼,「曰」字取「日」不符合此規律,且導致重碼。但「曰」與「日」視覺上確實相似,有些古文的「曰」甚至呈狹長形、高大於寬,官方或因此等考量定為重複字。[1]
月一 月山 比照「目」取碼「月山」而非「月一」,「囗」亦應取碼「月山」而非「月一」。六代將此字編碼改作「月山」,似乎默認過去編碼有誤。[2]
戈戈一 卜一 上部二點為「卜」的輔助字形,應比照「斗」「头」等字適用之。六代將此字編碼改作「卜一」,似乎默認過去編碼有誤。[3]
竹人 輔助字形獨自成字時,普遍需要分割取碼,「乂」字取「大」不符合此規律,且導致重碼。六代將此字編碼改作「竹人」,似乎默認過去編碼有誤。
中中.女 十田日女 按台灣標準字形,視為整體字應較合理。比照「曲、西、丳」等字,應可允許「Cjrm-j0.svg」跨越「Cjrm-w1.svg」。[4]
中尸一一 廿廿廿一 比照「㐀」。當初可能未想到可利用「Cjrm-t6.svg」(廿)。[5]
中田中一 中田一 比照「曲、西、丳」等字,應可允許「Cjrm-l1.svg」跨越「Cjrm-w1.svg」,故取「中田一」即可,此取碼與此規律不一致。[6]
一中中一 一中中廿 似乎於當初取碼時未考慮到「廿」的輔助字形。衍生字如「啞」、「惡」、「壼」、「斲」等字同理。[7]
一中中一 一廿田 比照「曲、西、丳」等字,應可允許「Cjrm-t12.svg」跨越「Cjrm-w2.svg」,故應可取「一廿田」,此取碼與此規律不一致。「壷」同理。[8]
一女尸 一尸 雖然倉頡輸入法一般會要求保留轉角特徵,但不會為此增加取碼數,如「东」取「大木」不取「大女木」,此取碼與此規律不一致。此不一致有可能是五代倉頡的取碼字形是將第二筆視作豎折折鉤而非撇折折鉤,故不適用「Cjrm-m3.svg」輔助字形而只能取「一女尸」(Cjrm-m0.svgCjrm-v5.svgCjrm-s4.svg),但漢文庫典呈現的圖片較似呈撇折折鉤形。六代將此字編碼改作「一尸」,似乎默認過去編碼有誤,或換了取碼字形。衍生字如「兮」、「污」、「巧」、「朽」等字同理。[9]
弓戈.卜人 弓戈.人竹 官方把「癶」右半部的兩撇為「卜」的輔助字形,但「卜」的輔助字形並無兩撇的形狀;且若允許此輔助字形,相似字形「形」可能也得比照改為「一廿.卜竹」。[10]
弓弓大 弓水 「弓大」即是「又」,為「水」的輔助字形,除「又」本字外皆應取「水」,不須分割作「弓大」,故「廴」應取「弓水」。六代將此字編碼改作「弓水」,似乎默認過去編碼有誤。[11]
毋(田十竹) 田十竹 田十 即使是針對筆劃突出的「毋(田十竹)」字形取碼,比照「曲、西、丳」等字,應可允許「Cjrm-j1.svg」跨越「Cjrm-w3.svg」,故取「田十」即可,此取碼與此規律不一致。[12]
田一中中 田一中 比照「曲、西、丳」等字,應可允許「Cjrm-l1.svg」跨越「Cjrm-w1.svg」,故取「田一中」即可,此取碼與此規律不一致。[13]
  1. 相關討論:[1]
  2. 相關討論:[2]
  3. 相關討論:[3]
  4. 相關討論:[4]
  5. 相關討論:[5]
  6. 相關討論:[6]
  7. 相關討論:[7]
  8. 相關討論:[8]
  9. 相關討論:[9]
  10. 相關討論:[10]
  11. 相關討論:[11]
  12. 相關討論:[12]
  13. 相關討論:[13]