倉頡輸入法/漢字分割

维基教科书,自由的教学读本
跳到导航 跳到搜索
 輔助字形 倉頡輸入法
漢字分割
基本取碼 

倉頡輸入法是按照漢字的結構特徵取碼,因此要清楚瞭解分割漢字的位置,才能正確取碼。

分割漢字的核心概念是以視覺(而非字義或筆順)判斷漢字能否分割,不能分割者為「整體字」,能分割者為「組合字[1],並將其分割為「字首」、「字身」二部分;「字身」若還能分割,則按相同方式再分割為「次字首」、「次字身」二部分。[2]分割完後再對各部分分別取碼。

組合字[编辑]

以視覺判斷漢字能否分割,能分割者為「組合字」(或稱「分體字」)。

字首與字身[编辑]

組合字可將第一部分分離為「字首」,其餘部分則為「字身」。視組合形態不同,大略可分為以下兩種分割方式:

基本分割[编辑]

可縱向或橫向「一刀分離」者,其「最左側」或「最上方」的部分定義為字首。

分類 圖例 字例
左右形 左右形 肌江綠俎觀鄰語撫韻鏈
框澹個烟條滌謝辯順州
上下形 上下形
微曲上下形
昌吉字想變產煎爰萌巓
盆合祭券喬冠旁憂囊孛

注意:

  • 「撇捺形狀」(八、人、𠆢、癶等)或「蓋子形狀」(冖、宀等)的下緣有時看似不易以直刀分割,切口會有點曲,但仍一律視為可以「一刀分離」。如以上「盆」、「祭」、「喬」、「旁」等字。
  • 有些漢字恰好可縱向也可橫向「一刀分離」,此時則按對漢字的一般認知分割。例如把「萌」橫向分割為「艹」「明」,而非縱向分割為「⿱十日」「⿱十月」。

延伸分割[编辑]

一些字典上慣用且位置固定的字形有一部分向右方或下方延伸(下右延伸左下延伸右下延伸),或以三面、四面包住另一字形(三面缺右三面缺下三面缺上四面包圍),為取碼方便,亦視為字首。如以下字例:

圖例 字例
下右延伸 旭尬延迎爬瓞毯瓩起颱魅鼴
左下延伸 雁麻屁房危詹眉病産差
右下延伸 司可句式武哉韱或彧飛
三面缺右 匡區
三面缺下 同向周凰戚臧開鬧间
三面缺上 凶凼
四面包圍 回國
山形 幽豳

練習[编辑]

按此進行漢字分割練習(一)

次字首與次字身[编辑]

組合字的字身可比照分割漢字的邏輯嘗試分割,可分割者則分割為「次字首」與「次字身」,不可分割者則不分割。字身分割與字首形狀無關,分割字身時暫時無視字首即可,如以下字例(字首為紅色、次字首為藍色、次字身為綠色):

分類 圖例 字例
字身為左右形 多列形下方左右形
右上左右形右下左右形
右內左右形框內左右形
謝條滌順州萌巓前寢养
迎巡逃雁麻屁履匑氘氚
匯匪囮圝閥闞鬭鬪网幽
字身為上下形 右旁上下形多層形
右上上下形右下上下形
右內上下形框內上下形
撫韻語優橋答憂盆參喬
颱毯尬趫詹屬疹貳司⿹气奧
區匿凰圈圐圓同閻閤𩰟
字身為延伸形 右旁下右延伸形右旁四面包圍形
下旁下右延伸形下旁四面包圍形
右上包圍形下方四面包圍形
鏈澹媚銅框汹佩鐦個烟
蓮筵產苟筐齒藏奩嵐画
庭屆廜闼閫國廻迥鼴匈

注意規則是「把漢字切一刀分出字首、字身,再把字身切一刀分出次字首、次字身」,即使字首可以分割,也不能「切兩刀後依序取字首、次字首、次字身」。如以下字例:

正確分割 哲 導 頒 盔 憠 頲
錯誤分割 哲 導 頒 盔 憠 頲

按此,有些字的異體寫法,會導致不同的分割方式:

基本分割型 上下形懬 上下形垕
延伸分割型 左下延伸懬 左下延伸垕

此外也特別注意「順」、「鵬」、「貧」等字的分割方式。初學者往往會受「部首」觀念影響,而把漢字分割為「部首」及「非部首」,例如把「順」字分割為字首「川」和字身「頁」。但倉頡輸入法純粹根據字形在「最左側」或「最上方」可「一刀分離」之處分割,與部首無關,例如「順」字應於最左側一刀分離出「丿」作為字首,接著將字身於最左側一刀分離出「丨」作為次字首,最後剩下「⿰丨頁」為次字身。同理,其他類似字分割如下:

先分字首 念 盆 麗 剪 黿 鵬 順 條 彬 頫
字身再切 念 盆 麗 剪 黿 鵬 順 條 彬 頫
錯誤切割 念 盆 麗 剪 黿 鵬 順 條 彬 頫

採用這種分割規則是為了方便視覺辨識,因為字典的部首是根據「字義」決定,沒有固定位置,導致某些漢字難以判斷部首所在,例如「鳴」看似「口」部實為「鳥」部。倉頡輸入法的設計與過去習慣不一致,但熟悉以後便能提高檢索漢字的效率。

練習[编辑]

按此進行漢字分割練習(二)

整體字[编辑]

筆劃彼此相連,無法分割;或雖非全部交連,但形勢上為一完整個體者,稱為「整體字」(又稱「連體字」)。

一些漢字筆劃,有些人會寫成相連,有些人則否,不易判斷是否相連,以下為一些歸納的判斷原則,用於處理這種模稜兩可的情況:[3]

  • 形勢上爲完整個體者,視爲整體字。[4]
此類字又可大致歸納為二小類,一是字形交錯無法作前述「基本分割」或「延伸分割」者,如:西……等;一是僅能勉強作「延伸分割」且分出之字首將過於繁複者,如:……等。
  • 點(Cjrm-i1.svg)附屬於整個字形時,視爲相連。[5]
如:……等字皆視爲整體字。
※「」字在三代視為組合字,字首為「免」(向右下延伸),字身為「丶」;五代則把「丶」視為附屬於整體,故「兔」視為整體字。
  • 撇、點與下面筆劃視為相連。[6]
如:……等字皆視爲整體字。
  • 單純性橫筆與其下之單純性縱、斜向筆畫視為相連。[7]
如:……等字皆視爲整體字。
※注意折筆或封閉形狀下的橫筆非屬單純,不與下面視為相連,如:……等字皆視為組合字。
  • Cjrm-c5.svg」、「Cjrm-c3.svg」、「Cjrm-c6.svg」、「Cjwm-hu.svg」、「Cjrm-c2.svg」與其上的橫向筆劃視爲相連。[8]
如:西……等字皆視爲整體字。
又如:……等字的字首皆包含了「Cjrm-c6.svg」、「Cjrm-c3.svg」、「Cjrm-c5.svg」。
同理,……等字的次字首皆包含了「Cjrm-c5.svg」或「Cjrm-c3.svg」。
視爲整體字 六 其 共 允 兇 兜 幸 業
八歸入字首 袞 基 恭 夋 㚇 空 養 夔
八歸入次字首 囂 釁 寡
  • Cjrm-c2.svg」與其下的橫向筆畫視為相連。[9]
如:、……等字皆視為整體字。
又如:等字,「Cjrm-c2.svg」皆與下接部件一同視為字首。
視爲整體字 弟 幸 業
丷歸入字首 Cutm-tbln.svg Cutm-tvii.svg Cutm-cwa.svg
  • Cjrm-y1.svg」、「龴」、「Cjrm-n2.svg」、「Cjrm-n4.svg」與其下部視為相連。[10]
如:、……等字皆視為整體字。
視爲整體字 鹵 甬 承 角
  • 「撇捺形狀」或「蓋子形狀」(即「Cjrm-c5.svg」、「Cjrm-c3.svg」、「Cjrm-o3.svg」、「Cjrm-o4.svg」、「Cjrm-k0.svg」、「Cjrm-e4.svg」、「Cjwm-niho.svg」、「Cjwm-bno.svg」、「Cjrm-b11.svg」、「Cjrm-j2.svg」等),通常視爲可和下方部件「一刀分離」。[11]
如:等字,字首與字身都視爲一刀橫向分離。
八形、冖形與下分離 會 兌 全 秦 脊 祭 冗 字 學 孛 憂
※但因「Cjrm-c6.svg」、「Cjrm-c3.svg」等形與上方相連的原則,等字上方的「Cjwm-bc.svg」、「Cjwm-jc.svg」視爲整體而不切開。
  • Cjrm-y2.svg」、「Cjrm-y3.svg」、「Cjrm-y4.svg」、「Cjrm-b16.svg」、「Cjrm-i3.svg」通常視爲可和下部「一刀分離」。[12]
如:等字,皆以「亠」、「爫」、或「厶」為字首。
亠、厶與下分離 雍 玄 畜 率 矣 牟
※但因縱、斜向筆畫或「Cjrm-c5.svg」、「Cjrm-c2.svg」等形與上方相連的原則,Cjh6m-yb2.svgCjwm-yslb.svgCjwm-ic.svgCjwm-ik.svg、……等字形皆視爲整體。
亠黏他形者 斍 產 恋 巟 袞 音 産 旁 帝 𠅘 髙
厶黏他形者 夋 軬
  • 例外字〉一節談及的複合字首、複合字、難字、特殊字,皆視爲整體,不再分割,也不再與其他筆劃視為相連。[13]
如:鹿……等。

練習[编辑]

按此進行漢字分割練習(三)

附註[编辑]

  1. 《第五代倉頡輸入法手冊》稱為「整體字」、「組合字」;二代及三代手冊稱為「連體字」、「分體字」。
  2. 《第五代倉頡輸入法手冊》第二章第二節提到:「整體字本無字首、字身之分,為統一取碼觀念,特以其第一碼為字首,其餘部份為字身,故整體字取1—4碼。」第二章第一節介紹漢字分割時亦未提及整體字需要分割。按此發明人原意當是整體字不須分割,惟取碼時「假定」分割,以套用類似組合字的取碼方式。本教科書於取碼說明時會以「.」區分字首與字身及次字首與次字身,例如「木.一一.口」表示「木」為字首、其後為字身,又其中「一一」為次字首、「口」為次字身。為避免混淆,本教科書於解說時一律不分割整體字,例如「其」的編碼標示為「廿一一金」而非「廿.一一金」,以免讀者難以分辨是整體字或組合字。
  3. 五代手冊已言「中文字形體各異,筆畫複雜,很難用簡單清楚的文句定義『整體字』」,其就此部分描述,與實際碼表比對,亦難稱完備。以下內容除五代手冊,亦參酌三代手冊、實際編碼字例、及其他倉頡教材增補。
  4. 五代手冊〈整體字〉:「2.字形筆畫雖非完全全部交連,但形勢上為一完整個體者。如:島、烏、焉、來、乘、乖、噩、坐、禺、离等。」1994年版三代手冊〈連體字〉:「(5)鳥、烏、馬、裊、島‥等字亦視為連體字。」
  5. 五代手冊〈整體字〉:「3.丶附屬於整個字形,視為一整體字。如:寸、永、兔、甫、犬等。」1994年版三代手冊〈連體字〉:「(6)點(丶)皆視為與該字體相連,凡點在上方,均視為最高位。如犬、甫、尤。」
  6. 1994年版三代手冊〈連體字〉:「(2)斜、點與其下面字形筆劃相接。如良、自、乖。」
  7. 五代手冊〈整體字〉:「1.單純之丨、丿筆畫與其上的字形相連。如:干、黃、焉、歹、刀、卑等。」1994年版三代手冊〈連體字〉:「(1)橫向筆畫與縱、斜向視為相連。如亡、正、步。」1984年版三代手冊〈連體字取碼〉:「1.橫向筆畫與縱、斜向筆畫,視為相連。如:焉、步、乖」。又網友去信詢問「阜」、「枼」何以不視為整體字,並推測上方的橫筆須為「單純性橫筆」方適用此規則,沈答是,故按此補。
  8. 五代手冊〈整體字〉:「2.八、Cjrm-c6.svg、儿等形狀與其上部相連。如:真、貝、興、夔、西、見、兀等。」1994年版三代手冊〈連體字〉:「(4)儿、八視為與上相連。如兒、免、兇、頁、貝、與、興。」
  9. 1984年版三代手冊〈連體字取碼〉:「(3)凡Cjrm-y1.svgCjrm-n2.svgCjrm-n4.svgCjrm-t13.svg等字形,視為與下相連,如桌、甬、角、業。」但顯然與「前」、「兹」之分割方式不符,故修正為Cjrm-c2.svg與下面橫筆相連。
  10. 五代手冊〈整體字〉:「4.Cjrm-n2.svgCjrm-n4.svg與其下的形狀相連。如:甬、矛、及、角、龜、色等。」1994年版三代手冊〈連體字〉:「(3)凡Cjrm-y1.svg、龴、Cjrm-n4.svgCjrm-t12.svg等字形與下相連,如桌、甬、角、色、業。」
  11. 1984年版三代手冊〈字首〉:「2.八、人、父、𡗗、⿱十冖、𦥯、⿳十中冖、龹、龸等,當作上下分離的字首。」
  12. 1994年版三代手冊:「亠、八、爫、𠆢等字形視作與下面分離,皆屬單字首。如:畜字首為“亠”不為“玄”;盆字首為“八”不為“分”。」
  13. 五代手冊〈整體字〉:「3.在第四節中的複合字、難字、特殊字等例外字,均視為整體字。」按複合字首及複合字之實際取碼字例增補「不再與其他筆劃視為相連」。


 輔助字形 倉頡輸入法
漢字分割
基本取碼