Talk:倉頡輸入法

维基教科书,自由的教学读本
跳到导航 跳到搜索

頁面一覽[编辑]

待加強部分[编辑]

  • 【倉頡字母與輔助字形】:重新挑選例字,並用顏色標出例字上的字根。
    • 例字選取原則為:1.具有代表性,能反映該字根的特色。2.盡量選常用字。3.除該字根外,其他部分應盡量簡單。
  • 【取碼原則】:字形特徵原則重新挑選例字,並調整格式,仿照包含省略的例字說明形式呈現。
  • 【例外字】:特殊字的部分改寫。
  • 【特別注意】:擴充更多字。字形差異的部分,例字改用圖片,用顏色標出主要的差異之處。
  • 【難拆字綜合辨析】擴充。

--ceku 2008年9月23日 (二) 12:20 (UTC)

【倉頡字母與輔助字形】部份已完成。--Cangjie6 (留言) 2016年8月14日 (日) 11:33 (UTC)

2018年7月To do[编辑]

輔助字形:

  • 「Cjek-b11-3.png」不用「夢」字,改用「榮」字。
  • 「马」圖片,「㇕」字根着色。
  • 「夕」圖片,「𠂊」字根着色。
  • 「齊」圖片,「ㅑ」字根着色。

例外字:

  • 「秦」複合字首圖片,黑白版及彩色版。

特別注意:

  • 楷體「閻(日弓.竹尸.難)、閻(日弓.尸竹.難)、閻(日弓.弓.竹難)」、「沒(水.竹尸.水)、沒(水.弓.水)」、「筑(竹.一.竹弓)、筑(竹.一.弓大)、筑(竹.一.弓十)」、「麻(戈.十金.金)、麻(戈.木.木)」、「反(一水)、反(弓水)」、「死(一弓戈心)、死(一弓.心)」、「⿱刀巴」、「毋(田十竹)、毋(田十)」

進階知識:

  • 「函」要做三代、五代取碼彩圖。
  • 「Egcjk-hxyc.png」長橫要塗上黃色。

--Cangjie6 (留言) 2018年7月18日 (三) 20:45 (UTC)

不建議使用楷體,因為楷體筆畫不清楚,需要較大的圖片,對行動版使用者的頻寬和螢幕都不好。同理,建議盡可能使用向量圖(svg),以方便要放大縮小的使用者,及想要修圖的編輯者。(內建字體選標楷體是因為倉頡輸入法比較多根據台灣字形取碼,台灣主流系統內建字體只有標楷體和新細明體,當時新細明體有大量舊字形造成顯示誤差,只有標楷體可選擇。現今新細明雖已更新,但考量有人用舊版而未採用;微軟正黑體則是黑體,不適合用於標準字形。總之,未製圖的範例字仍繼續使用楷體;一旦要製圖,則製成明體或宋體,這也比較接近倉頡系統使用的字形。)--ceku (留言) 2018年7月20日 (五) 15:10 (UTC)
好的,最後大概所有字最終都要做圖呢。那麼,有沒有好用的編輯svg軟件推介?對我來說這方面是首次接觸。Cangjie6 (留言) 2018年7月22日 (日) 07:56 (UTC)
感謝費心把大量字圖改為向量圖及明體,但有些字形要注意精準度,例如「File:Egcjm-msho.svg」、「File:Egcjm-bsd.svg」和標準字形差異頗大,就不太適合。這方面可多參考(或直接使用?)全字庫宋體的字形,畢竟倉頡系統過去也是有參考過CNS11643的。--ceku (留言) 2018年9月5日 (三) 19:23 (UTC)
起初我想用Glyphwiki的,但發現要每個字形下載,再拖到Ai裏作業,每次都要調過大小位置等,比先建好可以改字的底稿慢得多。而下載回來的圖,筆畫都已合併成一塊,無法取得筆畫分離的版本,這跟選用其他字型一樣要自行𠝹開筆畫,無法節省時間。結果現在我主要用開源明體「一點明體」,最主要是因為他們有支援我製作字根,此外,該字型是開源的,而且有些異體字可以選,控制點也比較潔淨。而倉頡編定時,其實台灣「標準字形」還未面世,根據是當時的傳承字形,即是說本來字典上的明體字是這樣的,反而是後來台灣教育部改形了,而其他地區未必習慣。例如我有一本父母輩傳下來的霉黃老字典,看像是用字粒印出來的。另外有一本還新淨的字典,自己依學生書單買的商務,也是傳統明體字。舉例說「爭」字那「爪」頭,在用明體字的字典裏都是這樣的,這形狀在明體裏反而比較精準。有個別字我會視乎取碼選字形,選符合倉頡取碼的,甚至自己修改。好像「⻗字頭」無論傳統明體還是台式都不合用,自己改成四個頓點;「戶」字也盡量縮短「撇」與「尸」之間那豎的高度。但那些無論傳承字形或台式寫法皆合用的,就不特別改成台式寫法,沿用原字。Cangjie6 (留言) 2018年9月5日 (三) 21:09 (UTC)

難以解釋的規則問題[编辑]

另见:倉頡輸入法/特別注意#爭議編碼

(有些問題較為難解,可能會考慮寫信向朱邦復工作室詢問

1. 何以「𢦏」取「十戈」而非按先繁後簡原則取「土戈」?——一說是引入「優先選取不截斷筆畫的取碼方式」的規則,但此說未見於官方手冊,且難以解釋何以「巳」不取「尸山」而取「口山」。

2. 三面或四面包圍的字形普遍可套用包含省略原則,何以「勹」、「戊」、「臧」不能套用包含省略?——「勹」或許可解釋為視為二面包圍,但其它顯然不能。

3. 何以「曲」、「西」、「丳」允許字形跨越「囗」,而「毋」、「曱」、「甴」、「亜」必須切斷取碼?如何決定能跨越或不能跨越?

4. 按目前歸納,「精簡原則」優先於「字形特徵原則」的「轉角分則」,否則「乃」取「弓竹尸」而非「弓竹女尸」、「东」取「大木」而非「大女木」、「与」取「卜尸一」而非「卜女尸一」、「鸟」取「心卜尸一」而非「心卜女一」、「专」取「手弓戈」而非「手女弓戈」皆為錯誤。沈紅蓮曾提及「夨」應取「女弓大」(而非「女大」)[1],與此牴觸,但漢文庫典五、六代「夨」皆編碼為「女大」,應如何解釋?

5. 何以「𡆵」取「田中中中」而非「田中一中」、「田中女中」?——曾有網友引入「對稱原則」解釋,但此說未見於官方手冊,且定義不明,又有許多難以解釋的矛盾之處(例如何以「韭」不對稱取碼「中中一一」而是「中尸一一」)。

6. 何以「亞」取「一中中一」而非「一中中廿」?

7. 五代手冊謂「山」視為延伸分割的字首。還有哪些字形可按此方式分割?比如「巫」是否視為字首「工」、字身「从」?(附錄〈常用整體字字碼表〉有列入「巫」,但也列入了字首一節己明言為組合字的「幽」,故此部分可能為筆誤)

8. 手冊言「丶」附屬於整體字形時視作整體,按此「倉」應視為字首「人戈」、字身「日竹口」?還是字首「人」、字身「戈日口」?抑或不套用此原則而取作字首「人」、次字首「丶」、次字身「日口」?決斷依據為何?

9. 三代、五代手冊皆謂「碼數相同時,選擇先繁後簡的取碼方式」,可見「精簡原則」先於「先繁後簡原則」。但有網友詢問六代倉頡何以「步」的取法是「止中的的」而非「卜中火」時,沈紅蓮回應「先繁後簡原則」優於「精簡原則」[2],與之牴觸。此外,若沈說成立,則三代「乍」取「竹尸」而非「人卜卜」、「之」取「戈弓人」而非「卜竹人」、「礻」取「戈弓火」而非「卜竹火」皆屬錯誤。

10. 「𠃊」應先取或後取?「𠦣」、「𢧠」、「𢯇」、「𢧰」等字應如何取碼?——既有官方編碼如「県」取「月山女火」,「眞」取「心.月山金」,「陋」取「弓中.一月.女」,都是後取;而「亾」取「女人」,「𦬆」取「廿.女人」,「㠩」取「女人.竹.中山」,都是先取。

11. 手冊謂「八」形視為與上部相連,如「詹」分割為「⿸厃八」「言」,但「芬」「氛」「容」「岺」「答」等字之編碼何以不從此說?單純橫筆下接縱或斜向筆畫時視為相連,但「堊」取「一一土」則似乎是分割為「⿱亞土」,所據何在?——一說若字形分合明顯則不須遵從,但是否「明顯」如何定義?例如「釁」下部似乎明顯應分割作「酉分」,但實際取碼時卻分作「酉八」「刀」;而「堊」之分合亦難稱明顯。又如「泉」、「汞」等字應視為組合字或整體字?

12. 「大」不視為與上相連,例如「槔」取「木.竹日.十」而非「木.竹大.十」;「厶」也不視為與下相連,例如「矣」、「牟」皆視為組合字。但「⿱厶大」卻視為相連,如「参」取「戈大.竹.竹竹」,「軬」取「戈大.十田十」,似乎牴觸,應如何解釋?

13. 三代及五代倉頡中,台灣標準字形的「𠫓」應取碼作「大戈」或「卜戈」?——多數舊版本取「卜戈」是因未支援台灣標準字形;但有人詢問過官方,沈紅蓮一次回說漢文庫典(2003年版五代)於「卜」部引入了新輔助字形「𠫓去丶」而取「卜戈」,但另一次去信又說沒有。此外,若此輔助字形存在,何以「车」不取「卜手」、「东」不取「卜木」?

14. 何以「𢀚」取碼「尸一一」而非「尸卜一」?「𡷊」取碼「心卜一山」而非「心卜卜山」?如何決斷可否套用「卜」的輔助字形「Cjrm-y1」?

15. 根據「完整原則」(通稱「先繁後簡原則」)「夫」取「手人」而非「十大」,但何以「未」不根據同樣原則取「手火」而是取「十木」?一說是根據「字形特徵原則」,「十木」較「手火」更符合字形特徵,但「夫」與「未」字形相似,何以便不認為「十大」較「手人」更符合字形特徵?類似地,何以「夂」取「竹水」而非「弓大」,但「夜」又取「卜人弓大」而非「卜人竹水」?

16. 「Cjrm-n11」應歸於「尸」或「弓」?按漢文庫典,「片」取「中中一尸」,但「卍」取「弓難」、「吳」取「口女弓大」、「永」取「戈弓水」,似不一致。

17. 何以「练」取「女一.大女金」而非較精簡的「女一.手木」?

18. 何以「韭」不取「廿廿廿一」而取「中尸一一」?


大家也可協助補充新問題,但數字請往下加,免得引用時亂掉。 --ceku (留言) 2018年9月4日 (二) 13:39 (UTC)

問題8:「酓」官方取「人戈弓田」,「盦」官方取「人戈弓廿」。Cangjie6 (留言) 2018年9月7日 (五) 16:07 (UTC)

我知道,不過「酓」「盦」的編碼仍然無法區分是點附於下或不點附,也不清楚是基於什麼理由判斷。--ceku (留言) 2018年9月7日 (五) 16:14 (UTC)
五代手冊說「乛」視為與下方相連,因此「⿱乛酉」應當是一個整體。若「丶」在字身能附於下,它不會只附於「乛」而應附於「⿱乛酉」。那麼,雖然「酓」的取碼看不出來,但「盦」就應該取「人.戈田.廿」。而官方取「人戈弓廿」,依前述,只可以用「人.戈.弓廿」來解釋。(除非官方又說:『「⿱今?」的字中,「乛」不向下連。只是手冊寫漏了。』這樣就無言了。)Cangjie6 (留言) 2018年9月7日 (五) 18:11 (UTC)
我覺得那批歸納原則不太可靠,不見得能全信。「乛」就字例來看主要是處理「甬」、「矛」、「了」、「氶」這類情況,頗有可能不適用於「⿱今酉」。--ceku (留言) 2018年9月7日 (五) 18:39 (UTC)

問題10:「県」官方取「月山女火」,「眞」官方取「心.月山金」,「陋」官方取「弓中.一月.女」,都是後取(「陋」的「𠃊」更是與「丙」割開);「亾」官方取「女人」,「㠩」官方取「女人竹中山」,都是前取。Cangjie6 (留言) 2018年9月7日 (五) 17:01 (UTC)

去信詢問得到的答覆是:「亾」難以區分誰高誰低,於是視為左右形。這樣好像還是不容易解決「𠦣」、「𢧠」、「𢯇」、「𢧰」等字的取碼。還有六代把「亾」取碼改成「人女」,五代三代是否也要比照?--ceku (留言) 2018年9月24日 (一) 14:38 (UTC)
感覺上相當「hea答」,其實「県、眞」等許多字形也難分高低。Cangjie6 (留言) 2018年9月25日 (二) 16:56 (UTC)

問題7:查五代手冊第二章第一節寫明了「山」視為延伸分割的字首,範例又寫了「幽」字,顯然是視為組合字。但如此一來,五代手冊附錄〈常見整體字字碼表〉列入「幽」字就是錯誤了。但整體字一節又說「噩」是整體字,這樣「巫」要比照「山」或「王」就不太好說了。--ceku (留言) 2018年9月7日 (五) 17:50 (UTC)

去信詢問得到的答覆是:內嵌字形一碼取足者視為連體字。若是這樣是否「㡭」應視為組合字?--ceku (留言) 2018年9月24日 (一) 14:38 (UTC)
感覺上相當「hea答」,「噩」也不是「內嵌字形一碼取足」,四個「口」要取四碼。Cangjie6 (留言) 2018年9月25日 (二) 16:56 (UTC)
我的理解是若鑲嵌字型可一碼取足,即視為連體字。按此,「巫」、「噩」之中的「人」、「口」皆可一碼取足,故視為連體字;而「幽」、「豳」因「幺」、「豕」超過一碼,故視為組合字。--ceku (留言) 2018年9月27日 (四) 13:54 (UTC)

問題12:「⿱厶大」實在是很坑的組合,難以解釋。是否要比照「春」「冬」「登」等歸為複合字首?--ceku (留言) 2018年9月8日 (六) 03:25 (UTC)

就是爲了這字形,當時一郎跟我吐苦水,他被某群的一些人狠狠批評。一郎他不斷指出按規則寫明的道理它不可以是字首,應當要拆作「厶=字首,大=次字首」,群中其他人只以查碼表都統一視為字首去反駁。一郎堅持規則和實際取碼不應不一致,要麼碼表有誤,要麼規則有誤。其他人都不認同看成碼表有誤,但也沒有誰在規則上能給予解釋,就只是說一郎他不了解發明人、為自己一時爽而要求改碼之類。我聽完他吐苦水,斟酌了許久才鑽空子規則化,要解釋它是字首而又不與現成規則衝突實在不易,因爲官方確是明明白白地寫着「厶」下必割。正如我昨天所言,視「⿱乛酉」爲一塊時,也因爲官方確是明明白白地寫着「乛」下必連。不過「酓」還可以用像「岺、汞」之類去解釋,「⿱厶大」實在……Cangjie6 (留言) 2018年9月8日 (六) 18:35 (UTC)
如果是複合字首,或是特別規定視為向上或向下相連,其實寫清楚就好。主要是手冊沒寫,又與已寫的東西推論出的結果牴觸,才造成困擾。--ceku (留言) 2018年9月19日 (三) 23:37 (UTC)
同意,但可能我們高估了目前活躍的倉頡族群人士。據一郎所言,他們許多人都覺得官方有光環似的,既不想完善規則,也不想改良編碼,兩邊都不想動,任由規則和編碼之間出現矛盾。Cangjie6 (留言) 2018年9月20日 (四) 12:24 (UTC)
去信詢問得到的答覆是:「大」視作與上面「厶」的橫筆相連,但「大」不與封閉形相連。但我還是不明白「大」與上相連是根據什麼規則?或許是套用「單純性橫筆與下面的縱、斜向筆畫視為相連」?但「厶」的橫筆能否算是單純性橫筆可能會有爭議……。--ceku (留言) 2018年9月24日 (一) 14:38 (UTC)
感覺上相當「hea答」,根本沒有從規則去解釋。Cangjie6 (留言) 2018年9月25日 (二) 16:56 (UTC)

問題2:去信詢問答覆是想減少記憶量。問題是一致性不重要嗎?orz...--ceku (留言) 2018年9月24日 (一) 14:58 (UTC)

感覺上也是「hea答」蒙混過關。Cangjie6 (留言) 2018年9月25日 (二) 16:56 (UTC)

問題3:去信詢問答覆是單純的「丨」須切斷,且「丳」應改碼。不過我不明白「單純」要怎麼定義?為什麼「丳」上面的兩豎是單純的豎,而「曲」上面的兩豎不是?「婁」可以比照「曲」取「十田*」嗎?「甫」在「月」上面的豎能算「單純」嗎?--ceku (留言) 2018年9月24日 (一) 14:54 (UTC)

可說是「hea答」到極點,必須揚棄。否則,「弗」的兩豎又是否單純的豎,而「弗」又要不要改正編碼?Cangjie6 (留言) 2018年9月25日 (二) 16:56 (UTC)
「弗」因「弓」不是完全的封閉字形,可能不適用此原則。--ceku (留言) 2018年9月27日 (四) 13:55 (UTC)
其實有沒有「對於囗、曰等類完全封閉形之字,若有其他字形貫穿其間時,必須切割,以保持字形特徵」的出處啊?我自己找不到。Cangjie6 (留言) 2018年9月27日 (四) 18:51 (UTC)
如原信所言寫在三代手冊,民國73年(1984年)7月再版的書是在第35頁。有些地方可以找到PDF下載。--ceku (留言) 2018年9月28日 (五) 14:54 (UTC)

問題5:去信詢問得到的答覆是該字為錯碼,「當取全」。不過我不明白具體要怎麼取。--ceku (留言) 2018年9月24日 (一) 14:44 (UTC)

不明白+1。Cangjie6 (留言) 2018年9月25日 (二) 16:56 (UTC)

問題6:去信詢問答覆是根據「字形特徵原則」而末碼不取「廿」。不過我不明白是怎麼看的。--ceku (留言) 2018年9月24日 (一) 14:49 (UTC)

不明白+1。Cangjie6 (留言) 2018年9月25日 (二) 16:56 (UTC)

問題18:去信詢問答覆是「韭」取「廿廿廿一」也可以orz...--ceku (留言) 2018年9月24日 (一) 14:44 (UTC)

即是官方錯了,但找藉口不改碼而已。Cangjie6 (留言) 2018年9月25日 (二) 16:56 (UTC)

問題17:去信詢問答覆是「练」取「女一.手木」不太容易看出「手」形。但「不太容易看出」是不那麼取碼的好理由嗎?--ceku (留言) 2018年9月24日 (一) 14:44 (UTC)

可說是「hea答」到極點,必須揚棄。許多人一眼已看出。Cangjie6 (留言) 2018年9月25日 (二) 16:56 (UTC)

問題11:去信詢問答覆是「土」、「水」不是單純的豎、撇筆,所以不視為與上相連。但「單純」要怎麼定義?手冊舉的例字「焉」的「正」下面的部分能算是單純的豎筆嗎?--ceku (留言) 2018年9月24日 (一) 14:46 (UTC)

不明白+1。Cangjie6 (留言) 2018年9月25日 (二) 16:56 (UTC)

問題15:目前有一個可能的解釋:尹卂兄的最長橫說,他曾用於解是未末等字的取碼。待我把它釐清一下,將放在臉書一朗兄的倉頡討論社群中。

方才還未登入,上面那句話是我留的。我認為最長橫一說是有理,只是尹卂兄未把他解釋清楚,或者是他見到未末二字就下結論了。TNTErick (留言) 2019年4月29日 (一) 03:43 (UTC)
「最長橫說」解釋不到「来」字爲何取「木廿」而不取「十火木」。Cangjie6 (留言) 2019年5月7日 (二) 16:33 (UTC)

問題04:若与要按照轉角不切開,也應拆為心尸一而非卜女尸一,而前者亦符合精簡。TNTErick (留言) 2019年4月29日 (一) 03:48 (UTC)

練習[编辑]

請問練習在那?為何一本教科書會無練習?--218.191.110.233

正在書寫……--222.90.94.25

請不要手動轉換異體字[编辑]

有編輯者會做些把「舉」轉換為「擧」之類的轉換,但在現今中、港、澳、台等主流漢字使用區皆是以前者為正字,《康熙字典》及許多古籍文獻也以前者為主,後者僅為少用的古字,基於個人偏好等非正當理由轉換異體字違反維基百科的方針,將視為破壞處理。--ceku (留言) 2018年8月31日 (五) 18:38 (UTC)

如果是指「㐦(HCQN)」字的「字首 + 次字首」,它的確是「擧」不是「舉」,這個有必要用「擧」,涉及到「五代默許複合字首」的註釋文字。(目前變成了「舉」,我暫時不敢改,不過是錯的。)Cangjie6 (留言) 2018年8月31日 (五) 19:39 (UTC)
使用在那裡的確是合理的,我再改改。--ceku (留言) 2018年8月31日 (五) 19:59 (UTC)

關於其中的失效連結[编辑]

在這裡有些信件及參考網站的連結,尤其是在Ejsoon的論壇地下的網域在上個月(2019/2/1前後)參訪時發現其失效。 TNTErick (留言) 2019年2月19日 (二) 01:20 (UTC)

請把連結裏的phpbb改成ph3,像這樣。我也沒仔細檢查,閣下和各位可以幫忙,謝謝!-Cangjie6 (留言) 2019年2月19日 (二) 13:50 (UTC)