現代五筆

現代五筆

現代五筆是漢字輸入法之一,旨在培養和造就頂尖的打字人才,是廣大電腦用戶不容錯過的選擇。現代五筆在高效性輸入法群體中,堪稱一絕,其字根的全新最佳化組合,重碼率的大幅度降低,是最先進資料庫處理的結果。高效的輸入法不易用,易用的輸入法不高效。這一對輸入法史上由來已久的矛盾,在現代五筆中得到了合理解決。現代五筆輸入法的普及套用,將有效降低廣大電腦用戶的勞動強度。

基本介紹

  • 中文名:現代五筆
  • 發明人:李明
  • 目的:旨在培養和造就頂尖的打字人才
  • 特點:簡樸實用 高效快捷 易學快用
  • 分類:漢字輸入法之一
基本介紹,三大特點,簡樸實用,高效快捷,易學快用,記憶規則,漢字取碼,單字輸入,詞組輸入,對比差異,部件差異,補碼差異,取碼差異,拆分差異,關於重碼,掩蓋重碼,絕對幾率,軟體版本,編 後,

基本介紹

漢字輸入法之一,現代五筆屬形音碼,由大手筆、大眾形音改進而來。
現代五筆
現代五筆

三大特點

簡樸實用

三碼拆分,輔以音碼,畫龍點睛。居末的音碼,用於分解重碼,取代“末筆字型交叉識別碼”。

高效快捷

採用26個字母鍵編碼。一級簡碼26個、二級簡碼669個、90%的漢字三碼內敲定。辭彙量大,重碼極少。

易學快用

字根表設計採用“米字型+雙摺”結構,做到了藝術性與目標性相統一,無需口訣。比現有的僵硬式的口訣記憶快的多,且難以忘卻。

記憶規則

現代五筆
①筆畫部件的分布:米字型+雙摺
米字型規則的具體解釋是:
一橫、二橫、三橫按米字橫的走向設定在SDF橫線上;一豎、二豎、三豎按豎的走向設定在EDC豎線上;一撇、二撇、三撇按撇的走向設定在RDX斜線上;一點(含捺)、二點、三點按捺的走向設定在WDV斜線上,從而構成“米”字型。
“左折”代表任意的順時針折,設定在 J 鍵上,“右折”代表任意的逆時針折,設定在 L 鍵上。
米字型處於左手輸入區核心部位,歸納了四種筆畫部件。雙摺處於右手輸入區核心部位,歸納了第五種筆畫“折”的兩種類型。
“D”鍵是米字型四種筆畫部件的交匯點。“EDC”為“米”字的對稱軸,將點撇對稱分割。此軸有順口溜形容:“蘿蔔菜心晾樹(豎)乾,小二當家挑重擔,田上做工長出米,四面方框匯山川”。
②形近、形似的字根聚集在同一鍵位上
如下表:
現代五筆
③部件與所在鍵位字母形似
如“丁”在 J 鍵上、“乚”在 L 鍵上。“阝”在 B 鍵上、“乂”在 X 鍵上、“屍”在 P 鍵 上、“匚”在 C 鍵上、“巾”在 M上、“艹”在 H 鍵上、“之”在 Z 鍵上。
④部件與所在鍵位字母音托
“口木土石又乃廣舟”8部件分別在“K M T S Y N G Z”8個鍵位上。
⑤字根的鍵盤分布注重方位特性
按地圖左西右東的方位,“西”部件在西邊,因此設定在A鍵上,“七”部件(東字頭,意味東)在東邊,因此設定在L鍵上,正所謂:(如)來大弗居住西方,王母娘娘居住東方。宀、、在上,灬、、豕在下,糹、弓、 忄在左,夂、戔、在右,均是從方位角度考慮設定的,需用心體會,加深記憶。
需要硬記的字根僅6對,它們是:“十門”在G上,“火雨”在O上,“八小”在U上,“蟲”在Y上、“礻衤”在L上,“目”在P上。至此,字根記憶完畢。

漢字取碼

單字輸入

1.普通單字:取一、二、末3個部件碼(不足3碼只取前2碼)與1個音的補碼。
如:“風”拆分為“幾”、“乂”,對照字根表,“幾”部件在 B鍵上、“乂”部件在 X鍵上,那么“風”字的編碼就是:BX。但此時同時出現“風”和“隍”現個字(重碼),想要“風”,則加打風字讀音的首字母F即可。
又如:“薇”字,拆分為“艹”、“彳”、“山”、“一”、“幾”、“夂”。對照字根表,“艹”部件在 H 鍵上、“彳”部件在D 鍵上、“夂”部件在 O 鍵上,則“薇”字的編碼是HDOW。
2.鍵名字:連擊該鍵四次。
鍵名字是從鍵面字中獨立出來的、作為鍵名而特別定義其編碼的漢字。
現代五筆
3.鍵面字:主碼後依次鍵入該字的單筆畫(不足四碼補以音碼)。
鍵面字是除鍵名字以外,本身就是漢字的字根。如“氣”字,輸入主根“氣”後,再依次輸入“丿、一、一”三筆畫;再如“廠”字,輸入主根“廠”後,再依次輸入“一、丿”及“廠”字的首音“C”。

詞組輸入

1.二字詞──取每個字的前兩碼。如“問題”一詞,輸入“問”字前兩碼“G、K”後,再輸“題”字的前兩碼“F、S”即可。
2.三字詞──取前兩字的首碼及第三字的前兩碼。如“國務院”一詞,輸入“國務”兩字的首碼“C、O”後,再輸“院”字的前兩碼“B、U”即可。
3.四字詞──取各字的第一碼。如“有限公司”一詞,依次輸入每個字的第一碼“N、B、U、J”即可。
4.多字詞──取前三字和最後一字的首碼,如:“中華人民共和國”一詞,依次輸入“中華人”三字的第一碼“K、I、I”後,再輸“國”字的第一碼“C”即可。

對比差異

與傳統五筆對比:

部件差異

傳統五筆字根量是199個。現代五筆字根量是185個,是在傳統五筆的經驗上,去粗取精,字根選用力求少而精。降低重碼,力求均衡性。
現代五筆
傳統五筆是採用漢字常規部件的最早期代表,不理想的是多出了諸如“由、甲、早、羽、六、辛等組字能力不強以及等不規範的構字部件,增大了字根記憶量。

補碼差異

傳統五筆所採用的末筆字型交叉識別碼,人為地加入了過多的邏輯性思維,用戶在使用過程中,時常難以流暢的輸入。
現代五筆採用單字的首音作為補碼,不僅取碼變得輕鬆,而且末筆用音碼收尾,恰好貼合人們書寫漢字、默念其聲的習慣,顯得自然流暢,不費心力(參閱“概念”篇“末筆補碼”主題)。

取碼差異

傳統五筆取碼為單字一、二、三、末四部件,通常存在著三次拆分;現代五筆取碼為單字一、二、末三部件,通常只有兩次拆分,拆分簡約化。其優勢表現:
1、減少了拆分工作量
少一碼拆分就意味著少一碼工作量,對於多部件取碼的單字就能體現這一差別。
最後一位音碼是補碼,起分解重碼的作用,不增加拆分難度,在實際輸入的時候,較少用到。
2、降低了拆分難度
第三碼大多介於漢字結構內部,拆分就相對困難。現代五筆避難就易,取一、二、末三個形碼,避開第三碼(不包括作為末碼的第三碼),因此在拆分識碼上比傳統五筆更簡易,輸入生僻字速度更快。

拆分差異

傳統五筆是在國家《部件規範》與《筆順規範》發布前問世的。現代五筆是新世紀後的技術成果,力求拆分規範、合理。兩者拆分的差異現列舉例:
1、“象”字的拆分。“象”與“兔”第二部件均為“口”,傳統五筆將“象”的第二部件視為“”。這個在現代五筆中得到了統一與糾正。
2、“貌”字的拆分。傳統五筆拆分為:“”、“”、“白”、“兒”。現代五筆拆分為“豸”、“白”、“兒”。豺、豹、貂、貊、藐、霾、貅、豸、邈、貉等字拆分同理。
3、“於”字的拆分。由於傳統五筆硬性規定“左豎鉤”為“丨”,那么“於”就拆分為“一”、“十”。現代五筆拆分為“二”、“亅”(左折)。
4、“戊”字的拆分。傳統五筆拆分為:“廠”、“”、“丶”、“丿”(為規避重碼,傳統五筆最後的“撇”為硬性規定)。現代五筆拆分為 “廠”、“”、“丿”、“ 丶” 。同理,“戌、戍、越、成、減、臧、我、瓦、瓶、瓷”等字,按筆順規範,最後都是以“點”收尾的。

關於重碼

形碼輸入法字根多。傳統五筆字根量199個,98王碼字根量227個,天然碼字根量246個。常規的漢字構字部件,其數量是相對固定的,不管你如何布局,一般在180-240之間。
重碼率與輸入法類型及編碼方案關係最為密切,極少有輸入法將自已的重碼字公之與眾。

掩蓋重碼

近年來,網上竟然有輸入法宣稱只有幾十個重碼字,實在令行家難以置信。當然他們的重碼字是不能公布的。因為,一公布就會露馬腳,這裡有三種典型的情況:
一、輸入法作者自定重碼字標準
為了將自創輸入法推廣出去,在談及重碼字數量時,他們採用了靈活的說法。並堂而皇之地認為:有簡碼的重碼字就不再是重碼字,理由是這些字可以通過簡碼來輸入。
在這種心態支配下,他們只將沒有簡碼字的重碼字確定為重碼字,如此,情況就大不一樣了,原來被認為的600個重碼字,就只剩下不到200個了。
我們認為:重碼字作為輸入法品質優劣性的重要指標,應以全碼字為定義對象,否則就沒有定義的必要了。
二、採用“取頭斷尾”法來掩蓋真實的重碼字
假設輸入法真正的重碼字有600個(設為300組),想讓用戶認為無重碼,只要從構成重碼的每對中選取一個字,也就是選擇300個字設定成簡碼字,然後將該字的全碼捨去即可。
簡碼字是從眾多符合篩選條件的字中嚴格挑選出的高頻字,如果將原本要安置高頻字的簡碼空位讓給某些重碼字,讓這些“濫竽充數”者占據主位,勢必會影響總體輸入效率。
三、在編碼對象上做文章
國標一級漢字共有3755個,一般來說,常用字都在其中,二級漢字共有3008個,其中大部分為冷避字。輸入法的基本編碼對象應是這6763個漢字。如果一個輸入法作者在這個基本編碼對象上做點文章,掩蓋自身的重碼率,那也是容易做到的。
若有重碼字600個,只要在重碼字中選擇120個相對冷避的漢字刪除掉,與之相配對的另一重碼字也就不存在了,這樣一來,總量上就少了240個重碼字。

絕對幾率

最為常見的是以26個字母鍵、碼位數為4的輸入法。因此,我們就以這種典型的輸入法來討論重碼字發生的幾率。
這種典型的輸入法,其編碼空間總量為:456976位(26的4次方),而編碼對象是6763個國標漢字(不加入詞組),在這種條件下,所編出的輸入法,其編碼空間占用的情況是:
456976÷6763=67.57,也就是:6763個字占用了約六十八分之一的編碼空間
此時,每輸入1個漢字,其重碼的發生幾率為:67.57分之1(456976除以(6763-1)=67.58),或者說每輸入67.58個漢字後,就會產生一對重碼,這樣累計,輸完6763個漢字,會產生6763乘以1/67.58=100.1對重碼。從這個原理上來說,以26個字母鍵、碼位數為4編碼的輸入法,其重碼發生的幾率所產生的重碼為100對。
以上是從絕對均衡的條件下預測的。實際上,漢字外形結構與讀音的類同性、編碼規則、字根規則的原則性等因素,影響漢字在編碼空間內均衡分布,其結果只會增大重碼的發生幾率。
就全形碼輸入法來說,漢字結構的類同性造成重碼發生幾率的增加,首先展示在構字能力特強的一些部件上,如“口”、“亻”、“艹”、 “釒”、“氵”、“木”等,造成某些漢字聚集在編碼空間的某一區間或層面上,從而使重碼的發生幾率增高;其次顯露在某些相近特徵的漢字上,產生“惰性”重碼。每種編碼規則類型,都有其相應的“惰性”重碼。如“贏羸蠃嬴” 、“微徽徵”、“齠齬”、“蝥蟊”等漢字相對全形碼而言,就是“惰性”重碼,在編碼規則確定為“一二三末”之後, 無論字根位置如何調整,這些重碼都在所難免。
以上編碼空間占用原理告訴我們:以26個字母鍵、碼位數為4編碼的輸入法,重碼發生的絕對幾率所產生的重碼為100對,這是理論上的臨界值,實踐中,設計者降低重碼的理性期望值,是不能少於這個臨界值的。少於這個臨界值的期望,是不現實的。

軟體版本

現代五筆除官方版本(只能輸入GB內漢字)外,還有極點五筆、多多輸入法生成器、小小輸入法等平台下製作的版本。這些非官方版本可以輸入GBK漢字,功能更靈活。

編 後

漢字輸入技術一直是制約電腦在中國廣泛深入套用的瓶頸。一位從事學習軟體編寫的朋友曾這樣說過:“輸入法數量不少,品質堪憂……漢字輸入法的設計已窮途末路了”。
此話聽起來,雖讓人對中文輸入法的前景產生悲觀情緒,但卻道出了當今漢字輸入技術的現狀,那就是自1986年傳統五筆普及二十多年以來,漢字編碼技術的發展再也沒有前進一步,現有的技術水平與人們的實際需要還有相當長的差距。
輸入法的發展前景是不是真的就到了山窮水盡的地步?答案是否定的。綜觀各種類型的輸入法,我們發現輸入法編碼創新中仍然存在一個“盲區”,而這個“盲區”蘊藏著構造輸入法“金字塔”真正的基石。那就是將“音”的積極因素揉合到形碼的編碼方案中來,形成強大的合力(兩邊之和永遠大於第三邊)。現代五筆就是在這種方案指導下研製成功的,在崎嶇的輸入法發展道路上,樹立起一塊新的里程碑!
現代五筆不同於任何華而不實的輸入法。她擯棄虛無的妄想,以科學嚴謹的態度,腳踏實地的作風,突破了全形碼狹隘的設計觀,將中文輸入法設計水平上升到了一個更高的層次。
現代五筆旗幟鮮明地反對那些譁眾取寵,或帶有捉迷藏意味的輸入法。那些輸入法的典型特點就是舉出少數象形的東西,讓人感受它的魅力,從而將人引入歧途,讓學用者以後承受更多實際的苦痛。
也許有人會說,現代五筆的設計方案與許多優秀輸入法有相似之處,並沒有什麼驚奇的地方。當然,現代五筆並不是憑空想像出來的,科學具有一定的共性與必然性,尤其是輸入法編碼更要以“簡明直觀、易於學用”為準則,不應該有“驚奇”或令人不理解的地方。現代五筆可以說是在平常的表現形式下,體現出諸多不平凡的科學原則,其創造性之舉是:
1、引入單字的首音作為補碼,大幅度降低了重碼率。在26位字母鍵編碼的輸入法群體中,重碼率指標已降低到了輸入法設計的最低限(重碼率有似“腰圍”,網上具“孕婦”體形的輸入法比比皆是,何談輕功?)。
2、字根分布的藝術性與目標性相結合,攻克了“同類字根難以聚合”這個頑固的堡壘。
3、根據國家語委“部件”、“筆順”兩項新標準,結合輸入法設計的特點,重新歸納單字的基本筆畫方案,使漢字拆分更趨規範化。
“五嶽歸來不看山,黃山歸來不看岳”。在漢字輸入技術發展史上,現代五筆是“唯一”的通用性、易用性、高效性俱強的輸入法!有什麼理由這么說呢?這是解剖、分析、總結眾多輸入法之後得出的結論。全拼輸入法雖具備通用性與易用性,但沒有高效性。傳統五筆一直作為全形碼輸入法的典範,但因其“末筆字型交叉識別碼、字根難記憶等原因,使得易用性不佳。天然碼由於越出26個字母鍵之外設定字根,丟棄了通用性。二筆字型等多種有特色的輸入法,更難同時具備以上“三性”。這裡就不一一贅述了。
以上所言一鱗半爪,說明的問題有限。我們期待對現代五筆感興趣的朋友身體力行,通過真實體驗後,就會深刻感受到現代五筆的科學性與完美性。

相關詞條

熱門詞條

聯絡我們