筆順碼和數字CKE技術
計算機世界雜誌1999年第44期
筆順碼和數字CKE技術

計算機世界雜誌1999年第44期

北京必勝電腦有限責任公司

王頌平

一. 數字CKE技術的提出

“CKE”是英文CHINESE KEYED ENTRY的縮寫,意為中文鍵盤輸入,需要強調指出的是,這裡的鍵盤特指使用數字的小鍵盤,而並非原來意義下的英文字母鍵盤。因此,我們稱它為數字CKE技術,即指專用數用給漢字編碼的方案和技術。

數字CKE技術在今天備受人們的關注,科技的高速發展,使得各類電子產品可以越來越集成化和小型化.。電子產品微型化的趨勢,引起了世界範圍內文字輸入法的重大變化。

最典型的例子就是在移動通訊上。我們看到,即使有了如此方便,拿起來就能說的“語音輸入”,各大公司還在爭相推出“鍵盤輸入”。原因就是鍵盤輸入有著語音輸入所不可取代的優點。如在網上發送電子郵件會很省錢一樣,我們用手機發送文字短信息會比打電話更經濟,在許多場合也更加方便。這樣,手機上原來用於撥號的數字就增加了新的功能,還被用來輸入文字信息。

數字“CKE”技術非常迫切地提到了我們面前。大家都感到,不僅在手機上,在其它小型的電子設備和儀器,包括信息家電、掌上型中文電腦、電子記事簿、電子翻譯器這樣一些產品上,最好都能有一種方便,快捷地使用數字來輸入漢字的方法。

數字CKE技術己經成了廠家和用戶共同關心的一件事。它關糸到高科技電子產品能否開拓更大的市場、能否走進尋常百姓家、能否真正給廣大用戶帶來方便。

二. 數字CKE技術在中國

《數字化生存》的作者尼葛洛龐帝,若干年前曾經預言,一個數字化的世界在向我們走來。對此許多人感到詫異,世界什麼時候開始和數字打上了交道?

其實,這是人類在研究自身思維形式到了一定階段上以後的必然結果。我們本來就是生活在一個二值邏輯的世界裡,對於任何一對矛盾的命題,我們不可能同時判定兩者皆真,也不可能同時判定兩者都假,也就是說,必定一個真另一個假,或者反之。當用1表示真、0表示假,我們就進行了一個由0、1組成的數字世界中了。而當我們將聲音顏色、圖像等都變成由0、1的數字來表達,那只是進一步發現事物在本質上具有同構的屬性,因此可以有相同的表達式而已。

這樣看,文字最終變成數字是一點兒也不奇怪的事。所不同的是,文字不但僅在遞過程中要變成數字,而且在人機交流的最初階段也要變成數字。

關於這一點,外國人的認識比我們要早,當我們還熱衷於用字母給漢字編碼時,外國人發現曾令他們驕傲的發明—“字母鍵盤”並不一定是唯一理想的文字輸入工具。科技的進步,微型電子產品的興起,使他們想到必須更新傳統的“字母鍵盤”為“數字鍵盤”。

中國人在這個問題上認識滯後是歷史原因的。早在歐洲人發明打字機的時候,留洋的中國人看到直接用機器輸入字母所產生的高效率驚嘆不已,這些人中有許多是思想激進的仁人志士,他們發出呼吁:漢字要改革。而改革的方向,就是“拉丁化”。但是要革除一種有這麼多人使用的文字又談何容易。努力的結果,困我們搞出了一個拉丁化的漢語描拼音方案,而無法用拉丁文字來取代漢字。

漢字不能拉丁化原因是什麼呢?一位外國的語言學家說得非常透徹:“漢字系統是在所有現存語言中,為歷史最長從未間斷過的文化傳統服務的書寫系統”。它將過去和現在聯系在一起、連續不斷地使用漢字的時間已超過三千年之久,這一點是世界上任何別的文字系統都未能做到的。恐怕就是這個原因,使得任何力量不光在今天就是在以後都不能使漢字拉丁化。”

儘管漢字拉丁化的主張未能真正改變中國人的文字,但是,它所產生的影響卻是很大的。特別是到了計算機時代,當西方文明又一次沖擊古老的漢字時,人們再次見到了“熟悉的”英文鍵盤。這時、留給中國文字與現代文明的象徵 -- 電腦的“接口”似乎只餘下了拉丁字母了。

在中國,研究漢字輸入法的行列中,有年邁的老科學家,也有十幾歲的女中學生;有碩士、博士,也有文化程度不算很高的工人、戰士和待業青年等。報上甚至還刊登過在押死刑犯因在獄中研究中文輸入法而被減刑的事情,足見研究輸入法的份量之重。1987年,漢字編碼首次被列入國家重點科技攻關計劃以後,研究者有增無減。

十多年來,這支龐大的隊伍在英文鍵盤上設計了成千上萬種中文輸入法,直到今天,仍有不少人在廢寢忘食矢志攻關。據某電視台報道,中國至少有一萬人在搞中文輸入法研究,至少有一千種拿到專利局去申請專利。這些研究者平均每人至少花去一年時間,以個人累計就是一萬年哪!這種現象恐怕在全世界都是獨一無二的。

但是,如前所說,我們忽略了整個世界的潮流,當文字輸入已經轉向數字輸入,而不是變成字母或停留在字母輸入的階段時,國人沒有對此引起足夠的重視,使得我們的很多努力都白費了!

所以,今天來評述國內的數字CKE技術就會感到它非常單薄。我們甚至只能追溯到很久以前王云五的“四角號碼”,還有再往後李金錕教授的“八筆劃”,他們從編一本好用的字典出發,都首先想到了用數字而不是字母,這個思路是正確的,可惜他們的不足之處是都放棄了筆順這個大家都能接受的概念,這樣勢必就要增加則而增加規則就是增加學習的難度,這一點又是不甚可取的。

今天,我們評析中國的數字CKE,不能簡單地說“漢字拉丁化”是對漢字編碼的誤導,但是也不能不看到一種盲目傾向帶到來的危害,當民間戲稱漢字輸入法泛濫到了“千軍萬碼”的地步時,我們不能再去做無效的重复勞動,而應該冷靜下來總結一下,問題究竟出哪裡?

造成這種現象的原因大概有四點:其一是受漢字拉丁化的影響,誤以為只有字母才能卓有成效地給漢字編碼。其二是片面理解“碼長要短”和“重碼率要低”的要求。其三立項研究之前,缺少對行業內部發展情況的了解。第四,就是我們的科技水平落後,缺少培育數字CKE技術的大環境。

因循守舊的思想方法不但使我們對字母編碼方案盲目投入太多的重复勞動,更對數字編碼方案,即數字CKE技術,採取了一種懷疑甚至排斥的態度。

排斥的第一條理由,就是認為單手操作在速度上一定比兩只手要慢。因數字CKE是用單手操作的,不少人的思維因簡單類比而走入誤區,盲目地認為,打字非要像外國人一樣使用兩只手才能打得快,這種觀點是錯的。

有人作過測試,若不加思索,儘可能快地用食指或中指敲擊桌面,每分鐘最多大約是二百四十下左右。而對於電腦來說,不管你用單手還是雙手,瞬間,只能接受一個敲擊信號,這種情況下,輸入速度與碼長和熟練程度有關,與其它因素無關。假定一個編碼方案能保証三或四下打出一個漢字,那麼它的單字輸入速度極限就是每分鐘80或60字。

我們看到某些專業錄入員或表演者一分鐘能打一、二百甚至三、四百字,須知這是打熟文章,其中反复出現的常用字只需打一、二碼,關鍵是它必須借助於詞組。這和用一只手還是兩只手亳無關系。好比中國人吃飯用筷子,西方人吃飯用刀叉,吃得快慢不在於是一只手還是兩只手,而在於咀的大小和咀嚼、吞咽的速度。

我們不僅應當明白雙手操作能達到的速度,單手操作同樣能達到,更應看到後者有前者不能取代的優點。因為用大鍵盤雙手操作對於大腦的搜尋機制以及人體協調性的要求高,這也是很多人特別是中老年人無法用英文鍵盤打漢字的原因。而當用小鍵盤單手操作時,因神經傳導的時間距離縮短,大腦的搜尋機制能夠得到充分的調動和發揮,對人體記憶的要求降低了,所以若有一種好的數字輸入法則用戶不分年齡普遍都能適應。

此外,單手操作在眼與手的配合以及身體各部分位置的協調方面,都比兩只手來得更方便、更容易。一個簡單的事實是:假定身體斜著或躺著,雙手操作決無可能。而單手照打不誤。另外,雙手操作易於疲勞,單手操作可持續很長時間。

我們冷落對數字CKE的研究,還有一個認識的誤區,那就是認為只用10個數字肯定會使碼長過長、重碼率過高。有的研究者說,用26個母都玩不轉成千上萬個漢字,只用10個數字怎麼可能,抱著這種心態,成千上萬的研究者拋棄了“數字”這條“窄道”而熱衷於“字母”這條“寬道”。

從表面看,單純考慮實現“碼長越短越好、重越少越好”的所謂最優化指標,字母確實顯出比數字有更多的優越性,字母有6個,數字才10個,前者要多出160%,簡單的算術使一些人擔心,這會不會意味著,如果用數字編碼,其重碼率或碼長會是前者的1.6倍,甚至更高?這彷彿成了一個無需驗証的事實。

許多研究者寧肯去苦思冥想漢字與ABC….有無形似的對應關系,而不願意去認真思考一下用數字編碼是不是真的會很差:這就是為什麼在中國,字母輸入法千軍萬“碼”,而數字輸入法卻寥寥無幾的原因之所在。

三. 外國人對數字CKE技術的研究

外國人大概因為腦子裡少了中國人的這些條條框框,他們搞的CKE中文數字編碼方案一不考慮碼長,二不考慮重碼率,只考慮是否簡單好學,這種逆向思維不失為一種處理方法,好壞姑且不說,至少他們已經做在手機上可以對付先用上。

這種碼長可以是任意長 – 所謂任意,就是只根據筆劃,有多少筆算多少筆;重碼率可以是百分之百,即每個字都讓它選擇的方案,既可以說它“老掉牙”,又可以說它別開生面。當某家大公司將這種中國人不大理會的方法做在手機上時,大家才猛然醒悟:我們中國人自己對數字CKE技術的研究落後了!不但讓外國人搶佔了商機,而且讓外國人來替中國人填補漢字輸入領域中的空白,這不管從哪一方面說,都讓人感到既可惜又難堪!

應該承認外國人和中國人大相徑庭的思路確有其高明之處,它的高明就在於抓住了好學兩個字。但是還應看到對於一種好的數字CKE技術來說,光好學是不夠的,人學習技能的目的是為了“用”,在“好學”的前提之下必須強調“好用”才行。

從對外人給中國人設計的多種CKE方案分析來看,最大的問題是用起來不方便,其方案帶著明顯的西方文字的痕跡。拉丁文字是一維的,構成這種文字的最少單位 – 字母從左到右呈線性排列;而漢字是二維的,構成漢字的最小單位 – 筆劃的排列是非線性的,除了分左右還分上下,總體上還講究對稱。外國人似乎難以體會漢字結構中的精髓,只能用類同西文的方法來處理中文。

當用字母鍵盤輸入文字,西文無須編碼,這是它優於中文的地方,但現在改換成用數字輸入,西文就顯示它的問題了:非常繁瑣,而他們又將這種繁瑣“移植”到了中文的手機上,這是令人非常遺憾的。

事實上,中文字輸入如果處理恰當將會是非常方便、快捷的。近來,多家國產手機廠商在進行多方比較後,選中國內的筆順碼中文輸入法就足以說明這一點。

筆順碼給漢字編碼注入了一種新的活力,這種編碼方案揭示了漢字的本質屬性,它所具有筆劃可省略性,充分體現了漢字的優越性,展現了她有別於其他文字的魅力。外國人搞的數字CKE,設計思路上由於不考慮碼長,將鍵盤輸入等同於寫字,光知道一筆一筆打下去,這樣就從好學走向了反面,變成了繁瑣。這是它之所以不好用的第一個重要原因。

其次,從其設計的筆劃與數字的對應關系來分析,外國人搞的數字CKE普遍存在的問題是正態分布不均衡。

國際6763個字,首筆統計情況如下:

起筆為 “橫” 的字
約佔100%

起筆為 “豎” 的字
約佔16%

起筆為 “撇” 的字
約佔23%

起筆為 “點” 的字
約佔22%

起筆為 “折” 的字
約佔 10%

外國人設計的數字CKE,從表面上看,也用了9個或10個數字,但實質上這些數字形同虛設,沒起作用。以某一已實施的CKE編碼方案為例,本來GB2312-80中折起筆的字便有600多個,佔總字數的9.5%,但設計方案再次將它分解為若干份,然後再讓它們分別對應於6、7、8、9。這樣處理非常不妥。須知,對於使用10個數字的漢字編碼方案來說,當所用數字一半承擔了90%的字的編碼,而另一半承擔不足10%的字的編碼,這樣的方案一定是不科學的,它意味著重碼和碼長並沒有因為數字增加而得到緩解,相反,由於折筆劃分得太細,陡然增加了記憶的負擔。

所以,判別一個數字CKE方案的優勢不能單單看它用了多少鍵,如果增加的數字鍵沒有在改善正態分布上起到應有的作用,那麼它還是不用的好。對於我們的研究來說,上述方案應視為前車之鑑:它在原來不均衡的基礎上加劇了傾斜,是一個非常典型的未因鍵位增加而縮短碼長、降低重碼率,反而導致記憶負擔和學習難度增加的一個不成功的例子。

由此可見,數字CKE技術的優勢,在於總體設計思路是否正確。可以這樣說數字的正態分布不均衡,是造成碼長長、重碼率高的症結,也是現今國外的數字CKE好學而不好用的第二個重要原因。

四. 筆順碼一種日益受到關注的數字CKE技術

理想的數字CKE技術,不但應該讓用戶學起來感到容易,更應該在使用上感到方便,在好學好用好記等諸要求之間尋找一個平衡點,這個平衡點其實也是一個最佳點。

可以告慰國人的是,在數字CKE技術方面我們並沒有輸給外國人。我們中國人自己發明的筆順碼CKE以其獨特的方式,完美地解決了中文小鍵盤輸入的問題。

筆順碼給漢字編碼注入了一種新的活力,這一編碼方案揭示了漢字的本質屬性,它呈現的漢字輸入時筆劃的可省略性,充分體現了漢字的優越性、展現了她有別於其他文字的魅力。

筆順碼CKE技術得益於作者的設計思路,在這種思路的指導下數字的正態分布均衡,唯一性強。從邏輯的角度看漢字編碼系統是一個符號系統,這個符號系統同樣應滿足一些基本的要求:它應該是完全的、無矛盾的和可靠的。

從筆順碼的構思來說,它遵循了上述原則:設定了初始符號,初始符號為該系統中不可再分的最小單位,亦即漢字中的單筆畫,由單筆劃根據筆劃之間結合力的大小生成复合筆劃,無論是單筆劃還是复合筆劃,都體現了漢字作為象形文字所具有的對稱性的優美特征,這種特征帶來的另一個最大的好處就是便於記憶复合筆劃的設定更考慮有於整體方案正態分布的均衡。

當我們非常清晰地運用邏輯的基本原理來把握它,那麼一切就顯得非常自然?所以內行人評價說,很多漢字編碼方案是一邊研究一邊修改出來的,有漏洞就用規則來彌補;筆順碼卻不同,它是在理性的思考完善以後一氣呵成的。

筆順碼的作者說:“當我們開始考慮用數字給漢字編碼以後,就會發現留給創造者自由發揮的空間不是很大的,一切原本有序,只是你發現了沒有!”

可以這樣說,最自然的東西是最簡單的,同時也是適合於最大多數人的。筆順碼科學地利用0-9十個數字與漢字的基本筆劃有規律地分別對應,規則僅有一條。獨特的構思使筆順碼的碼長大大縮短、重碼率大大降低,取得了一種字母編碼者渴求的效果,同時又具備數字編碼、好學、易記、難忘的優點。

設計筆順碼最初的想法就是用在電話機上,後來也做成PC機的應用軟件。在今天,它又被用在移動通訊上,充分體現了該方法具有手機輸入與計算機輸入一體化的強大優勢。

筆順碼的優點不僅在單字輸入時十分明顯,在詞組短語輸入時更為突出,令輸入速度成倍提高。必勝公司最近的一項試驗表明,筆順碼在手機短語的開發應用上將有新的突破。

總之,有了筆順碼中文輸入法,人們不必再視電腦為畏途:不懂英文不要緊,不會漢語拼音不要緊,工作忙、時間少不要緊,年齡大記性差不要緊,甚至連文化水平低的人不成問題。

筆順碼在京港兩地推廣,從累計兩萬多張問卷調查反饋的信息來看,98%以上的人回答是能在40分鐘內掌握。大量的推廣實踐証明,筆順碼這樣一種極其簡單的輸入方法正是電腦和手機輸入法一體化的優良途徑。

目前筆順碼軟作已被列為全國高科技產業化協作組織成員單位,筆順碼軟件成為組織的推薦品.筆碼因受到國家科委,國家知識產權局專利實施中心等有關部門的重視,推廣的力度不斷加強.隨著傳媒的作用與代理商的工作,筆順碼日益受到人們的關注和歡迎.並以更快的速度向全國各地推開,使用者已經深入到鄉村和偏遠山區.筆順碼的普及和推正在打破電腦應用的“瓶頸”,不久的將來我們會看到各種各樣的人,無論是城裡的老人還是村里的年輕人都會使用筆順碼;不僅在電腦上,而且在手機上。

筆順碼CKE技術在電子、通訊等其他高科技領域中具有廣闊的應用開發前景。它可以用在電視機的遙控板上,可以用在機頂盒上,可以用在固定電話機、電子記事本以及其它多種電子產品上

今年年初以來,幾種具有數字CKE功能的手機紛紛宣布登場,被帶動起來的市場造成了一種特定的氖圍,數字CKE性能的高低也會成為國人選擇手機的要素之一,就商家而言,多一種功能必定讓用戶掏一份錢,你要想買得合算、用得滿意,在選擇手機時就不能不注意,除了看品牌,還應測試CKE的質量。有眼光的商家會在物色、尋找理想的數字CKE技術上下功夫,以使自己激烈的競爭中立於不敗之地。

值得一提的是,筆順碼CKE技術相對其它同類技術是成熟和完善的。這不但因為它已經擁有了一大批用戶,更因為它不增加任何記憶的前提下,完成了國際擴充庫GBK20,902的編碼,這意味著它已經解決了中文簡、繁體字同時輸入的難題。這一點也是國外CKE技術所不及的。有關廠家家若能將其應用到自身的產品中,不僅有利於佔領中國內地的市場,而且可以延伸港澳台及廣大的海外華人地區,這樣的前景是任何有國際戰略眼光的企業家所不能不認真考慮的。

數字CKE技術的培育者是商家,嗅覺最敏銳的也是商家。目前,擁有筆順碼CKE技術的北京必勝電腦公司已和國內一些既具強大實力、又富遠大眼光的企業達成合作協議。不久的將來,我們就可以在性能、外觀都不難於洋貨的國產手機上看到它。


| 主 頁 | 最新消息 | 新聞資訊 | 聯絡站 |

| 產品介紹 | 取碼入門 | 模擬示範 | 應用項目 | 練習平台 | 軟件下載 | 客戶典範 | 討論區 |