模糊论道:从拼音到元码的对接能否实现中文信息处理革命性跨越
一款真正意义上的中文输入法从这里出发……
元码是一款100%基于拼音又100%保留汉字字形信息的汉字处理输入法,无缝与拼音和26键英文键盘对接,有效解决长期使用拼音导致的字形印象渐渐模糊或提笔忘字问题及汉字信息处理的高效和流畅性难题。
第一步 拼音字母表
注:字母“v”只用来拼写外来语、少数民族语言和方言。
定义1音首
音首指拼音的第一键,如:吴(wú)的音首是“w”。
定义2韵首
韵首指韵母的第一键,如:水(shuǐ)的韵首是“u”
定义3模糊键
“v”键在元码中命名为模糊键。
定义4数字声调表示
ˉ→一声→6
ˊ→二声→7
ˇ→三声→8
ˋ→四声→9
轻声→0
定义5字母数字
0→o
1→i
2→e
3→a
4→s
5→w
6→l
7→q
8→b
9→j
方法一拼音字节和单字输入
zong6→zōngㄓㄨㄥ综宗踪……
第二步 元码键位映射表
元码键盘映射表与拼音无缝对接,正常情况取拼音的音首定位,其中有15个移位字(红色标记字和对应部件)弃音首取韵首,V为模糊处理键(补缺键)用于所有未定义部件或输入者自己不能认读的汉字。
定义6 笔画
笔画是楷书字体最小连笔单位,归纳为以下五种:
一→横→h
丨→竖→s
丿→撇→p
丶→点→d
乛→折→z
其中:笔画提()并入“横”;笔画“亅”并入“竖”;笔画捺()并入“点”;所有拐弯的笔画全部并入“折”。如:
女(nǚ)→乛丿一→nz(ph)(“n”是“女”字的音首)
定义7 部件(信息处理用GB13000.1字符集汉字部件规范)
部件指具有一定组字功能的一组相对稳定的笔画组合,其中,可以单独成字的部件叫成字部件;不能单独成字的部件叫非成字部件 ,如:
怡→忄台→yxt
或
怡→忄厶口→yxsk(“忄”为非成字部件)
《规范》中定义了560部,元码中仅明确定义55个非成字部件,剩余未定义非成字部件纳入“v”键模糊处理。
方法二移位
移位指编码舍音首取韵首的一种取码方法。元码中定义15个移位字如下:
a→上三山羊
o→中又走手
i→一十示衣
e→这
u→水雨
举例说明:
水(shuǐ)→u
冰→冫水→buu
波→氵→bup
在自然状态下“z、s、y”三键编码任务十分繁重,定义这15个移位字的目的就是为了有效地分散重码。在理解的基础上通过练习达到手指记忆变成无条件反射后,元码输入法就自然掌握了。
方法三 模糊处理
1. 表中未定义非成字部件一律纳入模糊键“v”进行模糊处理,此谓混沌法,如:
曹→~日→cvr
2. 整字不能认读以及标点和符号,第一码由“v”引导,如:
朤→月月月月→vyyyy
,→v
:→vm
。→vj
!→vt
?→vw
;→vf
……→vs
——→vp
定义8 元码一键字(25个)
元码一键字按abc…排列,都是高频字,仅取一键编码,词组中缺省编码由其自身重复代替,如:
上不出的这发国,
和一就可了民内。
中平气,人是同;
水…我,小有在。
词组编码示例:我们→我我们亻→wwmr
第三步 取码规则
定义9 独体字
独体字是以笔画为单位构成的汉字,如:水、木、口、手、毛……
定义10 合体字
合体字相对于独体字指由部件构成的汉字,如:法、园、怡、涓……
规则一 独体字=音首+笔画
口→丨乛一→ks(zh)
规则二 合体字=音首+部件
园→囗元→yfy
规则三 纯二分字尾可再分
犹→犭尤→yqy(基本)
犹→犭一丶→yqhd(当尾部分为笔画时 则仅取首末笔画)
规则四 词组
1.二字词各取两键,组成四键,如:
方法→方丶法氵→fdfu
2. 三字先各字取一键加尾字第二键,如:
计算机→计算机木→jsjm
3. 四字及以上字各取一键,最长32键,如:
春眠不觉晓→cmbjx
四面荷花三面柳,一城山色半城湖→smhhamlvicasbch(标点用“v”代替,最长32码)
小结
元码中可以按二分、三分或多分或笔画按书写顺序任意拆分(不能省略),然后顺序取字和部件或笔画的编码(音首或韵首),最多允许取32键。
微→彳山一几攵→wrahjw
照→昭灬→zzh
照→日召灬→zrzh
照→日刀口灬→zrdkh
以上除“山→a”一个移位字外,其余大家都是早心领神会了。
想随心所欲输入汉字(手机或电脑),欢迎访问元码网站(mhym.net.cn)(免费)。
作者/来源:模糊黄金红
声明:版权归原创所有,转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请与本网联系,我们将及时更正、删除,谢谢。