V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
2NUT
V2EX  ›  输入法

再论 中文输入法 的选择 —— 音码/ 形码 / 音形码

  •  2
     
  •   2NUT · 2023-09-15 14:21:23 +08:00 · 1047 次点击
    这是一个创建于 440 天前的主题,其中的信息可能已经有所发展或是发生改变。
    零几年,在手机上学会的 笔画输入法,9 宫格,5 个笔画,会写字,就会打字,门槛甚至比拼音输入法还低(考虑方言区很多人拼音并不标准)。所谓 大道至简,虽然效率不算高,但完全可以说解决了初期汉字输入的问题。很奇怪,也没人往电脑上推广,只是因为电脑键盘按键多么?

    九几年其实有机会学会五笔的,当时买了小霸王学习机,附带了五笔的教程,没看懂,遂放弃。

    回过来看,汉字编码输入无非是这个过程:

    形码: 表达需求--->意识(大脑)--->内语语音---(听写识字)--->字形---(拆字)--->字根序列--->形码---(键盘布局映射)--->按键(时序或并击)-->选字(确认或翻页)-->上屏显示

    音码: 表达需求--->意识(大脑)--->内语语音---(拼读编码)--->音形---(拼音)--->字母序列--->音码---(键盘布局映射)--->按键(时序或并击)-->选字(确认或翻页)-->上屏显示

    编码最终熟练后都会直接省略 内语语音 --> 音/形 编码的中间过程,形成直接映射,殊途同归。

    但是在初期学习和熟悉阶段,毫无疑问,难度上:

    1 ) 听写识字(听 -> 写,音->形状) > 拼读, 基于一般人会拼读,会写字的前提,形码复杂度要上两个层级;尤其是现在人会写的字更少了。

    2 ) 编码规则 拆字 >>>> 拼音,拆字是需要另外学习和无法规律化的规则,难度很高,而拼音是小学生都会,即使不会,难度也很低(元素更少,更加规律)。

    3 ) 编码到键盘映射,形码 >>> 音码,字母在键盘哪个位置是规范化好的,一个按键对应一个字母,而字根在哪个位置又是一套复杂的映射,一个按键对应多个字根。难度不在一个层级上。

    那形码这么难有什么好处呢?

    1 ) 重码少(因为字根多呀,字根组合就多,能唯一定位某个汉字),编码输入后,不会有很多候选字,从而减少选字的几率。但意味着记忆负担。

    2 ) 击键少(还是字根多,所以码长短,某个汉字拆分到的字根个数少),大字根多了就会影响编码覆盖率,所以一般都是小字根,需要记忆字根拆解规则。

    3 ) 节奏稳定 (取决于键盘映射 和 编码),全码的码长固定,打字有节奏感。

    对应拼音输入法的缺点:

    1 ) 重码多(音形输入法的天生缺陷,汉字本身同音字就多(声音编码文字不是好方案,声音的模糊性决定了码元一定少)+ 码元少,除非通过概率模型(联想预测)否则无法通过音码方案自己解决)

    2 ) 击键多(拼音的音元相比形码少很多,类似大字根,但是辅音等还是拆解为字母输入,导致码长较长...)

    3 ) 节奏不定 (拼音的长度不定,因为本身复用的拼音规则和键盘字母位置,没有优化设计)

    对应出现了双拼,解决了全拼输入法的编码码长过长的问题(本身)。

    对于一个通用输入法,可以提炼出以下评价维度:
    {字根数量、字根的细化度(大字根、小字根)、编码规则(音/形/音+形)、码长、键盘寻址时间}

    可以得出一个初步结论:
    1 ) 音+形 码方案需要同时处理 两路数据流,不是一个好的编码方案,不值得学习(如 二笔输入法 小鹤音形等输入法 )。

    2 ) 形码 方案,优势是码长长,所以重码低,但劣势是字根多(要记),编码规则多(要练),映射规则难(要练),需要较长的时间才能学会,难度较大。

    3 ) 音码 方案,天生码元少(声母+韵母),所以重码高(及时考虑汉字本身的同音字影响),而且因为韵母为多字母,码长还长,属于双输了;但是优势字根(字母)、编码(拼音)、映射(英文键盘)上过学的都会,已经学过了,不用重新学。

    4 ) 音码 方案改进版,即双拼,解决了输入码长问题,双拼从统计的码长看基本在 2-3 之间,和五笔不相上下;劣势是没有解决重码问题,因为码元没有增加。但是属于精力投入与效益比最好的汉字方案了。
    xubair
        1
    xubair  
       2023-11-12 23:16:22 +08:00
    个人感觉从双拼到小鹤音形的难度要比从全拼到双拼低很多,小鹤音形感觉更像是加强版本的双拼,毕竟它的字根和小字大部分都是用的声母的键位,挺好记的
    pmkm
        2
    pmkm  
       205 天前
    中文输入属于果然计算机科学
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3131 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 13:55 · PVG 21:55 · LAX 05:55 · JFK 08:55
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.