最多的应该不会离开i和n这两个,i有海量的ji、yi、xi、shi等单元音,同时兼做介音和韵尾,n直接构成所有鼻音韵尾,这两者的出现频率肯定远比其他字母高。其他四个元音字母加上g和h的出现频率应该在第二层次。找了一个网上的批量注音程序,这样的程序一般只能注出一个音,比如位于字频首位的的”有de、dí、dì三个音,但程序会默认为de音。不过的”做虚词的de”音在实用中频率应该远远超过另外两者。同时考虑到本实验不处理声调,而且汉字中有多个常用音的多音字的占比并不大,这里暂时忽略多音字影响。
相关推荐: