fmddlmyy吧 关注:119贴子:3,012
  • 3回复贴,共1

利用cnbook和excel,把单字码表按照字频排序

只看楼主收藏回复

可以利用cnbook和excel相互配合,去除码表里的非GB字。
并且按照某个特定字频排序,例如a表有编码,但字频差,b表无编码但字频好,想让a表带着编码按照b表的字频排列。
首先百度6763字频表,选取其中一个。
如果已有字频表,可以利用excel中的vlookup()函数,选取该字频表中的GB汉字和字频。


1楼2015-01-12 14:03回复
    可以利用excel处理单字码表:
    先把码表去掉表头及其它,然后把码表处理成一字一行。
    把码表和字频表复制到excel中,在E列中输入公式,如下表所示:
    A B C D E
    wo 我 我 1 =vlookup(b1,c:d,2,false)
    wo 我 们 2 ……
    men 们 是 3 向下填充
    men 们 学 4
    shi 是 生 5
    shi 是
    xue 学
    xue 学
    sheng 生
    sheng 生
    ……
    同时选中EDCBA列,按E列升序排序,去掉非GB字。
    同时选中EDCBA列,按先A列后E列,进行升序排序,把AB列复制到文本,把分隔符换成空格。


    2楼2015-01-12 14:05
    回复
      先百度6763字频表,选取其中一个。
      如果已有字频表,可以利用excel中的find()函数,选取该字频表中的GB汉字和字频。
      把字频表升序排序后,去掉字频数字,转换成汉字排列的文本。
      利用excel处理单字码表:
      先把码表去掉表头及其它,然后把码表处理成一字一行。
      把码表复制到excel中,在C列中输入公式,把字频文本复制到d1单元格中,如下表所示:
      A B C D
      wo 我 =find(b1,d$1,1) 的一是了不在有个人……
      wo 我 ……
      men 们 向下填充至
      men 们 码表末尾
      shi 是 (不是整列)
      shi 是
      xue 学
      xue 学
      sheng 生
      sheng 生
      ……
      同时选中CBA列,按C列升序排序,去掉非GB字。
      同时选中CBA列,按先A列后C列,进行升序排序,把AB列复制到文本,把分隔符换成空格。


      4楼2015-01-12 16:46
      回复
        可行


        IP属地:江苏来自Android客户端5楼2015-11-27 16:56
        回复