词频统计工具是一款能够准确统计Word文档、网页文件或文本文件中,某个中英文单词出现的总次数,出现的频率等数据的软件。我们都遇到过同样的难题,由于工作原因,需要用到一部分词频统计,由于不是确定词的统计,所以不能使用office软件搜索功能来搞定,只能借助独立的词频统计软件。然而目前网络上词频统计软件良莠不齐。词频统计工具是一款能精确统计单词总出现次数的好工具,用户可以指定文件中的中文词汇、英语词汇或标点符号,也可以使用全量统计方式,对多个文件中的词频进行比对,统计结果可以按出现次数排序输出为Excel表格或Word表格文档。支持自定义词汇库(例如一些品牌名词,如“京东”“南极人”等会被分开成几个单词的非标准词通过添加到词库实现准确统计)。欢迎有需要的朋友下载使用!
词频统计软件统计方式包括:
全量统计方式:即统计给定多个文档中的所有词汇的出现词频;
指定统计方式:只统计指定的某些特殊词汇的出现词频。
(注:可以选择只统中文词汇、英语词汇或标点符号。)使用说明:
1、在文本框中输入(或粘贴)中文或者英文文章,然后按“开始拆分并统计”按钮即可查看拆分结果和频率统计结果。可以生成两种拆分结果:
(1)是按照原文顺序列出单词或句子;
(2)按照单词或者句子的拼音顺序排好序,当然,也可以通过打开文件的方式导入文章。
2、输出方式中也可带上编号。
3、在频率分析栏中可以通过点击列表标题,可以进行“编号”、“单词”、“出现频率”的排序—正序或逆序。
4、分析排序结果可以保存为txt文件,供大家后续继续分析。
常见问题
问:词频分析结果是什么样的?比如我想把一篇文档进行分词,统计出高频词汇,这样能做到吗?分词是单个字,还是一个词语?
答:把一篇文档进行分词,统计出高频词汇,这就是这个软件的功能。分词是按语言学上的词语,比如“中化人民共和国”算一个词语。而且,对于一些新词,或特殊定义的词汇,如“新浪微博”这类新产生的词汇,软件提供了“自定义词汇表”功能,您只要把它添加到自定义的词汇表中,就可以作为一个词来进行统计。
更新日志:
v3.16更新日志:(2018-8-15)
v3.15更新描述:
新版本Bug修正,优化。
v2.85更新日志(2017-9-26)
新版本性能优化;
速度极大提高。
新版优化了对HTML文档进行统计的程序。
完善了用户使用习惯记忆功能。
v2.80更新日志(2017-8-6)
新版本性能优化;
速度极大提高。
新版优化了对HTML文档进行统计的程序。
完善了用户使用习惯记忆功能。
0条评论