词频统计工具是一款用来统计页面出现了哪些词汇以及出现了多少频率的工具,对于一些词汇的分析人员,最近的热门词汇或者高频词汇可以用这款工具来统计分析,使用起来非常的便利。
中英文词频统计软件,可以统计一批Word文档(.doc;.docx)、网页文件(.htm;.html)或文本文件(.txt)中所有中英文单词出现的总次数,或分别在各文件中出现的频率。统计结果可以按出现次数排序输出为Excel表格或Word表格文档。
全量统计方式,即统计给定多个文档中的所有词汇的出现词频;
指定统计方式,只统计指定的某些特殊词汇的出现词频。
可以选择只统中文词汇、英语词汇或标点符号。
问:词频分析结果是什么样的?比如我想把一篇文档进行分词,统计出高频词汇,这样能做到吗?分词是单个字,还是一个词语?
答:把一篇文档进行分词,统计出高频词汇,这就是这个软件的功能。分词是按语言学上的词语,比如“中化人民共和国”算一个词语。而且,对于一些新词,或特殊定义的词汇,如“新浪微博”这类新产生的词汇,软件提供了“自定义词汇表”功能,您只要把它添加到自定义的词汇表中,就可以作为一个词来进行统计。
新版本功能优化,解决了部分安装WPS电脑上出错卡死的问题。