词频统计工具,可以统计一批Word文档(.doc;.docx)、网页文件(.htm;.html)或文本文件(.txt)中所有中英文单词出现的总次数,或分别在各文件中出现的频率。 统计结果可以按出现次数排序输出为Excel表格或Word表格文档。
全量统计方式,即统计给定多个文档中的所有词汇的出现词频;
指定统计方式,只统计指定的某些特殊词汇的出现词频。
可以选择只统中文词汇、英语词汇或标点符号。
常见问题问:我点试用,电脑显示我的系统中没有装microsoft word,可是我电脑里有word07版,这是怎么回事呢?
答:软件部分功能需要调用Word的相关功能,电脑里有word却显示您的系统没有安装,可能是因为您安装Word时安装不完全,或者您没有以管理员权限登录(所以当前程序没我获得调取Word功能的权限),或者您安装是某些破解“精简版”的Office(有些功能被删减了)。
问:词频分析结果是什么样的?比如我想把一篇文档进行分词,统计出高频词汇,这样能做到吗?分词是单个字,还是一个词语?
答:把一篇文档进行分词,统计出高频词汇,这就是这个软件的功能。分词是按语言学上的词语,比如“中化人民共和国”算一个词语。而且,对于一些新词,或特殊定义的词汇,如“新浪微博”这类新产生的词汇,软件提供了“自定义词汇表”功能,您只要把它添加到自定义的词汇表中,就可以作为一个词来进行统计。