rost词频统计软件是款是款文章词频检索分析软件,rost的功能非常强大,对于分析出来的数据也是非常整洁,并且支持多种格式,可以直接对文章中的词语进行提取和删除。
rost词频统计分析软件是一款非常出色的字频统计和分析软件,ROST中文字频统计分析软件正式版拥有简洁化的设计界面,专业化的功能,其ROST中文字频统计分析软件正式版支持批量统计,最后生成一个统计结果的网页文档,非常直观可见。同时,软件也具有易用已操作的界面,可以快速统计汉字出现概率,对于分析文章有很大帮助。
1.统计一个文档中和另外一个字表对比之后超纲的词及词频数,对字频统计结果进行词频升序、词频降序、字母升序、字母降序排列
2.统计一个文档中出现过的所有汉字及非汉字频度
3. 词典工具具有超强功能:提取某个长度的词、删除首字符串含某字符串的词、提取尾字符串为某字符串的词、删除尾字符含某字符串的词、提取出首字符串为某字符串的词、字串的每一个词的unicode值或ASC值、提取尾字重复的字符串、词组排序、删除重复的字符串、删除含某个词串的词、将文本打散为一词一行、提取含某个词串的词、附带ASC码表、删除连续空格、任意提取单空格词组或多空格词组、删除词中含有的某些字符、剔除含有某些汉字或其他字符的行,提取某个字符串之前所有单词。
4.对于普通文档可以将其打散后进行操作,本词典工具目前的处理速度尚未优化,准备在下一版本将词典工具单独拿出来,进行优化,以便处理极大的文档。
1、用户可以批量选择一系列的文本文件,进行批量生成频度文件Fre。频度文件是一种包含字或词以及频度的自定义数据文件,是ROST的专有格式。通过Fre的定义,可以有效提高处理速度。对频度文件Fre的处理可以进行合集和交集的计算。合集得到所有频度文件的总和。而交集得到的是所有频度文件中都含有的文字。
2、可以对一系列文档进行交集提取,得到某个类型(如旅游类、计算机类)文档中的共同特征字。而合集则可以迅速对大文档进行处理,鉴于本软件的高速度,进行1000亿的文字统计也是可能的。
3、自定义过滤词表,可以使用菜单右键查看过滤词表,添加自己需要的过滤词。目前使用的过滤词表为空,用户可以自行增加。使用菜单保存词表之后将该文本文件覆盖软件目录下的dict目录下的compare.txt即可,使用过滤词可以非常方便的获得超纲的字有哪些。
4.从剪贴板统计文字。注意如果先点击了剪贴板统计文字,则非中文统计显示的是剪贴板里面的非中文,而不是文件里面的非中文。
-ROST不支持对excel文件进行分词,所以先将刚刚的实验数据复制到txt文档中
-选择“功能性分析” > &分词”,将刚刚准备的txt文档导入后点击“确定”。
-ROST分完词之后会自动将分词结果打开,文件储存在分词文件所在的路径中,可以看到结果已经进行分词了。
-接着我们要将分词处理后的文档进行词频分析,选择“功能性分析” > &词频分析(中文)”,将刚刚分词后的txt文档导入后点击“确定”。
文档管理 /
下载文档管理 /
下载文档管理 /
下载文档管理 /
下载文档管理 /
下载文档管理 /
下载文档管理 /
下载文档管理 /
下载文档管理 /
下载文档管理 /
下载
支持 (0 ) 回复
支持 (0 ) 回复