应用定性数据分析包RQDA(Qualitative Data Analysis)和文挖掘框架包tm结合进行文本挖掘。 好在黄荣贵开发的RQDA包可以进行文档管理和内容编码及提取,大大方便了利用tm包进行文本挖掘,既提高了效率又提高了准确性,下面举一个小例子: 1、安装RQDA包、tm包和中文分词软件(分词软件见下面链接 2、装载RQDA包并建立一个新的工程项目; 3、输入相关文本文件; 4、进行编码和作标记; 5、双击想要提取的编码即可提取相关文本; 6、运行下面下载的程序进行文本提取、转换、分词、文本挖掘工作。 > gg <- RQDA2tm("记者" ,mf = FALSE) > gg A corpus with 55 text documents > ---------------------------- TRUE) > findFreqTerms(dtm, 5) [1] "驾驶" "身份证" "问题" —————————————————————————- 2、根据编码“公安部回应”分析: gg <- RQDA2tm
uGWva7qb675fgB0FgI9Dr9uXKRUiDoTP43m78G6zoM6MLgAfzyOpgAoClNRQSwNMcAGYQuBRAEBQVDd/nAsQKwnMAHEaANy+Xve9RQDA8N9TM6B1vyfRif2cPml8gSMvti7AtG9QYko