在下面的单词云中,我有一个问题:“油”这个词的频率比其他单词大得多,因此显示的频率要大得多,事实上,其余的单词是看不见的。我如何面对这个问题呢?有没有放大选项或者类似的东西?或者缩小单词“油”的大小?
library(wordcloud2)
wordcloud2(data = demoFreq)
demoFreq[1,2]<-8000
wordcloud2(demoFreq)发布于 2022-01-11 18:12:20
日志转换在这里做得很好,但是可以说(这是主观的)它在不同的数量级之间做了太多的“平坦化”。
或者,您可以将频率提高到0到1之间的不同功率,以查看什么对您的数据最有效。在我看来,在立方体根(如x^0.3)周围的东西是一个很好的平衡,在保持原来的尺度和显示足够的细节从较少频繁的项目。
demoFreq$orig_freq = demoFreq$freq
# too even, perhaps
demoFreq$freq = log(demoFreq$orig_freq)
wordcloud2(demoFreq)

# maybe more like what you want -- oil doesn't overwhelm but still big
demoFreq$freq = (demoFreq$orig_freq)^0.3
wordcloud2(demoFreq)

https://stackoverflow.com/questions/70670159
复制相似问题