首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >与其他单词相比,单词的频率很高,使得其他单词在worcloud中几乎不起作用。

与其他单词相比,单词的频率很高,使得其他单词在worcloud中几乎不起作用。
EN

Stack Overflow用户
提问于 2022-01-11 16:27:42
回答 1查看 109关注 0票数 1

在下面的单词云中,我有一个问题:“油”这个词的频率比其他单词大得多,因此显示的频率要大得多,事实上,其余的单词是看不见的。我如何面对这个问题呢?有没有放大选项或者类似的东西?或者缩小单词“油”的大小?

代码语言:javascript
复制
  library(wordcloud2)
  wordcloud2(data = demoFreq)
  demoFreq[1,2]<-8000
  wordcloud2(demoFreq)
EN

回答 1

Stack Overflow用户

发布于 2022-01-11 18:12:20

日志转换在这里做得很好,但是可以说(这是主观的)它在不同的数量级之间做了太多的“平坦化”。

或者,您可以将频率提高到0到1之间的不同功率,以查看什么对您的数据最有效。在我看来,在立方体根(如x^0.3)周围的东西是一个很好的平衡,在保持原来的尺度和显示足够的细节从较少频繁的项目。

代码语言:javascript
复制
demoFreq$orig_freq = demoFreq$freq

# too even, perhaps
demoFreq$freq = log(demoFreq$orig_freq)
wordcloud2(demoFreq)

代码语言:javascript
复制
# maybe more like what you want -- oil doesn't overwhelm but still big
demoFreq$freq = (demoFreq$orig_freq)^0.3
wordcloud2(demoFreq)

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/70670159

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档