首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >采矿金融物品R

采矿金融物品R
EN

Stack Overflow用户
提问于 2020-01-21 15:24:46
回答 2查看 209关注 0票数 0

我正在使用tidytext挖掘一些金融文章,我从路透社下载数据,但是当我试图将每个语料库转换成一个数据框架时,我会发现unnest命令不接受函数作为输入的一些错误。

你有别的办法让它变成老虎吗?

代码语言:javascript
复制
library(tm.plugin.webmining)
library(purrr)
company <- c("Microsoft", "Apple", "Google", "Amazon", "Facebook",
             "Twitter", "IBM", "Yahoo", "Netflix")

symbol <- c("MSFT", "AAPL", "GOOG", "AMZN", "FB", "TWTR", "IBM", "YHOO", "NFLX")

download_articles <- function(symbol) {
  WebCorpus(ReutersNewsSource(paste0("NASDAQ:", symbol)))
}

stock_articles <- data_frame(company = company, symbol = symbol) %>%
  mutate(corpus = map(symbol, download_articles))

stock_articles

stock_tokens <- stock_articles %>%
  unnest(map(corpus, tidy)) %>%
  unnest_tokens(word, text) %>%
  select(company, datetimestamp, word, id, heading)
stock_tokens
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-01-27 14:34:45

不幸的是,这里发生的情况是有些服务已经过时,tm.plugin.webmining已经过时。你可以读一些这里有更多的细节。我们正在为我们的书的这一部分寻找一个替代数据集,但同时,如果您想探索使用这段代码,我建议剥离到,比方说,4家似乎还在工作的公司。

代码语言:javascript
复制
symbol <- c("MSFT", "AAPL", "AMZN", "IBM")
票数 0
EN

Stack Overflow用户

发布于 2020-01-22 14:51:20

我正在尝试将stock_articles的语料库列转换成一个常规的数据框架

它是一个具有WebCorpus类型变量的列表列,因此我尝试整理每个观察结果,然后使用unnest将其转换为列。

1:https://github.com/leytigeorges/miningfinancial在这里您可以找到一个带有数据的文件(mydata)

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59844240

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档