腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(103)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
2
回答
R-安装
text2vec
Ubuntu VM
我正在尝试在亚马逊网络服务的EC2免费层Ubuntu上安装
text2vec
。我收到这个错误消息:Installing package into ‘/usr/local/lib’ ...** libs g++ -std=gnu++11
浏览 7
提问于2018-04-21
得票数 0
1
回答
text2vec
的词干函数
我在R中使用
text2vec
,很难编写一个与
text2vec
包中的itoken函数一起工作的词干函数。
text2vec
文档显示了这个词干函数: word_tokenizer(x) %>% lapply(SnowballC::wordStem这是我运行的代码(借用自以前的堆栈溢出答案):library(data.table)data("movie_review&quo
浏览 3
修改于2016-11-21
得票数 8
回答已采纳
1
回答
text2vec
与RHadoop的兼容性
目前,我们在亚马逊网络服务EC2(single instance)中使用
text2vec
处理大数据集,未来文本数据会越来越大,我们可能会尝试RHadoop(MapReduce)架构,但不知道它是否能兼容
text2vec
和RHadoop(MapReduce)。
浏览 7
提问于2017-08-13
得票数 0
回答已采纳
2
回答
使用预先训练的模型与
text2vec
?
我想使用一个预先训练的模型与
text2vec
。我的理解是,这里的好处是,这些模型已经接受了大量数据的培训,例如。读取
text2vec
看上去像是刚开始的代码读取文本数据,然后用它来训练一个模型:text8_file = "~/text8" if (!我可以使用
text2vec
来完成这个任务吗?
浏览 1
提问于2018-05-28
得票数 2
回答已采纳
1
回答
使用
text2vec
的困惑问题
正如我经常提到的,我正在使用
text2vec
处理23万个文档。我正在尝试使用perplexity为我的文档术语矩阵找到最佳主题编号。= i)INFO [2019-10-23 13:01:55] early stopping at 20 iteration Error in <em
浏览 19
提问于2019-10-24
得票数 0
回答已采纳
1
回答
将
text2vec
dtm写入文件(csv或svmlight)
我今天偶然看到了
text2vec
包,这正是我需要解决特定问题的地方。但是,我还没有弄清楚如何将用
text2vec
创建的dtm导出到某种输出文件中。我的最终目标是使用
text2vec
在R中生成特性,并将生成的矩阵导入H2O以供进一步建模。H2O可以读取CSV或SVMLight格式。
浏览 2
修改于2016-11-27
得票数 1
回答已采纳
1
回答
匹配文档与
text2vec
-缩放问题
我使用的是
text2vec
,它提供了非常好和快速的结果。C部分-这是最贵的部分。rm(list = ls())library(dplyr) # example is 10 entries.(t2v_
浏览 0
提问于2018-02-16
得票数 0
回答已采纳
1
回答
text2vec
R包中字嵌入的准备
在
text2vec
包的基础上,给出了一个生成word embedding.The wiki数据的实例,并在此基础上建立了术语共现矩阵(TCM),利用包中提供的手套函数来创建词嵌入。**vignettes code:**library(readr)download.file('http://mattmahoney.netx_max = 10, learning_rate = 0.2,我对开
浏览 0
提问于2016-09-15
得票数 2
回答已采纳
1
回答
使用
text2vec
进行多标签分类
我想知道
text2vec
包是否可以用于多标签分类,就像skmultilearn.problem_transform中的python BinaryRelevance一样。我目前指的是上记录的管道。
浏览 2
提问于2018-09-20
得票数 0
1
回答
从LDAvis json那里得到
text2vec
给定文档术语矩阵dtm,
text2vec
提供了与LDAvis包的良好集成。然而,我想将这个可视化嵌入到一个标记文档中。convergence_tol = 1e-3, n_check_convergence = 10, progressbar = interactive()) 是否要返回到可视化的json,或者以其他方式访问
text2vec
浏览 1
提问于2018-06-25
得票数 0
回答已采纳
1
回答
从word向量到文档向量[
text2vec
]
我希望使用在GloVe中实现的
text2vec
单词嵌入来执行监督回归/分类。我在
text2vec
主页上阅读了关于如何生成单词向量的有用教程。
浏览 0
提问于2017-12-03
得票数 4
1
回答
text2vec
包可以拆分中文句子吗?
如何在
text2vec
中设置切分中文的itoken?这个例子是针对英语的!目前已有的中文分词软件包有:解霸等,但我想用
text2vec
做文本聚类和线性回归模型。此外,如何进行文本聚类?library(
text2vec
)# 数据准备train=movie_review[J(train_ids)]#文档向量化 #
浏览 10
修改于2017-05-08
得票数 0
1
回答
在
Text2vec
中实现Arora 2017
我正在尝试使用
text2vec
复制Arora2017 ( / )。作者通过平均单词嵌入并减去第一主成分来计算句子嵌入。common_terms = intersect(colnames(dtm), rownames(word_vectors) ) dtm_averaged <-
text2vec
浏览 7
提问于2018-01-19
得票数 0
1
回答
带有插入符号问题的
Text2Vec
分类
一些上下文:+ Fold02.Rep1我推测在将
text2vec
生成的文档术语矩阵转换为向量时存在问题,因为插入符号需要进行一些计算,但老实说我不确定,这就是产生这个问题的主要原因。 使用的代码,以及一些跳过的部分,如下所示。请注意,我将
text2vec
返回的文档术语矩阵的直接结果提
浏览 3
修改于2017-05-23
得票数 4
回答已采纳
3
回答
有效地替换
text2vec
中的单词
对于后面的分析,我使用
text2vec
库,并希望将该库也用于此任务(避免使用tm来减少依赖)。happy_emotion" "I happy_emotion my car" 我以前使用tm (使用tm::content_transformer和tm::tm_map)来处理这个问题,但是我希望用更快的
text2vec
我想最好的解决方案是以某种方式使用
text2vec
的itoken,但我不确定如何使用。有什么想法吗?
浏览 8
修改于2017-05-23
得票数 2
回答已采纳
1
回答
将
text2vec
嵌入应用于新数据
我使用
text2vec
从包含大量行业特定行话的专有文本数据集生成自定义的word嵌入(因此,与谷歌提供的嵌入一样的股票嵌入是行不通的)。类比效果很好,但我很难应用嵌入来评估新的数据。vecs =从
text2vec
的手套实现中获得的单词向量化 it
浏览 0
提问于2017-02-02
得票数 2
回答已采纳
1
回答
在R中使用
text2vec
-错误:没有名为‘futile.options’的包
我在R中成功地安装了
text2vec
,但是当我尝试用library(
text2vec
)加载它时,我得到了一个错误:there is no package
浏览 2
修改于2018-10-29
得票数 0
1
回答
R变换新数据中的
text2vec
?
有关于为
text2vec
包创建DTM (文档术语矩阵)的文档,例如,在构建矩阵之后应用TFIDF权重的文档如下:N <- 1000 it <- itoken(
浏览 1
修改于2016-09-01
得票数 1
回答已采纳
1
回答
如何解决安装
text2vec
包时出现的问题?
我正在尝试安装R包
text2vec
,我得到了以下错误。它说它不能打开某个共享目标文件。> install.packages("
text2vec
") unable to load sharedloadNamespace -> library.dynam -> dyn.loadERROR: lazy loading failed for package ‘
text2vec</e
浏览 192
提问于2021-08-30
得票数 0
0
回答
使用
text2vec
循环以进行标记化
我想使用
text2vec
来比较他们在这两个时间点对这些问题的回答的相似性(重复检测)。以下是我的初始数据的结构(在本例中,只有3个参与者,4个问题而不是8个问题,以及2个季度/时间段)。我打算使用包
text2vec
的psim命令来完成此操作。library(
text2vec
) vocabmkr<-function(x) { itoken(x$AnswerText, ids=x$ID) %>% create_vocabulary()%>%
浏览 3
修改于2018-07-18
得票数 0
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
点击加载更多
领券