首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >NLP textEmbed函数

NLP textEmbed函数
EN

Stack Overflow用户
提问于 2021-10-19 15:42:58
回答 1查看 55关注 0票数 1

我试图在R中运行textEmbed函数,设置需要:

代码语言:javascript
复制
  require(quanteda)
  require(quanteda.textstats)
  require(udpipe)
  require(reticulate)


#udpipe_download_model(language = "english")

  ud_eng <- udpipe_load_model(here::here('english-ewt-ud-2.5-191206.udpipe'))

  virtualenv_list()

  reticulate::import('torch')
  reticulate::import('numpy')
  reticulate::import('transformers')
  reticulate::import('nltk')
  reticulate::import('tokenizers')
  require(text)

它运行以下代码

代码语言:javascript
复制
tmp1 <- textEmbed(x = 'sofa help',
                  model = 'roberta-base',
                  layers = 11)

tmp1$x

但是,它不运行以下代码

代码语言:javascript
复制
tmp1 <- textEmbed(x = 'sofa help',
                      model = 'roberta-base',
                      layers = 11)
    
    tmp1$x

它给出了以下错误

代码语言:javascript
复制
Error in x[[1]] : subscript out of bounds
In addition: Warning message:
Unknown or uninitialised column: `words`. 

如有任何建议,将不胜感激。

EN

回答 1

Stack Overflow用户

发布于 2022-05-02 13:11:16

我相信text-package的更新版本( .9.50版本和更高版本)已经修复了此错误。

(我看不出这两个代码部分有什么不同-但我认为这个错误与只向textEmbed提交一个令牌/单词有关,后者现在起作用了)。

此外,请参阅有关如何安装text-package http://r-text.org/articles/Extended_Installation_Guide.html的更新说明。

代码语言:javascript
复制
library(text)
library(reticulate)

# Install text required python packages in a conda environment (with defaults).
text::textrpp_install()

# Show available conda environments.
reticulate::conda_list()

# Initialize the installed conda environment.
# save_profile = TRUE saves the settings so that you don't have to run textrpp_initialize() after restarting R. 
text::textrpp_initialize(save_profile = TRUE)

# Test so that the text package work.
textEmbed("hello")
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69633894

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档