腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(216)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
OOV
的近邻也是
OOV
- FastText
我试图在快速文本中获取词汇外单词(
OOV
)的最近邻居,然而,似乎最近的邻居也是
OOV
?print(len(nn2) == len(nnsims2)) # False我对此的解释是,如果这个词是
OOV
但是,
OOV
单词的邻居是如何生成的呢?我似乎无法从FastText的文档中找到任何解释。
浏览 2
修改于2021-12-25
得票数 0
1
回答
spacy - token不是
OOV
,但没有向量
简而言之,我有一个单词,它不是
OOV
(token.is_
oov
== False),但没有向量(token.has_vector == False)。更有可能的是,我忽略了一件明显的事情,但我直观地理解
OOV
缺少一个向量,在本例中,长度为300的向量是0。 简单地说,一个词汇表中的标记怎么可能缺少向量呢?
浏览 18
提问于2021-03-01
得票数 1
1
回答
面向
OOV
词的词嵌入
如何使用现有的词嵌入动态生成
OOV
词的词向量?
浏览 12
提问于2017-12-28
得票数 4
回答已采纳
1
回答
Number批(多语种)
OOV
字
然后,我创建了一个函数,用于打印我的语料库中的所有
OOV
单词。当我分析结果时,我更加惊讶:超过22k的单词没有被找到(包括'nous'(we),'être'(to be)等等)。我还尝试了在上为
OOV
单词提出的方法(结果相同): ConceptNet Numberbatch是用一个词汇外策略来评估的,它可以帮助它在不熟悉的单词存在的情况下表现出来。
浏览 8
修改于2020-11-21
得票数 3
回答已采纳
1
回答
词汇外初始化(
OOV
)标记
我正在为NLP任务建立TensorFlow模型,并使用预先训练过的GLOW300d字向量/嵌入数据集。我可以用0的向量替换那些标记,但是我不想把这些信息丢在地板上,我更愿意对它进行编码,并将其包含到我的训练数据中。谢谢。
浏览 5
修改于2017-08-04
得票数 3
回答已采纳
3
回答
在GoogleNews中处理
OOV
字词.向量.阴性
我的问题是,我们如何计算单词向量,即
OOV
?我在网上搜索,什么也找不到。当然,要做到这一点,就要删除谷歌word2vec中没有列出单词的所有句子。Drive/Colab Notebooks/GoogleNews-vectors-negative300.bin', binary=True) model.train(sentences_with_
OOV
_words
浏览 0
提问于2019-09-16
得票数 0
回答已采纳
1
回答
keras
oov
_token=True是如何工作的
默认情况下,当
oov
_token=True时,keras是如何推断出词汇量不足的标记的。但是,如果没有显式地指定
oov
_token=True,则没有太多的细节。
浏览 13
修改于2022-04-20
得票数 1
1
回答
从石墨烯到音素的
OOV
词启发式
G2P是通过以下方式完成的:然而,就目前而言,是否有元音替代同音词和
OOV
词并不重要
浏览 4
提问于2022-06-25
得票数 0
回答已采纳
1
回答
查找
OOV
word的最相似的单词
我正在寻找使用gensim的词外
OOV
单词最相似的单词。
浏览 15
提问于2020-05-22
得票数 0
1
回答
AttributeError:“Tokenizer”对象没有属性“
oov
_token”
当我处理文本时,我有这个问题。你知道怎么修好它吗。我只是用。
浏览 1
提问于2022-07-29
得票数 0
回答已采纳
1
回答
为
OOV
词添加新向量的适当方法
我使用的是一些特定于领域的语言,它有大量的
OOV
单词和一些排字。我注意到Spacy会为这些
OOV
单词分配一个全零向量,所以我想知道如何正确地处理这个问题。什么是最简单的方法来生成一个新的向量集,其中包括我的
OOV
词,但仍然包含语言的一般知识? 非常感谢
浏览 8
提问于2020-07-28
得票数 5
回答已采纳
1
回答
Watson Speech to text -自定义语言模型训练错误-
OOV
单词总数超过30000
我核实了
OOV
的字数-curl -XGET -u "myusername":"mypassword“"”>
OOV
.txt{ "code":400,"code
浏览 0
提问于2016-11-05
得票数 0
2
回答
如何在word嵌入模型中添加
OOV
术语
这个模型运行得很好,但是现在是用“外部信息”改进模型的时候了,我指的是
OOV
(词汇外)术语或没有良好上下文的术语。
浏览 0
提问于2019-04-11
得票数 1
1
回答
两个不同的
OOV
字能在FastText中得到相同的向量吗?
既然FastText总结了一个
OOV
词的子词的向量(不考虑顺序),那么两个不同的
OOV
词是否有可能得到相同的向量呢?如果是,那你能举个例子吗?
浏览 0
提问于2019-12-19
得票数 4
回答已采纳
1
回答
低RAM环境下Fasttex的
OOV
(词汇表外)词嵌入
有没有一种方法可以使用快速文本而不将所有嵌入内容加载到内存中,来获得
OOV
(Out Of way )单词的向量?然而,要获得带有快速文本的
OOV
矢量,您需要使用.bin文件,然后将其加载到内存中。有没有办法避免加载整个.bin文件?
浏览 14
修改于2018-08-03
得票数 1
1
回答
如何在Spacy中为
OOV
术语指定词向量?
我希望能够为
OOV
术语设置此默认向量。
浏览 40
修改于2019-09-02
得票数 1
回答已采纳
1
回答
AttributeError:“Tokenizer”对象在Keras中没有属性“
oov
_token”
我试图使用加载的令牌程序对文本进行编码,但得到了以下错误 我包括了下面的代码
浏览 0
修改于2018-04-16
得票数 4
回答已采纳
1
回答
使用预先训练过的单词嵌入-如何为未知/
OOV
令牌创建向量?
但是,似乎没有词汇外(
OOV
)标记的重新定义。不存在看不见的文字的矢量。 那么我该怎么处理我遇到的
OOV
-令牌呢?
浏览 1
修改于2018-11-15
得票数 4
回答已采纳
1
回答
如果我不提供
oov
_token,那么tensorflow中的Tokenizer如何处理词汇表之外的标记?
tokenizer.texts_to_sequences(X_test)尽管我没有提供
oov
_token我希望在test_tweets = tokenizer.texts_to_sequences(X_test)中得到一个错误 当您不提供
oov
_token时,tensorflow如何处理测试期间词汇量不足的单词
浏览 1
修改于2022-03-31
得票数 1
回答已采纳
1
回答
iOS上的语音识别-在iOS上将
OOV
单词转换为音素?
按照StackOverflow上的建议,我已经成功地尝试了Openears,并从NSSTRINGS数组生成自定义词汇表。然而,我们还需要从地址簿中识别姓名,而在这里,回退方法不可避免地失败了,这是非常糟糕的,经常是…或者其他一些库,可以将用户语音转换为我可以输入到Openears中的音素字符串?
浏览 6
修改于2014-03-02
得票数 1
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券