首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >作为网络输入的单词

作为网络输入的单词
EN

Data Science用户
提问于 2018-06-13 12:04:02
回答 2查看 60关注 0票数 3

我想要建立神经网络,我的输入将是一个词(而不是一个句子)。我的词集有许多不同长度(字符数)的单词。我的想法是使用预定义字典将字符转换为数字,然后使用它作为输入。输入层中的神经元数集合为我的集合中最长单词中的若干个字符。向量越短,我就把它们填充到零。

我的一套词看起来:

代码语言:javascript
复制
1. head
2. hello
3. butterfly
4. hotel
5. fly
6. spy

因此,对于这个集合,我对netowrk的输入应该有9个神经元。当我转换'head‘时,我将得到4个数字和5个零的向量。

这是个好主意?或者你还有另外一个更好的想法,那就是这个网络的输入会是什么样子。

编辑:

我的任务描述在这里:词转换的ML模型:我想建立GAN作为一个答案。因此,这个词将是我的‘真正的词’,我想产生假词。

EN

回答 2

Data Science用户

发布于 2018-07-13 17:54:55

这里的方法很简单,就是把字母写得一清二楚。因此,您将有许多列的1和零。现在,这可能是nn的输入层。

票数 1
EN

Data Science用户

发布于 2018-06-13 12:16:00

虽然您的方法听起来合乎逻辑,但它与大多数基于语言的模型的创建方式有很大的不同。你真的需要告诉我们什么是你想要你的模型学习和能够预测,一旦你已经训练了它。为什么你对单词的长度感兴趣;输入层的神经元数量与你最长的单词中的字符数量相同,这有什么意义?这听起来像是某种性能优化。

由于我们通常对单词的意义感兴趣,所以已经发展出了编码意义的方法。有一些模型,如Word2Vec,它以文本为输入,以向量的形式为每个单词产生语义意义。请看这里的教程

当我们把图像作为模型的输入时,我们通常对诸如“图片中的什么?”、“图片在哪里?”之类的东西感兴趣。“旁边是什么?”这意味着空间信息很重要。

文字向量和图像都是数字形式,可以传递到网络中。我们仍然需要知道我们希望我们的模型学习什么,以及我们想要优化什么;我们必须决定一个损失或错误的定义,因为这就是然后通过反向传播来训练模型的内容。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/33079

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档