我有一张物品清单。每个对象都包含经度、纬度和单词列表。
我想做的是根据对象中包含的文本来预测位置(类似的文本应该有相似的位置)。现在,我使用余弦相似性来计算物体之间的相似性,文本,但我被困在如何利用这些信息来训练我的神经网络。我有一个矩阵,其中包含每个对象以及每个单词在该对象中出现的时间。F.x。如果我有这两件东西
Obj C: 54.123, 10.123, [This is a text for object C]
Obj B: 57.321, 11.113, [This is a another text for object B]然后我得到了类似于下面的矩阵
This is a text for object C another B
ObjC: 1 1 1 1 1 1 1 0 0
ObjB: 1 1 1 1 1 1 0 1 1对于两个对象之间的距离,我也会有类似的东西(注意,数字不是真实的)。
ObjC ObjB
ObjC 1 0.25
ObjB 0.25 1我已经研究过如何使用神经网络将事物分类(如A,B,C),或者预测像房价这样的东西,但是我发现没有任何东西对我的问题有帮助。
如果它在某个距离内,我会考虑正确的预测,因为我处理的是位置。这也许是个愚蠢的问题,但有人给我指明了正确的方向。
发布于 2016-11-17 23:00:53
看起来,您正试图用相同的输入来预测两种不同的事物(纬度和经度)。因此,这是一个预测多输出的问题。然而,它是很容易理解的基本只有一个输出。我会用这种方式来描述。
比方说,您的目标只是一个变量Y,这是您的位置。转换后(可能是TF),您有一个功能矩阵X,其中一行表示一个示例,一个列表示一个特性。您现在需要做的是使用输入X和目标Y来训练ANN。这就是安的训练方式:
由于您有多个输出问题,您需要一个ANN的实现,它同时支持最小化两个错误。这类似于多目标优化。Python在这里可以帮你。有关使用的详细信息,请参阅此sknn.mlp文档。它将接受多个输出,每个输出在目标矩阵中各自的列上。因此,您的Y将是形状n * 2,其中n是数据集中的样本数。只需使用上述格式的现有fit和Y调用X方法即可。一旦训练完成,你就得到了你的最小可行的神经网络。如何优化ANN的性能则是另一回事:)
https://datascience.stackexchange.com/questions/15196
复制相似问题