我有一个简单但很大的数据文件。这是一个神经网络模拟的输出。第一列是一个时间步长,1..200。第二个是目标单词(对于当前模拟,1..212)。然后有212列,每个单词一列。也就是说,在给定特定目标(输入)单词的特定时间步,每行都具有每个单词节点的激活值。
我需要做一些简单的操作,比如将每个激活转换为一个响应强度(exp(常量x激活)),然后将每个响应强度除以响应强度的行和。在R中做这件事非常慢(20分钟),在perl中用传统的循环做这件事更快,但仍然很慢(7分钟),因为稍后的模拟将涉及数千个单词。
看起来PDL应该能够更快地做到这一点。我一直在阅读PDL文档,但我真的不知道如何做第二步。第一个看起来很简单,只需选择激活列并将它们放入$act中,然后:
$rp = exp($act * $k);
但是我不知道如何将每个值除以它的行和。任何建议都将不胜感激。
谢谢!
发布于 2016-01-31 13:23:44
看起来您需要复制矩阵,然后使用第一个矩阵进行读取,使用第二个矩阵进行写入。注意:使用$c++而不是for $loop() {可能更有效!}
$x = sequence(3,3)*2+1;
[ 1 3 5]
[ 7 9 11]
[13 15 17]
$y .= $x; # if you use = here it will change both x and y
for $c(0..2) { for $d(0..2) { $y($c,$d) .= $y($c,$d) / sum($x(,$d)) }}
p $y;
[0.11111111 0.33333333 0.55555556]
[0.25925926 0.33333333 0.40740741]
[0.28888889 0.33333333 0.37777778]https://stackoverflow.com/questions/32686102
复制相似问题