搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

Allennlp ConfigurationError:位置"matrix_attention“需要键”matrix_attention“。

pip install --pre allennlp-models，我的代码也应该很好，但是我仍然收到这样的错误消息：ConfigurationError: key "matrix_attention"

浏览 12提问于2020-07-08得票数 3

回答已采纳

3回答

tensorflow‘模块’对象没有属性'prepare_attention‘

我遇到的问题是： tf.contrib.seq2seq.prepare_attention(attention_states,attention_option = "bahdanau", num_units = decoder_cell.output_size) 我不知道用什么代替tf.contrib.seq2seq.prepare_attention

浏览 2修改于2018-02-06得票数 0

0回答

在lstm模型中加入attention层时出错？

、、、、

从attention库中调用AttentionValueError: Only input tensors may be passed

浏览 249提问于2024-04-21

1回答

attention_ocr模型如何使用图像/类？

我正在准备自己的数据集来训练attention_ocr模型。我正在尝试修改以准备我的数据集。指定的目的是什么(对于inception，对于attention_ocr，它看起来是)，attention_ocr如何使用它？

浏览 13提问于2017-07-10得票数 0

回答已采纳

2回答

NewRandomAccessFile未能创建/打开；Attention_OCR

tensorflow.python.framework.errors_impl.NotFoundError: NewRandomAccessFile failed to Create/Open: D:\Vision_Project\attention_ocr

浏览 0提问于2018-07-28得票数 2

回答已采纳

1回答

MultiHeadAttention attention_mask [Keras，Tensorflow]示例

self.dropout2(ffn_output, training=training)在链接下可以找到掩蔽文档： def call(self, inputs, mask, training): attn_output = self.att(inputs, inputs, attention_mask除此之外，我不认为这是正确地掩盖输入--一般来说，考虑到attent

浏览 1修改于2021-06-02得票数 8

1回答

Tensorflow:如何提取用于绘图的attention_scores？

如果您在Keras中有一个MultiHeadAttention层，那么它可以返回如下所示的注意力分数：如何从网络图中提取注意力分数？

浏览 12修改于2022-04-10得票数 3

回答已采纳

4回答

关于attention与时间卷积的不定长问题？

、、、

你好,我是一个初学者,有两个问题有点不明白,希望可以指教. 1 attention,从文章中展示的图来看,所谓的attention就是一个输出对于输入的全连接,而全连接的参数可以理解为所谓的注意力,可以这样理解吗还是attention还有其他的一些技巧?

浏览 929提问于2018-05-15

1回答

带有RNNCell的TensorFlow attention_decoder (state_is_tuple=True)

我想用attention_decoder构建一个seq2seq模型，并使用MultiRNNCell和LSTMCell作为编码器。问题是，当我将编码器的状态传递给attention_decoder时，它报告了一个错误：这个问题似乎与seq2seq.py中的attention()函数和rnn_cell.py中的_linear()函数有关，在这两个函数中，代码从编

浏览 0提问于2016-06-26得票数 4

1回答

=docs_tensors['attention_mask']) logits, _ = model(docs_next_tensors['input_ids'], attention_mask=docs_next_tensors['attention_mask'], past=past) logits = logits[:, -1]=docs_next_tensors['attention

浏览 3修改于2020-02-28得票数 0

回答已采纳

1回答

TensorFlow 2中tf.contrib.seq2seq.prepare_attention的等价性是什么

(attention_keys,attention_score_fn, attention_states=attention_states, num_units=self.decoder_

浏览 0提问于2020-07-12得票数 1

2回答

pytorch attention* seq2seq教程中的错误？*

我正在用Pytorch编写序列神经网络的序列。在official Pytorch seq2seq tutorial中，有一个注意力解码器的代码，我不能理解/认为可能包含错误。它通过连接输出和此时的隐藏状态来计算每个时间步的注意力权重，然后乘以一个矩阵，得到一个大小等于输出序列长度的向量。注意，这些注意力权重不依赖于编码器序列(在代码中命名为encoder_outputs )，我认为它应该依赖于编码器序列。此外，the paper cited in the tutorial还列出了三种不同的得分函数，可用于计算注意力权重(本文的3.1节)。这些函数都不是简单地连接和乘以一个矩阵。因此，在

浏览 37提问于2019-05-03得票数 1

1回答

tensorflow 1.2.0中相当于tensorflow 1.0.0的prepare_attention接口

对于tensorflow 1.0.0的prepare_attention(tf.contrib.seq2seq.prepare_attention)，tensorflow 1.2.0中对应的API是什么

浏览 0修改于2017-10-06得票数 1

1回答

伯特的mask_token_id与attention_mask的关系

bert-base-uncased') input_ids = tokens["input_ids"]然后，对于跨度列表中的每一个跨度，我掩盖了我想要预测的标记。我将他们的attention_mask索引更改为0，将input_id索引更改为tokeniser.mask_token_id。at

浏览 11提问于2022-06-15得票数 0

2回答

如何在tensorflow attention_ocr上运行预训练模型？

我已经成功地在我的数据上训练了，现在我正在尝试进行推理运行(tensorflow版本1.2.1)。以前有人试过这个吗？或者有人能为我提供一些修复它的提示？images_actual_data

浏览 10修改于2017-08-08得票数 1

2回答

掩蔽层与attention_mask参数在MultiHeadAttention中的关系

因为我的数据有不同的长度，所以我在MultiHeadAttention中使用填充和attention_mask参数来屏蔽填充。如果我在使用Masking层之前使用MultiHeadAttention，它是否会产生与attention_mask参数相同的效果？或者我应该同时使用：attention_mask和Masking层？

浏览 27修改于2022-09-12得票数 5

回答已采纳

1回答

当应用于单个句子时，BertModel如何知道跳过attention_mask参数？

从示例代码中，我可以看到下面的语句 outputs = self.model(tokens_tensor, segments_tensors) 它没有attention_mask参数。但是，如果我输入注意掩码张量参数，它会产生相同的结果 outputs = self.model(tokens_tensor, attention_tensors, segments_tensors) 当运行整个数据集的代码时，attention_tensors是绝对必要的。我理解为什么单个句子不需要注意掩码的原因，但是python代码如何知道第二个参数实际上是

浏览 91提问于2020-10-12得票数 0

1回答

如何在Windows10上创建PHP CLI脚本"call for attention“？

任务栏上的图标或任务栏中图标组中的图标可以“闪烁”以引起注意。所有类型的程序在需要人类关注的时候都会这样做。我该如何做到这一点？在被告知这件事后，我尝试了几种ASCII“铃声”的东西，但从来没有起作用。钟形字符既不会让图标闪烁，也不会在Windows 10上播放声音。因此，这不是正确的解决方案。

浏览 0修改于2020-02-29得票数 0

1回答

掩蔽在语言理解转换器的scaled_dot_product_attention中是如何工作的？

但是，我对函数scaled_dot_product_attention中使用的掩码有点困惑。我知道掩码是用来做什么的，但我确实知道它们在这个函数中是如何工作的。这可以在提到的函数的以下行中看到： scaled_attention_logits += (mask * -1e9) def scaled_dot_product_attention(q, k, v, mask): """Calculate

浏览 27修改于2021-02-20得票数 0

回答已采纳

1回答

使用/指定attention_mask与Trainer & TrainingArguments一起训练GPT2

我的数据集具有语料库标记的ids和每个文本的掩码，以指示将注意力应用于何处： Dataset({output_dir=path_save_checkpoints,tra

浏览 50提问于2021-04-28得票数 0

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Allennlp ConfigurationError:位置"matrix_attention“需要键”matrix_attention“。

tensorflow‘模块’对象没有属性'prepare_attention‘

在lstm模型中加入attention层时出错？

attention_ocr模型如何使用图像/类？

NewRandomAccessFile未能创建/打开；Attention_OCR

MultiHeadAttention attention_mask [Keras，Tensorflow]示例

Tensorflow:如何提取用于绘图的attention_scores？

关于attention与时间卷积的不定长问题？

带有RNNCell的TensorFlow attention_decoder (state_is_tuple=True)

同时使用past和attention_mask进行gpt2

TensorFlow 2中tf.contrib.seq2seq.prepare_attention的等价性是什么

pytorch attention* seq2seq教程中的错误？*

tensorflow 1.2.0中相当于tensorflow 1.0.0的prepare_attention接口

伯特的mask_token_id与attention_mask的关系

如何在tensorflow attention_ocr上运行预训练模型？

掩蔽层与attention_mask参数在MultiHeadAttention中的关系

当应用于单个句子时，BertModel如何知道跳过attention_mask参数？

如何在Windows10上创建PHP CLI脚本"call for attention“？

掩蔽在语言理解转换器的scaled_dot_product_attention中是如何工作的？

使用/指定attention_mask与Trainer & TrainingArguments一起训练GPT2

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐