搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

什么是最简单的方式继续培训一个预先培训的伯特模型，在一个特定的领域？

我想使用一个预先训练的伯特模型，以便在文本分类任务中使用它(我使用的是Huggingface库)。然而，预先训练过的模型是针对与我不同的领域而训练的，我有一个大的未注释的数据集，可以用来微调它。如果我只使用标记的示例并在特定任务(BertForSequenceClassification)的培训中微调它，那么数据集太小，无法适应特定领域的语言模型。这样做最好的方法是什么？谢谢!

浏览 5提问于2021-04-27得票数 1

回答已采纳

1回答

对于序列分类来说，对大上下文的bert进行微调可以吗？

我想要创建序列分类bert模型。模型输入为2句。但是，我想用大上下文数据对模型进行微调，该数据由多个句子组成(标记的数量可能超过512)。如果训练数据的大小和实际输入数据的大小不同，可以吗？谢谢

浏览 0提问于2022-03-25得票数 1

1回答

Tensorflow模型文件大小差异很大

例如，框架提供了两个模型：当我在我的模型中应用微调时，在图形中做一些小改动(在框架中有一个模块)并保存我的模型时，大小基本上是相同的：178.525 kb。首先，我感到有点惊讶的是，我的微调模型有点大，因为我只将最后一层从21个类更改为14个类，所以我希望模型文件的大小会稍微小一些，但由于差异太小，我没有注

浏览 3提问于2017-11-15得票数 0

1回答

我在caffenet中使用微调，它工作得很好，但是我在Keras 关于微调的博客中读到了这篇文章(他们使用经过训练的VGG16模型)： “为了进行微调，所有层都应该从经过适当训练的权重开始:例如，你不应该把一个随机初始化的完全连接的网络放在一个预先训练过的卷积基础上这是因为随机初始化的权值引发的大梯度更新会破坏卷积基中的学习权重。在我们的情况下，这就是为什么我们首先训练顶级分类器，然后才开始与它并排微调卷积权。”因此，作为微调的另一步，它们在全连通层(“瓶颈特征”)之前

浏览 0提问于2017-03-20得票数 2

1回答

微调NLP模型

在计算机视觉中，如果我们没有一个大的训练集，一个常见的方法是从一个预先训练过的模型开始一些相关的任务(例如ImageNet)，并微调这个模型来解决我们的问题。对于自然语言处理问题，能做类似的事情吗？特别是，是否有一个很好的方法来微调一个LSTM或1dcnn或其他转移学习？如果我们想对句子进行分类，那么是否有一个合理的预先训练的模型可以开始呢？

浏览 0提问于2018-05-28得票数 2

1回答

在web应用程序中为特定于用户的大型模型服务的最佳实践？

集成大型机器学习/深度学习模型微调的web应用程序如何处理这些模型的存储和检索以进行推理？我正在考虑的当前方法是以压缩格式将精调模型存储在S3或R2桶中。每次用户访问web应

浏览 0提问于2023-02-03得票数 0

回答已采纳

1回答

如何用协作图来绘制一个图中多个模型的系数？

我的模型有不同的因变量(DVs)，但使用相同的工具变量(IV)，有两种不同类型的识别策略。简言之，我有：model 1model 3model 1-2model 3-2我想绘制出可以比较模型1和模型1-2，模型2和模型2-2的IV的系数估计值的系数。我想在一个图表中画出八个系数，因为所有模型的兴趣IV都是相同的。有没有一种程式化的方法来做

浏览 0修改于2019-02-09得票数 0

1回答

如何用拥抱的脸来微调一个模型？

我想下载一个预先训练过的模型，并用我自己的数据对模型进行微调。我已经下载了一个伯特-大纳模型文物从拥抱脸，我已经列出了以下内容。对于这一点，我想知道我需要哪些文件或工件，从外观上看，pytorch_model.bin是经过训练的模型，但这些其他文件是什么以及它们的用途，比如令牌程序文件和vocab.txt . config.json

浏览 13提问于2022-09-03得票数 -1

1回答

在迁移学习过程中，哪一部分应该冻结？

我想使用转移，学习和微调，我需要决定哪一部分的原始模型将使用，哪一部分将被冻结。我正在考虑四种可能的情况:小/大的新数据集，这个集合与原始数据集相似/不相似。应如何在每一种情况下取得最佳结果？

浏览 0提问于2021-01-27得票数 0

回答已采纳

3回答

浮子的Java减法是无穷大吗？

在我的调试器中，我可以看到以下值：float max = 3.3434891E38 这就导致了无穷大。(2-2^23)·2^127比温度变量大，对吗？

浏览 9修改于2014-11-04得票数 1

回答已采纳

1回答

在这个嵌套的if语句中有什么中断？

为什么来自中间函数的输出(应该输出“小2、中2和大2”的值)返回N/A？Large 1", IF(AND([@SQFT] < 1200, OR([@[BED/BATH]] = "2-0",

浏览 2修改于2022-06-21得票数 -2

回答已采纳

1回答

将多组数据加载到一个表中/在数据模型中创建子字段

"id" : "34", "field1" : "data 2-1", }, "v1" : "more 2-1", "v2&qu

浏览 0修改于2015-12-24得票数 0

回答已采纳

1回答

我需要微调最后的卷积层，在一个最先进的CNN模型，如ResNet50？

我的毕业设计是使用CNN模型上的转移学习，它可以从胸部X光图像中诊断新冠肺炎。利用贝叶斯优化器利用Keras调谐器库对完全连通层数、层中节点数、学习速率、下降率等超参数进行微调，得到了很好的结果，多类分类的测试准确率为98%，二进制分类的测试准确率为99%。然而，我冻结了所有的层在原来的基础模型。我只微调了最后一个完全连接的层后，详尽的超参数优化。大多数的文章和论文说，他们精细的完全连接的层，以及一些卷积层。我做错什么了吗？恐怕这太好了，不可能是真的。我的数据集没有那么大，只有7000张来自卡格尔新冠肺炎

浏览 3修改于2021-02-10得票数 0

回答已采纳

1回答

设置Android循环进度条的粗细

我发现默认的Android进度条在大的时候非常粗，是不是在循环不确定的时候让条变薄了。我不想使用自定义绘图，如果可能的话。它总是放慢速度，并给出一个我不喜欢的2-2梯度

浏览 2提问于2016-04-06得票数 4

1回答

针对不同语言的特定领域微调BERT？

我想对一个预先训练好的BERT模型进行微调。但是，我的任务使用特定领域内的数据(比如生物医学数据)。此外，我的数据也是一种不同于英语的语言(比如荷兰语)。现在，我可以微调荷兰bert-base-荷兰案例预训练模型。然而，我该如何对生物医学BERT模型进行微调，比如BioBERT，它属于正确的领域，但语言错误？如果我在没有对模型进行任何更改的情况下进行微调，我担心模型不会很好地学习任务，因为它是在完全不同的语言上预先训练的。

浏览 4提问于2021-01-28得票数 2

1回答

回归问题在值除以100时得到更好的结果

我注意到，当我运行目标在0-100范围内的模型时，它不会学习-验证损失没有改善，25%大目标的损失非常大，比这组中的std大得多。然而，当我用0-1范围内的目标运行模型时，它确实学习了，并且我得到了很好的结果。如果有人能解释为什么会发生这种情况，如果使用范围0-1是“作弊”，那就太好了。还有-我应该扩展目标吗？一些额外的信息-我正在尝试微调bert以完成特定的任务。我使用MSEloss。谢谢!

浏览 35提问于2020-07-26得票数 0

1回答

有没有办法在tensorflow中强制添加新的变量到现有的检查点？

假设有一个深度学习模型和一个具有预先训练好的权重的检查点。我想要做的是对预先训练的模型进行微调。然而，我发现我必须使用现有模型图中没有定义的新的ADAM优化器对模型进行微调。因为ADAM优化器本身有一些trainable_variables，所以如果我想要基于检查点对模型进行微调，我必须将它们添加到现有的检查点。

浏览 19提问于2020-01-15得票数 0

1回答

如何在我的tensorflow模型的转移学习和微调中实现？

我有一个预先训练过的模型(tensorflow模型)，它是使用来自公共数据集的数据进行训练的。我有元文件和录入文件。我想训练我的tensorflow模型使用新的数据从私人获得的数据集。我有小数据集，所以我想微调我的模型根据‘战略2’或‘战略3’。但是，我无法找到在tensorflow模型的传输学习和微调中实现的示例代码。keras模型有很多例

浏览 0修改于2020-03-02得票数 1

1回答

针对特定于上下文的嵌入角色微调BERT模型

我正在试图找到关于如何训练BERT模型的信息，可能是从Huggingface Transformers库中，以便嵌入它的输出与我正在使用的文本的上下文更紧密地相关。然而，我能找到的所有例子都是关于为另一个任务微调模型的，比如classification。有没有人碰巧有一个BERT微调模型的例子，用于掩蔽标记或下一句预测，输出另一个根据上下文微调的原始BERT模型？谢谢!

浏览 15提问于2021-04-17得票数 3

回答已采纳

1回答

如何使用resnet50模型进行微调？

我在互联网上看到了许多关于如何微调VGG16和InceptionV3的例子。例如，一些人会在微调VGG16时将前25层设置为冻结。对于InceptionV3，头172个层将被冻结。但是resnet呢？当我们进行微调时，我们将冻结一些基本模型的层，如下所示： base_model = ResNet50(实际上，当我使用VGG16、VGG19、ResNet50、InceptionV3 .etc进行微调时，我不知

浏览 6提问于2017-10-11得票数 2

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

什么是最简单的方式继续培训一个预先培训的伯特模型，在一个特定的领域？

对于序列分类来说，对大上下文的bert进行微调可以吗？

Tensorflow模型文件大小差异很大

微调的正确方法--把一个完全连接的层训练成一个单独的步骤

微调NLP模型

在web应用程序中为特定于用户的大型模型服务的最佳实践？

如何用协作图来绘制一个图中多个模型的系数？

如何用拥抱的脸来微调一个模型？

在迁移学习过程中，哪一部分应该冻结？

浮子的Java减法是无穷大吗？

在这个嵌套的if语句中有什么中断？

将多组数据加载到一个表中/在数据模型中创建子字段

我需要微调最后的卷积层，在一个最先进的CNN模型，如ResNet50？

设置Android循环进度条的粗细

针对不同语言的特定领域微调BERT？

回归问题在值除以100时得到更好的结果

有没有办法在tensorflow中强制添加新的变量到现有的检查点？

如何在我的tensorflow模型的转移学习和微调中实现？

针对特定于上下文的嵌入角色微调BERT模型

如何使用resnet50模型进行微调？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐