首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用于文本分类的预训练模型

用于文本分类的预训练模型
EN

Stack Overflow用户
提问于 2020-12-12 16:05:54
回答 1查看 416关注 0票数 0

所以我有几个没有标签的单词,但我需要将它们分类为4-5个类别。我可以明确地说,这个测试集是可以分类的。虽然我没有训练数据,因此我需要使用预先训练好的模型来对这些单词进行分类。哪个模型适合这个范例,它已经在哪个数据集上进行了训练?

谢谢

EN

回答 1

Stack Overflow用户

发布于 2021-02-07 20:00:29

我们正在讨论的任务称为Zero-Shot主题分类-预测模型尚未训练过的主题。这个范例是由拥抱脸库支持的,你可以阅读更多的here。最常见的预训练模型是Bart Large MNLI -在MNLI dataset上训练后的bart-large检查点。这里有一个简单的例子,展示了“我喜欢热狗”的分类,没有任何初步的训练:

  1. 首先,请安装转换器库:

pip安装--upgrade transformers

然后,

  1. 导入并初始化管道:

从转换器导入流水线分类器=流水线(‘零镜头分类’,model='facebook/bart-large-mnli')

  1. 进入我们的玩具数据集:

labels =“文物”,“动物”,“食物”,“鸟类”hypothesis_template =‘这篇文章是关于{}的。’sequence =“我喜欢热狗”

  1. 预测标签:

预测=分类器( print(prediction),labels,hypothesis_template=hypothesis_template,multi_class=True)预测

输出将如下所示

代码语言:javascript
复制
`{'sequence': 'i like hot dogs', 
'labels': ['food', 'animals', 'artifacts', 'birds'], 
'scores': [0.9971900582313538, 0.00529429130256176, 0.0020991512574255466, 
0.00023589911870658398]}`

可以解释为,该模型分配的概率最高(0.997..)标签“食物”,这是正确的答案。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65262832

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档