当您的类完全不同时，您不需要寻找特定的文本分类模型，因为大多数列出的模型都使用了一个基本模型，并对基本层进行了微调，并根据需要训练了输出层。在您的情况下，您将删除输出层，它们对基础层的微调不会给您带来太多好处，也不会对您造成太大伤害。有时他们扩展了词汇表，这对你的任务可能是有益的，但你必须检查描述(通常是稀疏的:()和你自己的词汇表，以获得关于各自模型的更多细节。

一般来说，我建议您立即使用其中一个基本模型，并仅在结果不充分的情况下寻找其他模型。

以下是包含6个类的bert示例：

from transformers import BertForSequenceClassification, BertTokenizer

tokenizer = BertTokenizer.from_pretrained("bert-base-german-dbmdz-uncased")
model = BertForSequenceClassification.from_pretrained("bert-base-german-dbmdz-uncased", num_labels=6)

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/63672169

复制

相似问题

问用于德国新闻分类的HuggingFace转换器模型
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用于德国新闻分类的HuggingFace转换器模型EN