嗨,我试图分析大约30000个请求的描述,以确定常见的请求,因为数据没有标签或标题。
我已经看了很多关于情感分析的内容,我现在认为我需要从一个小的随机样本中训练一个模型来更好地分类数据。
有什么更好的方法吗?
发布于 2022-05-24 06:59:48
在回答你的问题之前,我想说的是,你正在寻找的是类似于情绪分析的解决方案,但情况却不同。如果您想对任何文档进行分组,您可以在AI中继续使用两个方法。
1-监督学习(分类)
2-无监督学习(聚类)
在您的情况下,由于没有标记(标记)数据,那么集群就更方便了。
您可以生成tf-国防军向量,并将其用作描述中的每个单词和文档的特性,并在此基础上对数据进行聚类。根据您使用的编码语言,web上有很多示例,但是对于java,您可以查看下面的链接,
https://stackoverflow.com/questions/72358154
复制相似问题