首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何利用POS标签作为NaiveBayesClassifier的有用特性进行情感分析?

如何利用POS标签作为NaiveBayesClassifier的有用特性进行情感分析?
EN

Data Science用户
提问于 2020-07-23 03:48:20
回答 1查看 1.7K关注 0票数 0

我正在推特数据集(问题链接)上做情绪分析。我从tweet中提取了POS标签,并从POS标签中创建了tfidf载体,并将它们作为一个特征(准确率为65%)。但是我认为,我们可以用POS标签实现更多的目标,因为它们有助于区分一个词是如何在短语范围内使用的。我正在培训的模型是MultnomialNB()。

我想要解决的问题是找出像积极、消极或中立这样的推文的情绪。

数据集的

结构:

创建pos标记:

我从tweet中创建了tfidf向量,并将输入提供给我的模型:

代码语言:javascript
复制
tfidf_vectorizer1 = TfidfVectorizer(
    max_features=5000, min_df=2, max_df=0.9, ngram_range=(1,2))
train_pos = tfidf_vectorizer1.fit_transform(train_data['pos'])
test_pos = tfidf_vectorizer1.transform(test_data['pos'])

clf = MultinomialNB(alpha=0.1).fit(train_pos, train_labels)
predicted = clf.predict(test_pos)

用上面的代码,我得到了65%的准确性。而不是建立TF-以色列国防军矢量的POS,并使用它们作为模态输入。我想知道还有其他方法可以使用POS标签来提高模型的准确性吗?

EN

回答 1

Data Science用户

发布于 2020-07-26 15:04:00

你有很多方法可以做这件事。首先,您可以使用条件随机场(CRF)。在Python中有一个很好的实现。在其中,您可以设置POS功能等。有一个网站,从同一来源,您张贴了如何使用CRF为您的目的(我还没有彻底阅读)。空间性是获取所有您需要的特性的另一个很好的资源。尽管如此,对于SOTA来说,您将需要一些NN实现

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/78161

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档