文章/答案/技术大牛

发布

社区首页 >问答首页 >如何利用POS标签作为NaiveBayesClassifier的有用特性进行情感分析？

问如何利用POS标签作为NaiveBayesClassifier的有用特性进行情感分析？
EN

Data Science用户

提问于 2020-07-23 03:48:20

回答 1查看 1.7K关注 0票数 0

我正在推特数据集(问题链接)上做情绪分析。我从tweet中提取了POS标签，并从POS标签中创建了tfidf载体，并将它们作为一个特征(准确率为65%)。但是我认为，我们可以用POS标签实现更多的目标，因为它们有助于区分一个词是如何在短语范围内使用的。我正在培训的模型是MultnomialNB()。

我想要解决的问题是找出像积极、消极或中立这样的推文的情绪。

数据集的

结构：

创建pos标记：

我从tweet中创建了tfidf向量，并将输入提供给我的模型：

tfidf_vectorizer1 = TfidfVectorizer(
    max_features=5000, min_df=2, max_df=0.9, ngram_range=(1,2))
train_pos = tfidf_vectorizer1.fit_transform(train_data['pos'])
test_pos = tfidf_vectorizer1.transform(test_data['pos'])

clf = MultinomialNB(alpha=0.1).fit(train_pos, train_labels)
predicted = clf.predict(test_pos)

用上面的代码，我得到了65%的准确性。而不是建立TF-以色列国防军矢量的POS，并使用它们作为模态输入。我想知道还有其他方法可以使用POS标签来提高模型的准确性吗？

naive-bayes-classifier

sentiment-analysis

machine-learning

nlp

回答 1

Data Science用户

发布于 2020-07-26 15:04:00

你有很多方法可以做这件事。首先，您可以使用条件随机场(CRF)。在Python中有一个很好的实现。在其中，您可以设置POS功能等。有一个网站，从同一来源，您张贴了如何使用CRF为您的目的(我还没有彻底阅读)。空间性是获取所有您需要的特性的另一个很好的资源。尽管如此，对于SOTA来说，您将需要一些NN实现。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/78161

复制

相似问题

问如何利用POS标签作为NaiveBayesClassifier的有用特性进行情感分析？
EN

结构：

创建pos标记：

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何利用POS标签作为NaiveBayesClassifier的有用特性进行情感分析？EN

结构：

创建pos标记：

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何利用POS标签作为NaiveBayesClassifier的有用特性进行情感分析？
EN