首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >TextBlob和NLTK词性标注准确率

TextBlob和NLTK词性标注准确率
EN

Stack Overflow用户
提问于 2019-03-25 02:19:12
回答 1查看 230关注 0票数 0

到目前为止,我有下面的代码

代码语言:javascript
复制
from textblob import TextBlob
class BrinBot:

    def __init__(self, message): #Accepts the message from the user as the argument
        parse(message)

class parse:
    def __init__(self, message):
        self.message = message
        blob = TextBlob(self.message)
        print(blob.tags)

BrinBot("Handsome Bob's dog is a beautiful Chihuahua")

这是输出:

代码语言:javascript
复制
[('Handsome', 'NNP'), ('Bob', 'NNP'), ("'s", 'POS'), ('dog', 'NN'), ('is', 'VBZ'), ('a', 'DT'), ('beautiful', 'JJ'), ('Chihuahua', 'NNP')]

我的问题是,显然TextBlob认为“帅”是一个单数专有名词,这是不正确的,因为“帅”应该是一个形容词。有没有办法解决这个问题,我也在NLTK上尝试过,但也得到了同样的结果。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-03-26 02:05:59

之所以会发生这种情况,是因为causing的大写导致它被视为Bob名字的一部分。这不一定是一个不正确的分析,但如果你想强制进行形容词分析,你可以去掉下面的text2和text4中的“below”的大写。

代码语言:javascript
复制
text = "Handsome Bob's dog is a beautiful chihuahua"

BrinBot(text)
[('Handsome', 'NNP'), ('Bob', 'NNP'), ("'s", 'POS'), ('dog', 'NN'), ('is', 'VBZ'), ('a', 'DT'), ('beautiful', 'JJ'), ('Chihuahua', 'NNP')]

text2 = "handsome bob's dog is a beautiful chihuahua"

BrinBot(text2)
[('handsome', 'JJ'), ('bob', 'NN'), ("'s", 'POS'), ('dog', 'NN'), ('is', 'VBZ'), ('a', 'DT'), ('beautiful', 'JJ'), ('chihuahua', 'NN')]

text3 = "That beautiful chihuahua is handsome Bob's dog"

BrinBot(text3)
[('That', 'DT'), ('beautiful', 'JJ'), ('chihuahua', 'NN'), ('is', 'VBZ'), ('handsome', 'JJ'), ('Bob', 'NNP'), ("'s", 'POS'), ('dog', 'NN')]

text4 = "That beautiful chihuahua is Handsome Bob's dog"

BrinBot(text4)
[('That', 'DT'), ('beautiful', 'JJ'), ('chihuahua', 'NN'), ('is', 'VBZ'), ('Handsome', 'NNP'), ('Bob', 'NNP'), ("'s", 'POS'), ('dog', 'NN')]
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55326993

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档