首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Maxent POS标签表

Maxent POS标签表
EN

Stack Overflow用户
提问于 2011-11-18 07:13:42
回答 2查看 770关注 0票数 2

我使用maxent part of speech tagger对词性标记使用nltk.pos_tag。我需要一张所有可用标签的表格。

我的最终目标是从文本中仅提取副词和形容词。

任何帮助都是非常感谢的。

谢谢

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2011-11-18 07:28:51

根据其文档字符串,pos_tag使用“NLTK当前推荐的词性标签器”,因此该建议的有效期可能会过期。对于可重现的结果,请使用显式的POS标记器对象。

查看source code for pos_tag,我们可以看到它调用

代码语言:javascript
复制
>>> nltk.data.load('taggers/maxent_treebank_pos_tagger/english.pickle')

从中我们可以获得POS标签的列表,其中包含

代码语言:javascript
复制
>>> _.classifier().labels()
['PRP$', 'VBG', 'VBD', '``', 'VBN', 'POS', "''", 'VBP', 'WDT', 'JJ', 'WP', 'VBZ',
 'DT', '#', 'RP', '$', 'NN', 'FW', ',', '.', 'TO', 'PRP', 'RB', '-LRB-', ':',
 'NNS', 'NNP', 'VB', 'WRB', 'CC', 'LS', 'PDT', 'RBS', 'RBR', 'CD', '-NONE-',
 'EX', 'IN', 'WP$', 'MD', 'NNPS', '-RRB-', 'JJS', 'JJR', 'SYM', 'UH']

(我必须承认,这是我通过对象检查和反复试验发现的。)

形容词和副词至少是JJ (adj)和RB (adv)这两个类别,再加上VBN (过去分词,例如“JJ”)。

票数 4
EN

Stack Overflow用户

发布于 2014-02-11 01:47:27

尝试:

代码语言:javascript
复制
import nltk
nltk.help.upenn_tagset()
# and
nltk.help.brown_tagset()
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8175726

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档