我正在使用CoreNLP (斯坦福)和Java从tweet中提取提到的位置。我可以提取像“雪利街亚瑟港TX”这样的信息。但是,我无法提取街道号码或邮政编码。在这种情况下,它应该是"2333雪利街港口亚瑟TX“。
谢谢,
发布于 2017-11-28 14:17:58
您可以使用TokensRegexAnnotator编写规则来标识地址等模式。
这里有更多关于如何编写规则的详细文档:
https://nlp.stanford.edu/software/tokensregex.html
https://stackoverflow.com/questions/47443542
相似问题