首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >jTokenize(JapaneseTokenize)来自jNLP(日语自然语言处理)

jTokenize(JapaneseTokenize)来自jNLP(日语自然语言处理)
EN

Stack Overflow用户
提问于 2020-07-15 06:29:42
回答 1查看 95关注 0票数 0

我试图用jTokenize标记一个日语句子

代码语言:javascript
复制
from jNlp.jTokenize import jTokenize
input_sentence = u'私は彼を5日前、つまりこの前の金曜日に駅で見かけた'
list_of_tokens = jTokenize(input_sentence)
print list_of_tokens
print '--'.join(list_of_tokens).encode('utf-8')

jTokenize.py中的print语句有语法错误

我使用python 3.7,它只支持打印函数" print ()“

这个来自jTokenize 0.1的jProcessing支持python2.6和更高版本

这个问题的解决办法是什么。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-07-15 08:29:34

这个来自jTokenize 0.1的jProcessing支持python2.6和更高版本--请注意,这个库代码(日本NLP实用程序jProcessing 0.1)现在已经将近10年了,此后(几乎)没有更新过(参见GitHub上的项目)。

因此,库代码还没有对Python3进行现代化,因此只能在最新的Python2版本上运行。

意思是,即使在示例代码中将print (Python2)更改为print(...) (Python3)

代码语言:javascript
复制
from jNlp.jTokenize import jTokenize
input_sentence = u'私は彼を5日前、つまりこの前の金曜日に駅で見かけた'
list_of_tokens = jTokenize(input_sentence)
print(list_of_tokens)
print('--'.join(list_of_tokens).encode('utf-8'))

使用Python3解释器运行它,您将从使用的库代码本身获得Python 3不兼容错误。

因此,您有几种选择:

  • 将jProcessing 0.1从Python2迁移到Python3 (Python 2和3的差异,也请参阅现有的GitHub问题),然后与Python3解释器一起使用
  • 按原样使用jProcessing 0.1,但将项目降级为Python2(这不是个好主意)
  • 查找另一个用于日语自然语言处理的Python库
  • ..。麻烦维护人员迁移他们的Python3库代码(参见现有的GitHub问题)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62908826

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档