我的项目是在阿拉伯语中识别积极或消极的情绪(情绪分析),为了完成这项任务,我使用了NLTK和python,当我用阿拉伯语输入推文时出现错误
>>> pos_tweets = [(' أساند كل عون أمن شريف', 'positive'),
('ما أحلى الثورة التونسية', 'positive'),
('أجمل طفل في العالم', 'positive'),
('الشعب يحرس', 'positive'),
('ثورة شعبنا هي ثورة الكـــرامة وثـــورة الأحــــرار', 'positive')]
Unsupported characters in input我该如何解决这个问题?
发布于 2013-03-05 01:20:46
您的问题来自于空闲的shell。AFAIK IDLE不接受交互模式下的UTF-8输入。
我建议您使用替代的(更好的)shell,如DreamPie或PythonWin。
发布于 2013-03-05 11:08:14
在我的python代码中输入UTF-8时,我通常会使用一个简单的技巧。我不知道它为什么工作,但它接受unicode字符串,并在我添加以下行后流畅地运行脚本:
#! /usr/local/bin/python -*- coding: UTF-8 -*-
pos_tweets = [(u' أساند كل عون أمن شريف', 'positive'),
(u'ما أحلى الثورة التونسية', 'positive'),
(u'أجمل طفل في العالم', 'positive'),
(u'الشعب يحرس', 'positive'),
(u'ثورة شعبنا هي ثورة الكـــرامة وثـــورة الأحــــرار', 'positive')]
for i in pos_tweets:
print i[0], i[1]https://stackoverflow.com/questions/15196321
复制相似问题