文章/答案/技术大牛

发布

社区首页 >问答首页 >在python中将非"utf-8“特征文件中的字符转换为英文等价物

问在python中将非"utf-8“特征文件中的字符转换为英文等价物
EN

Stack Overflow用户

提问于 2016-01-14 12:45:26

回答 1查看 53关注 0票数 0

我的档案里有这样一行：

M  Aad                                  4                                             $
M  Aadam                                          1                                   $
F  Aadje                                1                                             $
M  Ådne                      +                 1                                      $

当我运行以下代码时；

#!/usr/bin/python
# -*- coding: utf-8 -*-

import csv, unicodedata, urllib
from unidecode import unidecode
from textblob import TextBlob

with open('names.csv', 'rb') as f:
    reader = csv.reader(f)
    my_list = list(reader)

for a in range(len(my_list)):
        name = my_list[a][0]
        name = unicode(name,'ISO-8859-15')
        print name

我在一些线路上得到了这样的输出：

F  <Z^>ydr<edeg>                                      1                                 $

对于这种情况，堆栈溢出有许多类似的问题，但是它们的解决方案不适合我的问题。

我怎样才能解决这个问题？

python

encoding

iso-8859-15

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-01-14 12:53:09

听起来你的输入不是实际的UTF-8，它似乎是ISO-8859-* (可能是ISO-8859-15或ISO-8859-1)，0xC5是to的ISO编码( UTF-8编码应该是0xC3 0xA5)。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/34789984

复制

相似问题

问在python中将非"utf-8“特征文件中的字符转换为英文等价物
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在python中将非"utf-8“特征文件中的字符转换为英文等价物EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在python中将非"utf-8“特征文件中的字符转换为英文等价物
EN