首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在python中将非"utf-8“特征文件中的字符转换为英文等价物

在python中将非"utf-8“特征文件中的字符转换为英文等价物
EN

Stack Overflow用户
提问于 2016-01-14 12:45:26
回答 1查看 53关注 0票数 0

我的档案里有这样一行:

代码语言:javascript
复制
M  Aad                                  4                                             $
M  Aadam                                          1                                   $
F  Aadje                                1                                             $
M  Ådne                      +                 1                                      $

当我运行以下代码时;

代码语言:javascript
复制
#!/usr/bin/python
# -*- coding: utf-8 -*-

import csv, unicodedata, urllib
from unidecode import unidecode
from textblob import TextBlob

with open('names.csv', 'rb') as f:
    reader = csv.reader(f)
    my_list = list(reader)

for a in range(len(my_list)):
        name = my_list[a][0]
        name = unicode(name,'ISO-8859-15')
        print name

我在一些线路上得到了这样的输出:

代码语言:javascript
复制
F  <Z^>ydr<edeg>                                      1                                 $

对于这种情况,堆栈溢出有许多类似的问题,但是它们的解决方案不适合我的问题。

我怎样才能解决这个问题?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-01-14 12:53:09

听起来你的输入不是实际的UTF-8,它似乎是ISO-8859-* (可能是ISO-8859-15或ISO-8859-1),0xC5是to的ISO编码( UTF-8编码应该是0xC3 0xA5)。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34789984

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档