我有数据,这是unicode,并希望把它写到一个文件。我正在使用python2.6。我能够打印编码的值,但无法将其写入文件。环境的默认编码是UTF-8。也试过使用编解码器,但也没有运气。下面是我正在使用的一个示例代码片段。
#!/usr/bin/python
import sys
import codecs
import csv
sh = [u'T\xe9l\xe9vista S.A.', u'T\xe9l\xe9vista S.A.', 'Python']
print sys.stdout.encoding
f = codecs.open('listwrite.txt', 'w', encoding='latin-1')
for item in sh:
f.write(item)
f.close()
for i in sh:
print i.encode('latin-1')输出:
UTF-8
Télévista S.A.
Télévista S.A.
Python
Contents of listwrite.txt
Télévista S.A.Télévista S.A.Python如上文所示,文件是用UTF-8编码编写的,而不是拉丁文-1。如何更改它并重写文件的默认编码。
编辑: 2
此外,使用csv编写器给出了UnicodeEncodeError:'ascii‘编解码器不能在位置1中编码字符u’\xe9 9:序号不在范围(128个)。
代码如下:
#!/usr/bin/python
import sys
import codecs
import csv
sh = [u'T\xe9l\xe9vista S.A.', u'T\xe9l\xe9vista S.A.', 'Python']
print sys.stdout.encoding
c = csv.writer(codecs.open('listwrite.txt', 'w', encoding='latin-1'), quoting=csv.QUOTE_NONE)
c.writerow(sh)
f.close()
for i in sh:
print i.encode('latin-1')发布于 2012-11-15 18:41:53
我认为你从一个错误的角度来解决这个问题。在编写之前尝试对每一行进行编码:
import csv
sh = [u'T\xe9l\xe9vista S.A.', u'T\xe9l\xe9vista S.A.', 'Python']
f = open('listwrite.txt', 'wb') # binary mode
writer = csv.writer(f)
writer.writerow([item.encode('latin-1') for item in sh])
f.close()现在您有了一个正确的latin1 1编码文件:
$ cat listwrite.txt | iconv -f latin1
Télévista S.A.,Télévista S.A.,Python
$ file listwrite.txt
listwrite.txt: ISO-8859 text, with CRLF line terminatorshttps://stackoverflow.com/questions/13400636
复制相似问题