如何在Python中将带有CRLF行终止符的非ISO extended-ASCII英文文本转换为utf-8
发布于 2013-12-05 22:31:42
扩展Jishiyu的答案,您可以使用uchardet来标识字符集。例如
iconv -f `uchardet a_strange_file.txt` -t UTF-8 -o the_output_file.txt a_strange_file.txt尽管这在python中做不到这项工作。
发布于 2012-05-01 15:26:47
我认为linux命令unix2dos、do2unix、iconv会有所帮助。
就像这样
图标-f拉丁语-1 -t UTF-8 latin.txt >utf8.txt
发布于 2012-05-01 16:23:54
如果您获得了输入文件的原始字节流,则可以将其decode到utf-8。请参阅this blog post中的一些Python3示例。

https://stackoverflow.com/questions/10394723
复制相似问题