首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从英文文本到UTF-8的文件编码

从英文文本到UTF-8的文件编码
EN

Stack Overflow用户
提问于 2012-05-01 15:20:15
回答 4查看 2.2K关注 0票数 1

如何在Python中将带有CRLF行终止符的非ISO extended-ASCII英文文本转换为utf-8

EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2013-12-05 22:31:42

扩展Jishiyu的答案,您可以使用uchardet来标识字符集。例如

代码语言:javascript
复制
iconv -f `uchardet a_strange_file.txt` -t UTF-8 -o the_output_file.txt a_strange_file.txt

尽管这在python中做不到这项工作。

票数 1
EN

Stack Overflow用户

发布于 2012-05-01 15:26:47

我认为linux命令unix2dos、do2unix、iconv会有所帮助。

就像这样

图标-f拉丁语-1 -t UTF-8 latin.txt >utf8.txt

票数 0
EN

Stack Overflow用户

发布于 2012-05-01 16:23:54

如果您获得了输入文件的原始字节流,则可以将其decodeutf-8。请参阅this blog post中的一些Python3示例。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/10394723

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档