首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >‘’Utf 8‘编解码器无法解码字节0

‘’Utf 8‘编解码器无法解码字节0
EN

Stack Overflow用户
提问于 2022-03-10 06:49:14
回答 1查看 11.9K关注 0票数 2
代码语言:javascript
复制
df_track = pd.read_csv(E:/my_python/project_2/tracks.csv)
df_tracks.head()

这是我的代码,执行时我会出错

'utf-8‘编解码器无法解码位置201994的0字节:无效的连续字节

EN

回答 1

Stack Overflow用户

发布于 2022-03-10 08:26:56

此错误意味着您的文件不是UTF-8 (常见的默认编码)。也许它是一个混合编码文件。

正如您可以在文档:https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html中看到的那样,您有一个encoding参数来指定不同的编码,并且您有一个指向支持的编码列表的链接。试着用latin1。如果文件较旧,则应猜测编码(取决于国家、操作系统等)。

因此,尝试将, encoding='latin1'添加到read_csv()中。它不会失败(给你一个错误消息):这个编码器可以解码所有的字节序列。只是它可能会给出错误的字符,在这种情况下尝试其他编码(在上面的read_csv文档中的链接中列出),直到文本看起来到处都是正确的。

其他常见编码:cp1252 ( Windows中的西方语言常见)、mbcs (仅在Windows上工作,它是臭名昭著的Windows)、cp437 (旧IBM )、mac_roman (用于旧mac (西方语言))。

编辑:latin1在Python中似乎是一个更好的解决方案,并添加了一个常见编码列表。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71419895

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档