df_track = pd.read_csv(E:/my_python/project_2/tracks.csv)
df_tracks.head()这是我的代码,执行时我会出错
'utf-8‘编解码器无法解码位置201994的0字节:无效的连续字节
发布于 2022-03-10 08:26:56
此错误意味着您的文件不是UTF-8 (常见的默认编码)。也许它是一个混合编码文件。
正如您可以在文档:https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html中看到的那样,您有一个encoding参数来指定不同的编码,并且您有一个指向支持的编码列表的链接。试着用latin1。如果文件较旧,则应猜测编码(取决于国家、操作系统等)。
因此,尝试将, encoding='latin1'添加到read_csv()中。它不会失败(给你一个错误消息):这个编码器可以解码所有的字节序列。只是它可能会给出错误的字符,在这种情况下尝试其他编码(在上面的read_csv文档中的链接中列出),直到文本看起来到处都是正确的。
其他常见编码:cp1252 ( Windows中的西方语言常见)、mbcs (仅在Windows上工作,它是臭名昭著的Windows)、cp437 (旧IBM )、mac_roman (用于旧mac (西方语言))。
编辑:latin1在Python中似乎是一个更好的解决方案,并添加了一个常见编码列表。
https://stackoverflow.com/questions/71419895
复制相似问题