首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >熊猫UnicodeEncodeError:“charmap”编解码器不能编码字符

熊猫UnicodeEncodeError:“charmap”编解码器不能编码字符
EN

Stack Overflow用户
提问于 2018-11-14 19:20:39
回答 2查看 4.5K关注 0票数 2

与熊猫合作,每次出现“特殊”字符(比如:é),都会引发编码错误。这是我的密码:

代码语言:javascript
复制
import pandas as pd


df = pd.read_csv(r'movies analysis\movie_metadata.csv',encoding='utf-8')
print(df.loc[df['title_year'] == 2015])

这就是我所犯的错误:

代码语言:javascript
复制
 File "D:\ANACONDA\lib\encodings\cp1255.py", line 19, in encode
    return codecs.charmap_encode(input,self.errors,encoding_table)[0]
UnicodeEncodeError: 'charmap' codec can't encode character '\xe9' in position 645: character maps to <undefined>

在这个问题上有很多线索,但没有一个能为我提供有效的解决方案。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-11-16 10:16:48

我最后所做的就是把所有的角色都“正常化”为ascii。虽然不太理想,但对我来说很管用:

代码语言:javascript
复制
import unicodedata
unicodedata.normalize('NFD', Data_U_Want_To_Normalize).encode('ascii', 'ignore')

因此,在像é这样的字母的情况下,它会被转化为e

票数 1
EN

Stack Overflow用户

发布于 2021-07-29 09:59:02

export LANG=zh_CN.utf8export LANG=us_EN添加到bashrc或shell脚本中,我的脚本是:

代码语言:javascript
复制
import pandas as pd
pd.read_excel(f) 
# there are chinese in my file
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53307384

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档