首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >熊猫进口csv - Probl.m单引号

熊猫进口csv - Probl.m单引号
EN

Stack Overflow用户
提问于 2015-05-05 21:32:32
回答 1查看 166关注 0票数 0

我正在尝试用pandas读取csv文件:

代码语言:javascript
复制
pd.read_csv(path, sep=";", quoting=3)

但我发现了一个错误:

代码语言:javascript
复制
CParserError: Error tokenizing data. C error: Expected 8 fields in line 442069, saw 9

如何将此文件读取到DataFrame中?

在第一个注释后编辑:查看正确的行:

代码语言:javascript
复制
$ more +442065 contacts.txt 
001-NM-001440;001-NM-368564;DIRECTEUR DE L'ETABLISSEMENT;DIRECTEUR DE L'ETABLISSEMENT;N;N;N;1
001-NPB-000649;001-NPB-440850; ;;N;N;N;0
001-NPB-000666;001-NPB-453937;DIRECTEUR DE L'ETABLISSEMENT;DIRECTEUR DE L'ETABLISSEMENT;N;N;N;0
001-NS-001217;001-CRM-469397;ASSISTANT(E);ASSISTANT(E);N;N;N;0
001-NS-001259;001-CRM-172012;ASSISTANT CHEF DE SECTEUR;;SECRETAIRE;N;N;N;0
001-MM-000288;001-MM-042968; ;;N;N;N;1
001-NYB-000005;286-INITOSM-33223; ;;N;N;N;0
001-NYB-000006;286-INITOSM-33230; ;;N;N;N;0
001-NYB-000011;001-NYB-312184;CONDUCTEUR DE TRAVAUX;CONDUCTEUR DE TRAVAUX;N;N;N;0
001-NYB-000011;001-NYB-1598768;CHEF DE CHANTIER;CHEF DE CHANTIER;N;N;N;0
001-NYB-000416;001-NYB-226960; ;;N;N;N;0
001-OLO-000171;286-INITOSM-33683;DIRECTEUR FINANCIER;DIRECTEUR FINANCIER;N;N;N;0
001-OLO-000192;001-OLO-033801;DIRECTEUR DE L'ETABLISSEMENT;DIRECTEUR DE L'ETABLISSEMENT;N;N;N;1
001-OLO-000259;286-INITOSM-33727;CONDUCTEUR DE TRAVAUX;CONDUCTEUR DE TRAVAUX;N;N;N;0
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-05-05 22:07:31

答:您的数据需要检查是否正确&一些检测+解决冲突案例的策略

当然,这不是一个容易的任务,但是Pandas在导入格式正确的正交数据方面没有问题。使您的输入进入可行状态(通过语法分析器或理智预包装可疑段为“.”)& pandas将它们加载到DataFrame.中

代码语言:javascript
复制
Expected: 8-fields
Present:  1.  001-NS-001259;
          2.  001-CRM-172012;
          3.  ASSISTANT CHEF DE SECTEUR;
          4.  ;
          5.  SECRETAIRE;
          6.  N;
          7.  N;
          8.  N;
          9.  0
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30063602

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档