我正在尝试用pandas读取csv文件:
pd.read_csv(path, sep=";", quoting=3)但我发现了一个错误:
CParserError: Error tokenizing data. C error: Expected 8 fields in line 442069, saw 9如何将此文件读取到DataFrame中?
在第一个注释后编辑:查看正确的行:
$ more +442065 contacts.txt
001-NM-001440;001-NM-368564;DIRECTEUR DE L'ETABLISSEMENT;DIRECTEUR DE L'ETABLISSEMENT;N;N;N;1
001-NPB-000649;001-NPB-440850; ;;N;N;N;0
001-NPB-000666;001-NPB-453937;DIRECTEUR DE L'ETABLISSEMENT;DIRECTEUR DE L'ETABLISSEMENT;N;N;N;0
001-NS-001217;001-CRM-469397;ASSISTANT(E);ASSISTANT(E);N;N;N;0
001-NS-001259;001-CRM-172012;ASSISTANT CHEF DE SECTEUR;;SECRETAIRE;N;N;N;0
001-MM-000288;001-MM-042968; ;;N;N;N;1
001-NYB-000005;286-INITOSM-33223; ;;N;N;N;0
001-NYB-000006;286-INITOSM-33230; ;;N;N;N;0
001-NYB-000011;001-NYB-312184;CONDUCTEUR DE TRAVAUX;CONDUCTEUR DE TRAVAUX;N;N;N;0
001-NYB-000011;001-NYB-1598768;CHEF DE CHANTIER;CHEF DE CHANTIER;N;N;N;0
001-NYB-000416;001-NYB-226960; ;;N;N;N;0
001-OLO-000171;286-INITOSM-33683;DIRECTEUR FINANCIER;DIRECTEUR FINANCIER;N;N;N;0
001-OLO-000192;001-OLO-033801;DIRECTEUR DE L'ETABLISSEMENT;DIRECTEUR DE L'ETABLISSEMENT;N;N;N;1
001-OLO-000259;286-INITOSM-33727;CONDUCTEUR DE TRAVAUX;CONDUCTEUR DE TRAVAUX;N;N;N;0发布于 2015-05-05 22:07:31
答:您的数据需要检查是否正确&一些检测+解决冲突案例的策略
当然,这不是一个容易的任务,但是Pandas在导入格式正确的正交数据方面没有问题。使您的输入进入可行状态(通过语法分析器或理智预包装可疑段为“.”)& pandas将它们加载到DataFrame.中
Expected: 8-fields
Present: 1. 001-NS-001259;
2. 001-CRM-172012;
3. ASSISTANT CHEF DE SECTEUR;
4. ;
5. SECRETAIRE;
6. N;
7. N;
8. N;
9. 0https://stackoverflow.com/questions/30063602
复制相似问题