首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >大查询作业在遇到“坏字符(ASCII 0)”时会失败。

大查询作业在遇到“坏字符(ASCII 0)”时会失败。
EN

Stack Overflow用户
提问于 2012-06-13 19:02:26
回答 2查看 11.9K关注 0票数 4

我有一项工作因出错而失败。

行:14222274/字段:1,遇到不良字符(ASCII 0)。其余文件未处理。

数据被压缩,我已经验证文件中没有ASCII 0字符。文件中只有14222273行,因此错误消息中打印的行号是文件结束后的一行。我有来自相同数据集的其他块,它们已经成功上传,所以我怀疑这要么是bug错误,要么是错误消息并不表示潜在的问题。任何解决这个问题的帮助都将不胜感激。谢谢。

代码语言:javascript
复制
>>> data = open("data.csv").read()
>>> chr(0) in data
False
>>> data[-1]
'\n'
EN

回答 2

Stack Overflow用户

发布于 2012-06-14 23:38:20

当你压缩时你使用了什么实用程序?

当我以ZIP格式(在windows中)压缩csv文件时,我看到了这个问题。Google BigQuery似乎只接受gzip格式。

确保使用gzip压缩您的CSV。如果您在windows中,7-拉链是一个很好的实用程序,它允许您在gzip中进行压缩。

在Unix中,gzip是标准的。

票数 1
EN

Stack Overflow用户

发布于 2016-09-01 09:49:54

遇到坏字符(ASCII 0)。其余文件未处理.

显然,你有一个UTF-16字符,不能被解码。BigQuery服务只支持UTF-8和latin1文本编码。所以,文件应该是UTF-8编码的。

文件中只有14222273行,因此错误消息中打印的行号是文件结束后的一行。

可能您有一个UTF-16编码的标签字符在文件的末尾,它不能被解码。

解决方案:使用带有gzip命令的-a--ascii标志。它会被bigquery解码的。

票数 -1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11021610

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档