发布于 2020-09-01 15:06:26
当使用Wrangler进行转换时,GCS源的默认值是format: text和body: string (数据类型);但是,要正确地处理Wrangler中的Avro文件,您需要更改它,需要将格式设置为blob,体数据类型设置为bytes,如下所示:


在此之后,管道的预览应该生成输出记录。接下来您可以看到我的工作示例:
编辑:
您需要将format: blob和输出模式设置为body: bytes,如果您想在Wrangler中将该文件解析为Avro (如前所述),因为它需要二进制格式的文件内容。
另一方面,如果您只想应用过滤器(在Wrangler中),则可以执行以下操作:
format: avro,见img打开文件。name和string数据类型的见img。这样,您还可以获得所需的结果。
https://stackoverflow.com/questions/63669583
复制相似问题