首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用钻取从Parquet中选择二进制数据

使用钻取从Parquet中选择二进制数据
EN

Stack Overflow用户
提问于 2018-10-02 00:58:26
回答 1查看 367关注 0票数 0

我有一个拼图数据集,其中保存了一个byte_array。

我正在使用Apache Drill查询数据集:

代码语言:javascript
复制
SELECT id, x, y FROM `dfs.root`.`./data`

这给了我:

代码语言:javascript
复制
+--------------------------------------+-------------+-------------+
|                  ID                  |      X      |      Y      |
+--------------------------------------+-------------+-------------+
| 0A3D27D8-DEC5-54D6-6A8E-8FD5CF721E1C | [B@654e7f63 | [B@39a668e8 |
+--------------------------------------+-------------+-------------+

如何在使用PyDrill查询时将binary object ID转换为实际的Python byte_array?

EN

回答 1

Stack Overflow用户

发布于 2018-10-02 18:38:58

代码语言:javascript
复制
SELECT id, CONVERT_FROM(x, 'UTF8') as x, CONVERT_FROM(y, 'UTF8') as y FROM `dfs.root`.`./data`

您可以在Apache Drill文档中找到此信息:

https://drill.apache.org/docs/data-type-conversion/#convert_to-and-convert_from

我想你指的是fixed_len_byte_array。它是一个原始的拼图数据类型。它可用于INTERVALDECIMAL逻辑数据类型。看起来Drill支持开箱即用的这两种方式。如果您没有为fixed_len_byte_array指定逻辑数据类型,那么就不清楚如何解释此数据。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52595623

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档