首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何快速启动apache drill并在csv文件上执行查询?

如何快速启动apache drill并在csv文件上执行查询?
EN

Stack Overflow用户
提问于 2015-08-23 16:48:03
回答 1查看 1.1K关注 0票数 1

我已经设法在ubuntu 14.04无头虚拟机上安装了apache drill。

我已经放置了一个要对其执行查询的csv文件。

我读了教程,但当我只是想快速入门时,这些教程对我来说都没有意义。

请给我建议。

EN

回答 1

Stack Overflow用户

发布于 2015-08-24 06:23:42

如果您的CSV has没有标题行,请按如下方式查询文件:

代码语言:javascript
复制
select * from dfs.`/Users/khahn/drill/apache-drill-1.1.0/csv_no_header.csv`;
+------------------------+
|        columns         |
+------------------------+
| ["hello","1","2","3"]  |
| ["hello","1","2","3"]  |
| ["hello","1","2","3"]  |
| ["hello","1","2","3"]  |
| ["hello","1","2","3"]  |
| ["hello","1","2","3"]  |
| ["hello","1","2","3"]  |
+------------------------+
7 rows selected (1.427 seconds)

如果您的csv确实有标题行,则需要在存储插件(本例中为dfs)定义中添加skipFirstLine属性:

代码语言:javascript
复制
"csv": {
  "type": "text",
  "extensions": [
    "csv"
  ],
  "skipFirstLine": true,
  "delimiter": ","
},

Apache Drill docs中描述了通过REST更新存储插件。

带有标题行的CSV:

代码语言:javascript
复制
name, num1, num2,num3
hello,1,2,3
hello,1,2,3
hello,1,2,3
hello,1,2,3
hello,1,2,3
hello,1,2,3
hello,1,2,3

用于选择全部的查询将与没有报头的CSV的查询相同。输出也将是相同的。

要查询单个列,请使用use the COLUMNS[n] syntax

根据您的CSV文件内容,可能需要进行其他存储插件配置更改。参见Configuring Drill to Read Text Files

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32164814

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档