首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Tableau有限的数据提取慢连接

Tableau有限的数据提取慢连接
EN

Stack Overflow用户
提问于 2016-10-04 14:32:43
回答 2查看 663关注 0票数 0

我在Tableau中设计可视化,我的数据在Hive/ hadoop中,数据非常庞大,

当我尝试设计可视化时,查询的运行速度非常非常慢,因为它每次尝试从hadoop中提取数据。

因此,对于任何可视化,简单的拖放通常需要4分钟,而可视化可能有10秒的拖放,所以我最终花费了大量的时间等待。我试着使用数据提取选项,但是数据提取花费了很长时间(38分钟,而且还在继续)

问:有没有办法我只能提取1000条记录,这样我就可以在这1000条记录上创建viz,然后在设计完成后切换到Live connection。我试着在tableau社区帮助中寻找,但到目前为止还没有成功。

EN

回答 2

Stack Overflow用户

发布于 2016-10-05 04:00:25

复制XL中的所有数据,并将我的Tableue与XL连接,并在几分钟内完成我的dahsboard,由于XL和hive具有完全相同的字段,我可以用Hive替换xl连接,它就能正常工作。它抱怨一些工作表上的计算字段,但我想我可以在hive上重做这一部分,并绕过它。

票数 1
EN

Stack Overflow用户

发布于 2016-10-04 19:22:50

一种选择是关闭自动更新,这样它就不会在您每次拖放时重新加载数据:

https://onlinehelp.tableau.com/current/pro/desktop/en-us/queries_autoupdates.html

您可以尝试的另一件事是以下内容。在Hive中,您可以创建一个只有1000行的较小版本的表。然后在表格上创建一个视图,并将Tableau指向该视图。根据视图设计您的Viz,然后在完成后在Hive中重新创建视图以指向真实的表。这可能会有帮助,但如果Hive试图在每次拖放时启动map reduce作业,它仍然会非常慢。

根据我使用Tableau的经验,您希望将数据集缩小到可以使用提取选项的大小。任何实时连接到Hive的交互式仪表板都将变得很慢。但是,如果您可以将数据集聚合到一个可管理的大小,如果您执行提取,它可以很好地工作。我不再使用Tableau,但在过去,我的提取需要30 - 60分钟来刷新,并加载低数百万行,它工作得很好。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39845574

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档