我有几个有公制信息的大文件。我将这些文件链接到一个名册数据库,以便我知道员工在某个日期向谁报告(这允许我跟踪每个经理或每个站点的绩效,等等)。
我这样做的方式是创建一个RosterID字段,即EmployeeID+Date (例如: x112x20141022)。因此,如果我在仪表板上的一个工作表上过滤,它将过滤所有的工作表。
问:我是使用混合文件(目前大约有8个不同的数据源),一个左连接,还是我只是使用python/大熊猫字面上添加信息到原始数据源?我希望对最终用户来说,twbx文件要尽可能快。
(我的意思是将这些信息添加到原始数据中,实际上是添加了“经理”、“主任”、“地点”、“雇用日期”、“培训班”等列。这会略微增加文件的大小,但会加快Tableau的速度吗?)
发布于 2014-10-22 12:30:59
数据混合(在Tableau中创建不同数据源之间的关系)是最糟糕的解决方案。虽然它很容易使用,但效率很低,因为每次计算时,它实际上都会执行联接。
当连接到数据时,在Tableau上执行左联接(我假设您使用的是csv文件)是一个非常好的解决方案,就像使用Pandas中的信息创建一个表一样。对于最终用户来说,性能上不应该有任何差异(特别是当您将数据提取到Tableau中的tde时)。在这里,您需要测量是否更容易在python/大熊猫或Tableau提取工具中维护一个过程。我认为让Tableau来做连接要简单一些。但这是你的决定
https://stackoverflow.com/questions/26506131
复制相似问题