首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >SSIS在远程服务器(格林梅) Datalake上运行得很好,但需要花费8+时间

SSIS在远程服务器(格林梅) Datalake上运行得很好,但需要花费8+时间
EN

Stack Overflow用户
提问于 2022-06-25 08:56:50
回答 1查看 39关注 0票数 1

SSIS包在远程服务器(Greenplum )上执行ETL。它运行良好,但需要8+小时才能完成。远程服务器的交互表上的数据是巨大的(每一行约10亿行)。在SSIS上是否有一种方法或任何可供选择的方法,特别是针对海量数据?

远程服务器:数据湖(Greeplum) PS:由于公司策略,我无法安排对数据湖本身的查询。但是,如果手动在数据湖上运行相同的脚本,则大约需要1小时20分钟才能完成作业。

谢谢!

EN

回答 1

Stack Overflow用户

发布于 2022-06-27 01:11:55

SSIS如何执行ETL?它运行insert into .. values ...吗?如果是这样的话,由于insert开销很高,因此性能会很差。有几个参数可以帮助您(参考https://greenplum.org/oltp-workload-performance-improvement-in-greenplum-6/):

  • gp_enable_global_deadlock_detector
  • checkpoint_segments

然而,要做ETL的原因是通过gpload/gpfdist (或gps)。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72752535

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档