腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
如何使用AWS数据管道、弹性MapReduce和Redshift来执行
ETL
和数据仓库?
我们必须介绍如何使用以下三种技术来执行数据仓库:我到目前为止的理解是: activities.AWS数据管道是一个数据仓库
平台
,您可以在这个
平台
上存储数据以执行分析和商业智能,数据管道可以用来
调度
任务和操作。您是否会使用数据管道来
调度
map中的
ETL
过程,然后将数据传输到RedShift?如果是的话,你怎么能做到呢?
浏览 15
提问于2022-10-16
得票数 0
4
回答
支持自动
调度
的Java开源
ETL
框架
有没有支持自动作业
调度
的Java
ETL
框架?谢谢和问候,Gopal
浏览 7
修改于2012-02-01
得票数 3
回答已采纳
1
回答
调度
程序不尊重Apache气流队列参数
我试图控制一个任务在哪个气流工作者上执行,但是DAG定义中的队列参数没有被
调度
程序捕获。我在subdag操作符中定义了一个队列: subdag = build_xdata_
etl
_dag(dag, 'xdata_run_
etl
'), dag = dag, trigger_r
浏览 2
提问于2020-04-03
得票数 1
1
回答
是企业内部
ETL
项目的完全开放源码吗?
我们正在考虑利用Talend作为开源
ETL
平台
。我们目前主要是为
ETL
使用SSIS。我们希望通过使用来节省许可成本。是的企业版吗?如果我们把作为完整的
ETL
平台
,我们将面临哪些缺点?
浏览 0
提问于2022-03-01
得票数 0
回答已采纳
1
回答
用于微服务的气流结构
我目前的
平台
架构有一个用于下载/收集数据的微服务、一个用于
ETL
的微服务和另一个处理一些复杂SQL脚本的微服务。我想问:,使用微服务的气流最好的方法是什么?我是否应该使用DAG中的任务与微服务进行通信(发布消息和微服务将订阅)? DAG可以描述如下。
浏览 4
修改于2020-04-27
得票数 5
1
回答
Camunda作为数据管道/
ETL
的
调度
器和
调度
器
我想知道是否有人将Camunda作为数据管道/
ETL
的
调度
器和
调度
器,并且可以分享他的经验。谢谢!
浏览 10
提问于2022-05-12
得票数 0
回答已采纳
1
回答
选择合适的工具替换IBM DataStage
ETL
工具
我们正在寻找现有DataStage
平台
的替代品。它有大约1500多个映射/数据存储作业在前提下。这些映射还具有一些复杂的转换和映射。它是一个完整的
ETL
架构的前提.如果需要用microsoft
平台
(SSIS或Azure数据工厂)替换(数据),那么可以使用SSIS工具替换哪些选项。备选方案: 如果选择SSIS工具,则需要将所有数据存储凭证(带有
ETL
转换)重写到SSIS,然后SSIS可以通过Azure数据工厂运行。可以重写Azure数据工厂中的所有
ETL
数据传输作业/脚本,如果推荐使用它
浏览 2
修改于2020-02-10
得票数 1
1
回答
我可以使用GCP中的bigQuery命令行工具来完成
ETL
工作吗?
我想问你一个关于Google
平台
的bigQuery的问题。
ETL
指的是提取、转换和加载。Cookie: 'test_cookie'hour : 00} 即将以这种方式执行数据
ETL
我发布了一个问题,因为很难找到任何与Google
平台
文档相关的内容。
浏览 1
提问于2020-10-26
得票数 0
回答已采纳
1
回答
ETL
选择,构建一个直接处理SQL查询引擎(impala)或本机数据库的
ETL
?
我正在尝试构建一个
ETL
,它将源表映射到一个维度的星型模式模型。构建一个直接使用Python ()处理kudu表的
ETL
。或 B-或在黑斑羚中创建UDF(等效于SQL中的存储过程),执行插入/联接等操作,将源表映射到星型模式模型,并使用Nifi或任何
调度
程序(如气流等)对其进行
调度
。
浏览 10
提问于2021-04-16
得票数 0
回答已采纳
1
回答
可以在服务器上部署使用xlwing的Python脚本吗?
如何将其作为一个
ETL
部署在云服务器上,该
ETL
将链接到作业
调度
程序,从而不再需要人工操作? 我担心的是,Xlwing需要Excel许可证(和GUI?),这在生产服务器中通常是不可用的。
浏览 5
修改于2022-05-27
得票数 5
回答已采纳
2
回答
DataWarehouse测试自动化
在大型数据仓库环境中,自动化测试存储过程(在
ETL
过程中由
调度
器按顺序运行)的最佳方法是什么?有哪些工具可用?
浏览 3
修改于2016-01-28
得票数 0
1
回答
是什么让Apache Pig成为
ETL
工具?
如果有人能给我解释一下是什么让Apache Pig成为
ETL
工具,以及它的反面是什么,我会很高兴。我知道
ETL
意味着提取、转换和加载数据,Pig就是这么做的,但其他
平台
也是如此,比如Flink,Spark和R(你获取数据,执行一些操作,然后加载到其他地方),我找不到任何信息说这些工具也被认为是
ETL
也许我没有完全理解
ETL
是什么意思?谢谢。
浏览 2
提问于2015-03-11
得票数 0
1
回答
一种每天分析和计算Oracle海量数据的方法
我计划写这作为一个多线程的Java程序,这将作为一个作业,每天午夜运行的
调度
;该程序将从各种事务日志表与其他表从数据库中提取数据,计算和存储回一个单独的表的结果。GUI (仪表板)
平台
将通过单独的The服务请求这些信息,该the服务已经存在,用于提供各种其他详细信息。项目中几乎所有的模块都使用Spring框架,所以我想使用具有
调度
功能的Spring-Batch。在开始设计之前,我开始了一些研究,我发现使用了各种其他技术,例如
ETL
工具、数据库本身中的
调度
、实时数据分析和其他类似的技术。 我是不是已经解决了
浏览 1
修改于2015-07-21
得票数 0
2
回答
Windows任务计划程序立即结束
我想把这个可执行文件放在Windows任务
调度
程序上。专用 用launch4j构建的Java可执行文件。带有schtasks /create /tn MyETL /sc hourly /mo 3 /tr C:\
ETL
\
etl
.exe的
调度
器集
浏览 1
修改于2017-08-19
得票数 0
回答已采纳
1
回答
运行Hadoop MapReduce作业/Hive脚本/Pig脚本等的最佳实践
我想了解像Hadoop MapReduce作业/火花作业/Hive脚本/Pig脚本这样的
ETL
作业通常是如何部署在on premises生产/开发环境中的。它们是否总是使用像Apache气流或Apache这样的
调度
器来部署和运行? 我假设这些作业几乎从不独立运行,而且总是使用
调度
程序运行,即使它是一个简单的
调度
bash脚本。这个准确吗?
浏览 0
提问于2021-10-29
得票数 1
2
回答
如何使用环境变量来使用ap
调度
器设置cron类计划?
我用Python编写了一个
ETL
作业。今天我使用ap
调度
器。我的密码里有这样的东西: sched.add_job(
etl
_job,'interval',minutes=7)现在有人知道要解决这个问题了吗
浏览 4
提问于2020-09-29
得票数 0
回答已采纳
2
回答
云数据流作业的
调度
此工作处理
ETL
从PostgreSQL到BigQuery。所以,我不知道用气流来做
调度
。如何利用气流来共享作业数据流? 谢谢
浏览 17
提问于2022-12-02
得票数 0
1
回答
最优
ETL
工艺与
平台
我面临以下问题,我是云计算和数据库的新手。我想为应用程序设置一个简单的仪表板。基本上,我想复制这个显示空气污染数据的网站。从API下载数据:和我想到了这个链接,特别是" --每个传感器最后一个小时的所有测量值的平均值“。(技术: Python )设置了一个机器人来转换数据,以适应我们的需要。(技术:Python)将数据上传到数据库。(技术: Google或AWS)将数据库连接到可视化工具上,这样每个人都可以在我们的网页上看到它。(技术:可能在Python中飞奔) 我的问题如下。1.你同意我的想法吗?还是你会改变一些元素来提高效率? 2.你认为运行python
浏览 3
提问于2020-05-15
得票数 0
回答已采纳
3
回答
关于Azure
平台
托管数据仓库的建议
我是一个数据仓库开发人员,目前正在研究如何使用Azure
平台
来托管一个新的数据仓库。如何在Azure中复制这种设置?
浏览 8
提问于2020-05-13
得票数 1
回答已采纳
2
回答
ETL
体系结构
我被要求制作一个
ETL
风格的应用程序,将信息从一个数据源传输到另一个数据源。目前,我已经决定使用三层体系结构,但我想了解更多关于最佳实践以及这个wikipedia页面描述的生命周期的信息: Functional层:核心功能的
ETL
处理(提取、转换和load).Operational管理层:作业流定义和管理、参数、
调度
、监视、通信和alerting.Audit,平衡和控制层:作业执行统计、平衡和控制、拒绝和错误处理、代码management.Utility真实
ETL
循环 典型
浏览 2
修改于2018-04-07
得票数 2
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券