首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏深度学习与python

    近百个大数据开源项目,你该如何选型?|《开源大数据热力报告2022》入围项目公示

    数据初筛 项目初筛 Github 上 Topic Tag 满足如下条件且开源的大数据项目:Topic Tag:big-data、etl、data-ingestion、data-collection、data-pipeline 开源大数据项目,有明确的开源协议、完善的文档;半年内发布过新版本 2、Github 上带有如下 Topic Tag 之一:big-data、etl、data-ingestion、data-collection、data-pipeline

    69730编辑于 2023-03-29
  • 来自专栏Flink实战应用指南

    Flink Forward 2019--实战相关(9)--Yelp公司分享CEP应用

    sessions was always a day late and as an added bonus it also meant integrating with our state-of-the-art data-pipeline

    73300发布于 2019-07-11
  • Hermes Agent 社区生态盘点:2026年最值得关注的10个第三方技能包

    10.data-pipeline(数据管道)展开代码语言:BashAI代码解释hermesskillsinstallcommunity/data-pipeline功能:数据采集、ETL流程、CSV/JSON

    35910编辑于 2026-04-16
  • 来自专栏运维小路

    OpenClaw(小龙虾)-技能(skills)是什么及如何部署

    如每天 9 点爬取数据) condition-checker:条件判断,根据任务结果执行不同分支(如 “成功则发消息,失败则重试”) loop-handler:循环执行,重复调用指定技能直到满足条件 data-pipeline

    2.9K73编辑于 2026-04-02
  • 来自专栏DevOps持续集成

    Introduction to Apache Airflow-Airflow简介

    Apache airflow is a workflow (data-pipeline) management system developed by Airbnb.

    3.6K10编辑于 2022-12-29
  • 来自专栏HUMAN3.0

    当特征成为技术债:一次线上事故引发的思考

    我在代码仓库里搜索关键词 user_7d_click_rate,找到了 3 个相关提交: model-training 仓库:模型训练时使用这个特征 feature-service 仓库:特征服务读取这个特征 data-pipeline

    12010编辑于 2026-02-27
  • HBase高级特性与生态整合:深度解析BulkLoad、Spark SQL及数据优化策略

    Map( "spark.kubernetes.container.image" -> "hbase-spark:3.5", "spark.kubernetes.namespace" -> "data-pipeline

    54010编辑于 2025-08-27
领券