首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏深度学习与python

    近百个大数据开源项目,你该如何选型?|《开源大数据热力报告2022》入围项目公示

    数据初筛 项目初筛 Github 上 Topic Tag 满足如下条件且开源的大数据项目:Topic Tag:big-data、etl、data-ingestion、data-collection、data-pipeline 开源大数据项目,有明确的开源协议、完善的文档;半年内发布过新版本 2、Github 上带有如下 Topic Tag 之一:big-data、etl、data-ingestion、data-collection、data-pipeline

    67230编辑于 2023-03-29
  • 来自专栏Flink实战应用指南

    Flink Forward 2019--实战相关(9)--Yelp公司分享CEP应用

    sessions was always a day late and as an added bonus it also meant integrating with our state-of-the-art data-pipeline

    71400发布于 2019-07-11
  • 来自专栏DevOps持续集成

    Introduction to Apache Airflow-Airflow简介

    Apache airflow is a workflow (data-pipeline) management system developed by Airbnb.

    3.5K10编辑于 2022-12-29
  • 来自专栏HUMAN3.0

    当特征成为技术债:一次线上事故引发的思考

    我在代码仓库里搜索关键词 user_7d_click_rate,找到了 3 个相关提交: model-training 仓库:模型训练时使用这个特征 feature-service 仓库:特征服务读取这个特征 data-pipeline

    9810编辑于 2026-02-27
  • HBase高级特性与生态整合:深度解析BulkLoad、Spark SQL及数据优化策略

    Map( "spark.kubernetes.container.image" -> "hbase-spark:3.5", "spark.kubernetes.namespace" -> "data-pipeline

    46910编辑于 2025-08-27
领券