首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏CNCF

    迁移到Spark Operator和S3的4个集成步骤

    镜像更新 SparkApplication 使用的 docker 镜像需要添加两个 jar(hadoop-aws 和 aws-java-sdk 或 aws-java-sdk-bundle),版本根据 Spark

    2.6K10发布于 2021-01-27
  • 来自专栏深度学习与python

    Java 近期新闻:OpenJDK、Spring 升级和 CVE、Payara 平台以及 Apache Tomcat 升级

    JReleaser JReleaser 的一个更新的早期访问版本发布,其特性包括:对 aws-java-sdk 1.12.220、jsonschema 4.24.3、sshj 0.33.0、tika

    2.3K20编辑于 2023-03-29
  • 来自专栏ApacheHudi

    基于 XTable 的 Dremio Lakehouse分析

    "org.apache.hudi:hudi-spark3.4-bundle_2.12:0.14.0,org.apache.hadoop:hadoop-aws:3.2.4,com.amazonaws:aws-java-sdk

    80610编辑于 2024-06-08
  • 来自专栏ApacheHudi

    使用 Apache Hudi + Daft + Streamlit 构建 Lakehouse 分析应用

    "org.apache.hudi:hudi-spark3.4-bundle_2.12:0.14.0,org.apache.hadoop:hadoop-aws:3.2.4,com.amazonaws:aws-java-sdk

    1.1K10编辑于 2024-05-20
  • 来自专栏实时流式计算

    Github 29K Star的开源对象存储方案——Minio入门宝典

    启动spark 需要两个jar包,aws-java-sdk hadoop-aws spark-shell --executor-memory 2g --driver-memory 2g \ --jars

    13K40发布于 2021-10-26
  • 来自专栏ApacheHudi

    基于Apache Hudi + MinIO 构建流式数据湖

    • AWS:aws-java-sdk:1.10.34(或更高版本) • Hadoop:hadoop-aws:2.7.3(或更高版本) • 下载 Jar 文件[21],解压缩并将它们复制到 /opt/spark

    2.7K10编辑于 2022-12-09
  • 来自专栏大数据-BigData

    基于Apache Hudi + MinIO 构建流式数据湖

    • AWS:aws-java-sdk:1.10.34(或更高版本) • Hadoop:hadoop-aws:2.7.3(或更高版本) • 下载 Jar 文件[21],解压缩并将它们复制到 /

    2.2K20编辑于 2022-10-28
领券