镜像更新 SparkApplication 使用的 docker 镜像需要添加两个 jar(hadoop-aws 和 aws-java-sdk 或 aws-java-sdk-bundle),版本根据 Spark
JReleaser JReleaser 的一个更新的早期访问版本发布,其特性包括:对 aws-java-sdk 1.12.220、jsonschema 4.24.3、sshj 0.33.0、tika
"org.apache.hudi:hudi-spark3.4-bundle_2.12:0.14.0,org.apache.hadoop:hadoop-aws:3.2.4,com.amazonaws:aws-java-sdk
"org.apache.hudi:hudi-spark3.4-bundle_2.12:0.14.0,org.apache.hadoop:hadoop-aws:3.2.4,com.amazonaws:aws-java-sdk
启动spark 需要两个jar包,aws-java-sdk hadoop-aws spark-shell --executor-memory 2g --driver-memory 2g \ --jars
• AWS:aws-java-sdk:1.10.34(或更高版本) • Hadoop:hadoop-aws:2.7.3(或更高版本) • 下载 Jar 文件[21],解压缩并将它们复制到 /opt/spark
• AWS:aws-java-sdk:1.10.34(或更高版本) • Hadoop:hadoop-aws:2.7.3(或更高版本) • 下载 Jar 文件[21],解压缩并将它们复制到 /