我正在阅读文档,我想请您帮助我理解SnappyData智能连接器这一点。
文档中有几个不同的示例,我应该如何使用spark-submit,例如:
示例1
./bin/spark-submit --deploy-mode cluster --class somePackage.someClass
--master spark://localhost:7077 --conf spark.snappydata.connection=localhost:1527
--packages "SnappyDataInc:snappydata:1.0.0-s_2.11" 示例2
// Start the Spark standalone cluster from SnappyData base directory
$ sbin/start-all.sh
// Submit AirlineDataSparkApp to Spark Cluster with snappydata's
locator host port.
$ bin/spark-submit --class io.snappydata.examples.AirlineDataSparkApp --master spark://masterhost:7077 --conf spark.snappydata.connection=locatorhost:clientPort --conf spark.ui.port=4041 $SNAPPY_HOME/examples/jars/quickstart.jar示例3
$ <Spark_Product_Home>/bin/spark-submit --master local[*] --conf
spark.snappydata.connection=localhost:1527 --class
org.apache.spark.examples.snappydata.SmartConnectorExample --
packages SnappyDataInc:snappydata:1.0.0-s_2.11
<SnappyData_Product_Home>/examples/jars/quickstart.jar假设我在3个主机上有Spark集群:1个主机和3个工作主机,我想使用SnappyData集群作为我当前spark环境的数据源。我应该使用示例1、2或3中的命令吗?
你能给我解释一下在spark-submit - http://snappydatainc.github.io/snappydata/affinity_modes/connector_mode/中的--deploy-mode参数是什么吗?
提前感谢您的帮助。致以敬意,
发布于 2017-10-25 04:05:47
部署模式在here中进行了解释。使用SnappyData时没有什么不同。当运行你自己的Spark集群(任何与Spark2.1兼容的Spark发行版)时,使用SnappyData只需要配置快速定位器(例如localhost:1527)。
https://stackoverflow.com/questions/46918710
复制相似问题