在为大数据创建基础设施时,我想使用带有Presto安装的Azure HDInsight。Azure HDInsight有不同的风格,比如hadoop,spark等等。在文档中,推荐使用hadoop集群,但我想使用spark集群。
星际爆发的Presto发行版可以使用星火簇吗?
发布于 2019-05-31 04:20:18
看起来你想同时使用Presto和Spark。如果在单个集群上运行它们,则需要对它们进行适当的配置,以确保不同进程的JVM可以共存。这是可能的,但在实践中很难做到(您需要知道除了-Xmx设置之外,JVM是如何分配内存的),所以绝对不推荐这样做。
虽然我可以想象,在一些预置新硬件很困难的本地安装中,您可能希望将服务托管在一个集群上。在云中,配置两个独立的集群要方便得多,每个集群的大小都适合您的特定需求和工作负载。例如,您可以有一个带有Presto的集群,用于交互式分析、仪表板和即席查询。另一个是Spark,用于机器学习或ETL工作负载。
有关详细配置说明,请参考Starburst Presto on Azure documentation。
https://stackoverflow.com/questions/56381432
复制相似问题