我正在尝试找出如何使用本地IDE (如microsoft visual studio代码)来使用分布式计算能力的最佳方法。目前,我们正在将数据带到本地,但由于未来数据规模将会增长、云数据安全等原因,这似乎不是可持续的解决方案。我们想到的一个解决方案是通过隧道进入EC2实例,但希望了解在机器学习/数据科学环境中解决此问题的最佳方法(我们正在使用数据库和亚马逊网络服务)。
发布于 2020-05-02 04:00:47
不确定为什么要将IDE连接到ccomputer。我使用VS代码在HDInsight集群上运行脚本。在我通过脚本触发之前,我配置了它将要运行的集群。在Databricks上也是如此。
https://stackoverflow.com/questions/61300336
复制相似问题