我与一位合作者在一个研究项目中提出了一种用于最优变量选择的新的统计学习处理器,我正在使用RStudio中的3种基准变量选择算法(LASSO、后向消除逐步回归和前向选择逐步回归),在主要作者通过蒙特卡罗方法创建的26万个合成集上运行。与三个基准相比,对他的新程序的执行情况进行了部分评估。
我的问题是,我无法在我的笔记本电脑上的260 k合成数据集上运行任何这些基准测试方法,即使我的笔记本电脑有32 GB内存,一个四核i5处理器,还有一个不错的1TB SSD。
因此,我很清楚云计算服务和并行处理在一个更高的概念层次,但我从来没有使用过AWS。我刚刚为自己创建了一个AWS帐户,但是不同的服务或“小部件”选项的数量在一开始是非常巨大的。即使我找到了一个合适的,它的整个工作方式对我来说是非常陌生的。任何提示、链接、指示或建议都将不胜感激!
发布于 2023-01-05 17:18:01
一个选项是创建一个EC2实例。选择安装了RStudio服务器的预建AMI ()。
https://datascience.stackexchange.com/questions/117511
复制相似问题