首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >TPOT训练时间太长

TPOT训练时间太长
EN

Stack Overflow用户
提问于 2021-06-04 17:32:27
回答 1查看 226关注 0票数 1

我第一次尝试在大约有7000行的数据集中使用tpot,当尝试在训练数据集(占整个数据集的25% )上训练tpot时,tpot花费的时间太长。我在google上运行了大约45分钟的代码,优化的进度仍然是4%。我只是尝试使用在http://epistasislab.github.io/tpot/examples/上看到的例子。tpot花这么长时间是很正常的吗,因为到目前为止,我认为即使尝试使用它也不值得

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-06-07 23:24:13

根据您的数据集,TPOT可能需要相当长的时间。您必须考虑TPOT正在做什么: TPOT正在评估数千条分析管道,并在背景数据集上拟合数千个ML模型,如果您有一个大型数据集,那么所有这些拟合都需要很长时间--特别是在功能较弱的计算机上运行它时。

如果你想要更快的结果,你有几个选择:

  1. 使用"TPOT灯“配置,它使用更简单的模型,运行速度更快。
  2. n_jobs参数设置为-1或大于1的数字,这将允许TPOT并行计算管道。如果您有一台多核机器,-1将使用所有可用的核,并显着地加快速度。
  3. 使用subsample参数对数据进行子示例。默认为1.0,对应于使用100%的培训数据。您可以对数据进行子示例,以降低数据的百分比,这样TPOT将运行得更快。
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67841663

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档