首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我如何使用我必须做预测的数据?

我如何使用我必须做预测的数据?
EN

Data Science用户
提问于 2020-10-24 08:17:20
回答 1查看 24关注 0票数 1

我有一套CPU (~100)。我得到了每个CPU根据一组基准测试(~8)进行基准测试的结果。有一个特定的任务让我感兴趣,我需要为这个任务找到最佳的CPU。CPU的一小部分(~10-20)对它在特定任务中的执行情况进行了噪声测量。

两个问题:

  • 如何使用我必须使用的数据来预测给定CPU在该特定任务上的性能(当它的性能不是直接测量在该特定任务上时)?这假设大量基准测试套件的结果捕获了与该特定任务相关的CPU性能方面。最好采用可解释的白盒解决方案,这样我就可以判断哪些基准测试与哪个任务相关(以及有多相关)。
  • 你是怎么概括这个问题的,这样我才能研究它呢?
EN

回答 1

Data Science用户

发布于 2020-10-24 12:39:26

我对此相当悲观:理想情况下,使用100个CPU运行实际任务(或任务的代理,如任务的简化版本)。在这里,我能想到的唯一选择是:

  1. 使用10-20 CPU的噪声测量值作为实际任务的数据基础。
  2. 尝试将这些度量映射到8个基准,这样我们就可以根据它们的结果来预测100个CPU的性能。

我很悲观,因为:

  • 任务的测量是很吵的,
  • 不能保证这些测量数据能够可靠地与8个基准相关联,
  • 这8项基准也不能保证对这项任务提供一个很好的估计。

尽管如此,从技术上讲,您可以想象有监督学习的设计,其思想是根据8个基准(特性)的结果来预测任务(目标变量)的性能。培训数据将包含10-20个CPU的结果,对于这些CPU,您有两个结果(8个基准+任务性能)。我建议使用决策树回归来尝试,因为它为您提供了一个可解释的模型(白色方框解决方案)。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/84439

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档