文章/答案/技术大牛

发布

社区首页 >问答首页 >该问题的正确机器学习解决方案

问该问题的正确机器学习解决方案
EN

Data Science用户

提问于 2021-02-02 11:09:22

回答 1查看 73关注 0票数 0

在我对使用机器学习的理解中，总是有一个名为Target或Label的专栏，这使得我们将方法称为Supervised学习。现在我处理的不是supervised或unsupervised过程。我不知道到底是什么。我有一些数据帧，每个数据帧都有3列。这些列之间有关系，但这并不重要。我正在寻找一种方法来显示样品对彼此的影响。从理论上说，在我的课题中，已经证明了在特定情况下，一些样本比其他样本更重要。现在我需要用机器学习来展示它。我已经生成了发生这种情况所需的数据，但我不知道如何找到样本对彼此的影响。我本可以在样本上显示一些不同之处，但找不到任何有意义的场景用于机器学习。为了澄清，我定义了一个值，它是在每个列值之间的计算，我想知道在计算这个值时，在一个特定的索引中，哪个样本起着更重要的作用。现在的问题是

**HOW TO FIND THE EFFECT OF SAMPLES ON EACH OTHER USING SIMPLE OR ADVANCED TECHNIQUES?**

为了更好地理解，让我们在这里看到一些数据。数据框架的一个例子如下：

S   C     E
0   0.2   1e-2
1  -0.15  2e-2
2   0.24  2e-3
3  -0.1   3e-1
4   0.3   2e-1

第三列是前2列(有组合方程)的组合，现在我需要知道例如，对于E[2]，c[0],c[1],c[2],c[4]的作用是什么。

python

回答 1

Data Science用户

发布于 2021-02-02 14:11:58

首先，您的dataframe中的列被称为功能，那么，正确的问题将是如何找到功能之间的关联？

正如问题中提到的，你想找出它们之间的相互关系，

那么，什么是关联呢？

答案:相关性是一种统计数据，它衡量两个变量之间相互关联的程度。

示例:冰淇淋销售

当地的冰淇淋店一直在跟踪当天的冰淇淋销量与温度的关系，以下是过去12天的数据：

下面是与散点图相同的数据：

我们可以很容易地看到温暖的天气和更高的销售同时进行。这种关系被称为正相关关系，这意味着如果一个变量增加，另一个变量也增加，因此这两个变量都提供了相同的信息。在一般情况下，最好是放弃其中一个。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/88821

复制

相似问题

问该问题的正确机器学习解决方案
EN

回答 1

Data Science用户

示例:冰淇淋销售

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问该问题的正确机器学习解决方案EN

回答 1

Data Science用户

示例:冰淇淋销售

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问该问题的正确机器学习解决方案
EN