在我对使用机器学习的理解中,总是有一个名为Target或Label的专栏,这使得我们将方法称为Supervised学习。现在我处理的不是supervised或unsupervised过程。我不知道到底是什么。我有一些数据帧,每个数据帧都有3列。这些列之间有关系,但这并不重要。我正在寻找一种方法来显示样品对彼此的影响。从理论上说,在我的课题中,已经证明了在特定情况下,一些样本比其他样本更重要。现在我需要用机器学习来展示它。我已经生成了发生这种情况所需的数据,但我不知道如何找到样本对彼此的影响。我本可以在样本上显示一些不同之处,但找不到任何有意义的场景用于机器学习。为了澄清,我定义了一个值,它是在每个列值之间的计算,我想知道在计算这个值时,在一个特定的索引中,哪个样本起着更重要的作用。现在的问题是
**HOW TO FIND THE EFFECT OF SAMPLES ON EACH OTHER USING SIMPLE OR ADVANCED TECHNIQUES?**为了更好地理解,让我们在这里看到一些数据。数据框架的一个例子如下:
S C E
0 0.2 1e-2
1 -0.15 2e-2
2 0.24 2e-3
3 -0.1 3e-1
4 0.3 2e-1第三列是前2列(有组合方程)的组合,现在我需要知道例如,对于E[2],c[0],c[1],c[2],c[4]的作用是什么。
发布于 2021-02-02 14:11:58
首先,您的dataframe中的列被称为功能,那么,正确的问题将是如何找到功能之间的关联?
正如问题中提到的,你想找出它们之间的相互关系,
那么,什么是关联呢?
答案:相关性是一种统计数据,它衡量两个变量之间相互关联的程度。
当地的冰淇淋店一直在跟踪当天的冰淇淋销量与温度的关系,以下是过去12天的数据:

下面是与散点图相同的数据:

我们可以很容易地看到温暖的天气和更高的销售同时进行。这种关系被称为正相关关系,这意味着如果一个变量增加,另一个变量也增加,因此这两个变量都提供了相同的信息。在一般情况下,最好是放弃其中一个。
https://datascience.stackexchange.com/questions/88821
复制相似问题