我有一个有6个自变量的数据集,我在支持向量机上训练了这个数据集。在python或R中是否有一种用超平面可视化特征空间的方法?或者,我是否可以绘制许多2D图,这样每一个图都有两个特征,与图中的决策边界相分离?
发布于 2022-09-20 15:38:07
对于像可视化四维这样的东西,你可以沿着构建一个3D图,然后添加一个颜色梯度来表示第四维。对于五个维度,您可以添加散点图点的大小,对于六个,甚至散点形状也可以。然而,经过大约四个维度之后,散点图的“标准”可视化开始显得相当笨重。
可视化六维数据的一种方法是使用上面提到的一种技术。也就是说,创建一系列的二维情节。一种通过在熊猫身上使用scatter_matrix来实现这一点的方法。你可以在它的这里的文件上读到这一点。
下面是一个最低限度的例子:
import pandas as pd
import numpy as np
# import the scatter_matrix function from pandas
from pandas.plotting import scatter_matrix
# create a df that contains a series of random numbers with 6 features
df = pd.DataFrame(np.random.randn(60, 6), columns=['x_1', 'x_2', 'x_3', 'x_4',
'x_5','x_6'])
#create a scatter matrix and plot a histogram across the diagonal
scatter_matrix(df, alpha=.4, figsize=(8, 8), diagonal='hist');结果:

https://datascience.stackexchange.com/questions/114548
复制相似问题