我想尝试不同的共线性测试,并在存在多重共线性的情况下获得特征重要性。
然而,我似乎没有找到这方面的数据集。我特别寻找分类变量和数值变量的混合作为我的预测变量,并寻找一个二元变量作为我的响应。
任何对变量有一些解释的数据都会非常有帮助。
提前感谢
发布于 2019-07-31 17:19:34
您可以尝试使用数据集CIC-IDS 2017,它具有连续变量和分类变量,并且变量具有非常高的多重共线性。
您可以自由访问数据集的文件,向下滚动此页面:https://www.unb.ca/cic/datasets/ids-2017.html
https://stackoverflow.com/questions/57272769
复制相似问题