我有一个ML语言识别项目(Python),它需要一个具有高维特征输入的多类分类模型。
目前,我所能做的就是通过跟踪和错误来提高精度.盲目地结合现有的特征提取算法和可用的ML模型,看看我是否幸运。
我要问的是,是否有一个普遍接受的工作流系统地找到一个ML解决方案。
这个想法可能很天真,但我在想,如果我能以某种方式可视化那些高维数据和我的模型的决策边界。希望这个可视化能帮助我做一些调整。在MATLAB中,经过训练后,我可以从所有的特征中选择任意两个特征,并且MATLAB会给出相应的决策边界。我能用Python做这个吗?
此外,我正在寻找一些类型的图表,我可以使用在演示文稿介绍我的模型和功能。在这个领域中最常用的图表是什么?
谢谢
发布于 2017-10-20 08:27:10
特征工程与其说是技术,不如说是艺术。这可能需要领域知识,或者您可以尝试添加、减法、除法和乘不同的列,从而使其具有特性,并检查它是否为模型增加了价值。如果您使用线性回归,那么调整后的R-平方值必须增加,或者在树模型中,您可以看到特征的重要性,等等。
https://stackoverflow.com/questions/46841795
复制相似问题