我对ML和scikit-学习都很陌生。我注意到一些示例教程和代码在线使用patsy的dmatrices来为logistic回归准备数据。我不明白为什么要这么做。示例
例如,在上述情况下,直接使用数据集中的数据来训练logistic回归模型不就足够了吗?使用patsy到底有什么意义?
谢谢!
发布于 2018-07-11 15:35:43
主要是方便。在这种特殊情况下,它处理一个热编码分类变量,例如C(occupation)。
patsy还负责引擎盖下的其他事务,比如删除缺少值的行,并添加一个常量的截获变量。
https://datascience.stackexchange.com/questions/34313
复制相似问题