我有一个大的稀疏数据矩阵(包字,超过大量的条目)。在sklearn模型(如RandomForest )中,我可以很容易地将其视为稀疏矩阵。但是,如果我想使用Catboost,我需要将它转化为一个稠密矩阵。我想知道是否有任何有效的方法来处理Catboost,这不会导致这种情况吗?例如,任何内部内置的特性,比如TFRecords of Tensorflow,都可以加载细菌.
发布于 2021-06-01 08:59:43
发布于 2023-03-30 08:50:27
这是一个老问题,但从catboost 0.17开始,支持稀疏矩阵。
pandas.SparseDataFrame或scipy.sparse.spmatrix可以输入为更新的文件中描述的特性X。
希望这能有所帮助!
https://datascience.stackexchange.com/questions/24238
复制相似问题