首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >ML.NET TrainTestSplit随机种子

ML.NET TrainTestSplit随机种子
EN

Stack Overflow用户
提问于 2018-11-15 13:37:41
回答 2查看 1.7K关注 0票数 4

我在ML.NET中使用ML.NET,反复将我的数据集分割成一个训练和测试集。例如,sklearn中,对应的函数接受一个种子作为输入,因此可以获得不同的拆分,但是在ML.NET中,对TrainTestSplit的多次调用似乎返回相同的拆分。是否有可能改变TrainTestSplit使用的随机种子?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-11-18 04:11:24

现在,TrainTestSplit没有随机的种子。在ML.NET中打开了一个bug来修复这个问题:https://github.com/dotnet/machinelearning/issues/1635

作为短期解决办法,我建议手动向数据视图中添加一个随机列,并将其作为stratificationColumnTrainTestSplit中使用。

代码语言:javascript
复制
data = new GenerateNumberTransform(mlContext,  new GenerateNumberTransform.Arguments
                {
                    Column = new[] { new GenerateNumberTransform.Column { Name = "random" } },
                    Seed = 42 // change seed to get a different split
                }, data);
(var train, var test) = mlContext.Regression.TrainTestSplit(data, stratificationColumn: "random");

此代码将与ML.NET 0.7一起工作,我们将在0.8中修复种子。

票数 4
EN

Stack Overflow用户

发布于 2019-05-15 13:18:04

到今天(ML.NET v1.0),这个问题已经解决了。TrainTestSplit以一个seed作为输入,并通过设置samplingKeyColumnName来支持分层。

代码语言:javascript
复制
TrainTestSplit(IDataView data, double testFraction = 0.1, string samplingKeyColumnName = null, Nullable<int> seed = null);
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53320723

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档