文章/答案/技术大牛

发布

社区首页 >问答首页 >随机森林生长

问随机森林生长
EN

Stack Overflow用户

提问于 2013-08-30 08:51:04

回答 1查看 137关注 0票数 1

我在这个小函数中为随机森林列车准备一个索引。通过这个函数，我得到了一组示例的索引，以及示例的一组特性子集的索引。我发现代码有点慢，有更好更快的方法吗？

这是我的密码

    function [idx_linhas, idx_features ] = prepararsementes(X,features,nseeds,treesize)
    %Esta função prepara os index para a "semeadura" de uma random forest
    idx_linhas = nan(nseeds,treesize);
    idx_features= nan(nseeds,features);

    for idx=1:nseeds
    [~,idx_linhas(idx,:)] = datasample(X,treesize,'Replace',true);
    end


    for idx=1:nseeds
    [~,idx_features(idx,:)] = datasample(X,features,2);
    end

    idx_linhas = idx_linhas.';

    end

提前感谢！

performance

matlab

random-forest

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-08-30 09:11:49

试试这个：

function [idx_linhas, idx_features] = prepararsementes(X, features, nseeds, treesize)

    % instead of loop, call datasample() only once, and reshape
    % note that ('replace', true) is the default, so I omitted that

    [~,idx]      = datasample(X, nseeds*treesize);
    idx_linhas   = reshape(idx, nseeds, treesize).';  

    [~,idx]      = datasample(X, nseeds*features, 2);
    idx_features = reshape(idx, nseeds, features);

end

从统计学上讲，我认为结果应该是一样的，因为你没有具体的权重，而且在这两种情况下你都用替换画。

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/18528720

复制

相似问题

问随机森林生长
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问随机森林生长EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问随机森林生长
EN