我从这里中获取数据集,并尝试对其进行Logistic回归。由于我不太了解MATLAB,我用“数字”软件将"Strings“转换为"Numbers”。
在运行LR算法后,当我试图预测现有数据点的值时,我得到的值介于0-1 (应该是的)之间,但由于我的工作是预测值是0(是)还是1(否),这意味着我需要在预测中找到一条截断线(阈值)(这很可能可以通过比较实际值和预测值来实现)。
如何计算预测结果的阈值,如果预测值>阈值,则假设结果为1,否则为0?
预测值可以是在这里找到的。,我假设预测值是正确的,因为成本曲线是渐近性质的。我已经推动了我在这里的工作,您可能希望交叉验证和提供更多的关键点。
发布于 2017-08-29 19:10:12
根据Andrew的课程,如果您使用乙状结肠激活,则输出表示结果0或结果1的概率。
因此,决策边界为0.5。
如果预测> 0.5,则预测为1
如果预测<=为0.5,则在0中的预测
以下是安德鲁·吴( Andrew )的幻灯片截图:

我已经看过你的代码和结果了。实现似乎有问题,因为您的预测中没有一个值大于0.5。
我无法确定这个问题。您需要进行一些调试。
矛盾的是,你的损失正在减少。我怀疑这可能是因为你的数据集是不平衡的,也就是说,你有221个0和31个左右。这也可能是其他问题的原因。
考虑维基百科示例,其中的值是正确匹配的。

如果您设法找到错误或解决方案的决定性,请张贴在这里,以便我们都可以学习。
希望这能有所帮助!
https://datascience.stackexchange.com/questions/22639
复制相似问题