我使用的是C4.5算法(可以在here找到)
我的名字在这里:
Play, Don't Play.
Sky: Sunny, Cloudy, Rainy.
AirTemp: Warm, Cold.
Humidity: Normal, High.
Wind: Strong, Weak.
Water: Warm, Cool.
Forecast: Same, Change.我的数据在这里
Sunny, Warm, Normal, Strong, Warm, Same, Play
Sunny, Warm, High, Strong, Warm, Same, Play
Sunny, Warm, High, Strong, Cool, Change, Play
Rainy, Cold, High, Strong, Warm, Change, Don't Play我从使用以下命令运行的算法获得的输出
c4.5.exe -f v2 -v 1 > v2.r3是
C4.5 [release 8] decision tree generator Tue Jan 18 16:41:25 2011
----------------------------------------
Options:
File stem <v2>
Verbosity level 1
Read 4 cases (6 attributes) from v2.data
4 items, total weight 4.0
best attribute Forecast inf 1.000 gain 0.311 val 0.311
Collapse tree for 4 items to leaf Play
Decision Tree:
Play (4.0/1.0)
Play (4.00:1.00/2.19)
Tree saved
Evaluation on training data (4 items):
Before Pruning After Pruning
---------------- ---------------------------
Size Errors Size Errors Estimate
1 1(25.0%) 1 1(25.0%) (54.7%) <<我的问题是,树是基于更改为单个节点的特征预测。我自己遵循了算法的伪代码,我总是得到一棵树,它使用Sky功能来决定是否播放。我做错了什么?
我想我的问题是因为我不能设置修剪置信度。我试过了,但它不接受我的输入。
c4.5.exe -f v2 -v 1 -c 0.5 > v2.r3或
c4.5.exe -f v2 -v 1 -c 50% > v2.r3不起作用。
发布于 2011-02-08 05:43:50
你可能只想尝试-c 50而不是-c 50。我不确定它为什么不选择Airtemp,因为它应该具有最高的信息增益。
我还将猜测您正在使用Tom Mitchell的“机器学习”一书。他的书应该有一些例子,试一下,看看它们是如何比较的。
编辑:你有没有在你链接的网站上运行这些例子,如果有,它们是否匹配?
https://stackoverflow.com/questions/4726626
复制相似问题