我对机器学习和聚类的概念还很陌生。我已经安装了Weka,并且正在尝试弄清楚它是如何工作的。目前,我的训练数据如下。
@relation weather
@attribute year real
@attribute temperature real
@attribute warmer {yes,no}
@data
1956 , 68.98585 , yes
1957 , 67.52131 , yes
1958 , 65.853386 , no
1959 , 66.32705 , yes
1960 , 65.89773 , no因此,我正在尝试建立一个模型,该模型应该能够预测气候是否每年都在变暖。
如果我必须预测1961年是变暖还是变冷,我应该像下面这样提供测试数据吗?
@关系天气
@attribute year real
@attribute temperature real
@data
1961 , 70.98585 我已经删除了列暖器,我想使用之前提供的训练集来预测它。我可以使用Weka提供给我的任何算法(J48、BayesNet等)。有人能帮我弄清楚如何理解这些概念吗?
发布于 2013-06-26 03:52:21
你不需要自己制作训练集和测试集,Weka会为你做这些。即使您这样做了,也不要从测试集中删除要预测的值-- Weka将确保一切正常发生,但需要实际的值来确定预测是否正确,并告诉您模型的执行情况。
您的问题是一个分类问题,即您想要预测标签"yes“或"no”。并非Weka中的所有算法都适用,但不适用的算法是灰色的(如果您使用GUI)。
一般而言,您不太可能使用现有的数据获得好的结果。这更多的是一个时间序列预测任务(即给定这些过去的值,它将如何在未来发展),Weka并没有真正提供算法。你可以在Wikipedia上找到更多信息。
为了用Weka获得更好的模型,你可以添加上一年(或前两年)的温度值作为一个特征,但最终听起来你想要使用可以进行时间序列分析和预测的东西。
https://stackoverflow.com/questions/17305015
复制相似问题