我正在开发一个应用程序来预测一种疾病的症状,我在制作数据集时遇到了一些困难。如果有人有此数据集,请链接到驱动器和共享它在这里。此外,我有一个问题,关于一个好的模式(仅滑雪)。我目前正在使用决策树分类器作为我的项目模型。如果你有任何建议的话,请给出建议。感谢您的阅读。编辑:得到解决方案
发布于 2022-11-28 16:25:57
您可以从这个csv模板中创建自己的模板:
忽略要点,只是为了格式化。然后用熊猫read csv来读取数据。如果你需要更多的帮助,请告诉我
发布于 2022-11-28 16:32:38
我发现你在找数据集时遇到了困难。我快速搜索了一下,在卡格尔找到了这一号。这需要预处理,因为列中的许多症状都是空的。也许您可以这样做,以便每一列都是一个特定的症状,如果症状存在(或不存在),则值为1(或0)。这就会有一个问题,那就是0的数量会很高。你可以试试,看看它是否有效。
您还可以在此随机森林中看到另一个实现,它具有非常不同的预处理。它是一种先进的决策树模型。但是,如果需要的话,决策树是更可解释的。
https://stackoverflow.com/questions/74603450
复制相似问题