首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >机器学习,决策树

机器学习,决策树
EN

Stack Overflow用户
提问于 2013-04-27 05:06:00
回答 2查看 393关注 0票数 1

我有一个关于机器学习和决策树的问题。我在计算生物学(长RNA二级结构预测)工作。

我有一个程序来预测预测RNA二级结构的准确性。程序的输入参数是

  • 茎长(L) -3、4、5、6、7和8的数值
  • 差距大小(G) -从0,1,2,3,4,5,6,7和8
  • 块长(c) --从60、70、80、90、100、120、130、140和150之间的值

我想知道,对于给定的RNA序列长度(S),L,G,C组合给出了最大的准确度。

我有一个训练数据集50个序列文件的序列长度S和每个这些序列文件,L,G,C输入参数组合,提供最大的精度输出是已知的。

有没有一种方法,我们可以知道哪些特定的L,G,和C参数,以找到最大的精度,而没有所有的L,G,和C的范围值?

EN

回答 2

Stack Overflow用户

发布于 2013-04-27 14:00:21

你的问题陈述不太清楚。

您需要一个有监督的学习算法,该算法从50个训练示例中学习,并创建一个以“序列文件”作为输入并为该序列文件生成L、G和C的输出值的预测程序。

对吗?

监督学习算法有很多种选择。序列文件中的数据到底是什么?它是实数的向量吗?它有什么结构?如果你必须用手来确定L,G和C的序列文件,你能做到吗?你会怎么做?

票数 1
EN

Stack Overflow用户

发布于 2017-03-27 09:58:09

我认为你想在这三个参数(L,G,C)中找到一个“最大的影响因素”,这不是一个很普遍的要求,但我认为一些想法可能会对你有所帮助。

  1. 您可以构建几个不同的决策树,它们使用三个参数(一个树)、两个参数(三个树,因为每次从三个参数中选择两个)和只使用一个参数(当然是三个树)。所以你可以有七棵决策树,然后你可以和它们比较精度输出,这样你就可以知道不同的参数对最终预测的贡献。
  2. 你可以计算这三个参数的相对矩阵和最终的预测,然后你知道它们对最终结果的贡献的权重。

PS.You需求(只选择一个因素使机器学习)一般不是一个好主意,因为不同因素对机器学习的预测贡献通常不是线性的,也就是说,将机器学习中输入向量中的多个因素组合在一起通常会给你带来更好的效果。

祝好运!

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/16248575

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档