首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如果是的话,你能用scikit来预测变量吗?

如果是的话,你能用scikit来预测变量吗?
EN

Stack Overflow用户
提问于 2016-02-04 10:32:15
回答 1查看 493关注 0票数 0

我在制药科学领域工作,我研究化学化合物,通过计算它们的化学性质或描述符,我们可以预测这些化合物的某些生物学功能。我同样使用python和R编程语言,也使用Weka机器学习工具。Weka提供了利用支持向量机和其他支持算法进行二值预测的便利。

示例数据集:培训集

代码语言:javascript
复制
Chem_ID   MW LogP HbD HbE IC50 Class_label
  001    232  5    0   2    20    0
  002    280  2    1   4    41    1
  003    240  5    0   2    22    0
  004    300  4    1   5    48    1
  005    245  2    0   2    24    0
  006    255  1    0   2    20    0
  007    299  5    1   4    49    1

测试集

代码语言:javascript
复制
Chem_ID  MW   LogP HbD HbE IC50 Class_label
    000   255  1    0   2    20    

在weka中,很少有算法可以预测"class_label“,或者我们也可以预测特定的变量(我们通常预测"IC50”值),也可以使用scikit学习或其他机器学习库来预测具有这种功能的python。如果是的话,我们如何使用它,谢谢。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-02-04 13:59:08

是的,这是一个回归问题。有许多不同的模型来解决回归问题,从简单的线性回归支持向量回归决策树回归器 (还有更多)。

它们的工作原理类似于二进制分类器:你给他们你的训练数据,而不是0/1标签,你给他们训练的目标值。在您的示例中,您将使用您要预测的特性作为目标值,并从培训数据中删除它。

简短的例子:

代码语言:javascript
复制
target_values = training_set['IC50']
training_data = training_set.drop('IC50')

clf = LinearRegression()
clf.fit(training_data, target_values)

test_data = test_set.drop('IC50')

predicted_values = clf.predict(test_data)
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/35198612

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档