我在制药科学领域工作,我研究化学化合物,通过计算它们的化学性质或描述符,我们可以预测这些化合物的某些生物学功能。我同样使用python和R编程语言,也使用Weka机器学习工具。Weka提供了利用支持向量机和其他支持算法进行二值预测的便利。
示例数据集:培训集
Chem_ID MW LogP HbD HbE IC50 Class_label
001 232 5 0 2 20 0
002 280 2 1 4 41 1
003 240 5 0 2 22 0
004 300 4 1 5 48 1
005 245 2 0 2 24 0
006 255 1 0 2 20 0
007 299 5 1 4 49 1测试集
Chem_ID MW LogP HbD HbE IC50 Class_label
000 255 1 0 2 20 在weka中,很少有算法可以预测"class_label“,或者我们也可以预测特定的变量(我们通常预测"IC50”值),也可以使用scikit学习或其他机器学习库来预测具有这种功能的python。如果是的话,我们如何使用它,谢谢。
发布于 2016-02-04 13:59:08
是的,这是一个回归问题。有许多不同的模型来解决回归问题,从简单的线性回归到支持向量回归或决策树回归器 (还有更多)。
它们的工作原理类似于二进制分类器:你给他们你的训练数据,而不是0/1标签,你给他们训练的目标值。在您的示例中,您将使用您要预测的特性作为目标值,并从培训数据中删除它。
简短的例子:
target_values = training_set['IC50']
training_data = training_set.drop('IC50')
clf = LinearRegression()
clf.fit(training_data, target_values)
test_data = test_set.drop('IC50')
predicted_values = clf.predict(test_data)https://stackoverflow.com/questions/35198612
复制相似问题