首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >给定已知处理的聚类策略

给定已知处理的聚类策略
EN

Stack Overflow用户
提问于 2016-01-17 04:16:47
回答 1查看 67关注 0票数 0

是否有一种策略可以在一组中跨条件对共享属性进行聚类,同时知道该条件会激发两个组之间的差异?

一个具体的例子:假设A组有4个人,B组有4个人,A组被介绍给StackOverflow,其他人只剩下他们的钢铁意志。对每个个体进行了30000个基因检测。与B组相比,我们期望A组个体相对没有压力,因此,我们寻找在B组中高表达但在A组中低表达的基因簇,确定这组基因是有用的,因为这些基因可以解释对压力的生物学反应。

但事实证明,这两组并不是线性分离的-- PCA在A组和B组中表现出很大的差异。A组中的一些个体与B组有一些基因被上调,但A组中的一两个个体也有这种上调。是否有一种策略来发现A组中的所有个人都具有相同属性,并且与B组中的所有个人都不同,同时知道这两个组应该是不同的。

EN

回答 1

Stack Overflow用户

发布于 2016-01-17 10:58:24

这不是聚类分析。

你有两类:治疗和控制。

你想找出那些有助于区分这两类人的特征(基因)。

寻找有监督的特征选择方法,如信息获取;并研究可解释的分类器,如决策树和随机森林,这将帮助您识别最有区别的基因。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34835037

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档