首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >芯片数据集中in电子滴定与观察到的表达量的相关性

芯片数据集中in电子滴定与观察到的表达量的相关性
EN

Stack Overflow用户
提问于 2015-05-24 05:48:00
回答 1查看 57关注 0票数 2

下面的出版物使用滴定方法来评估微阵列数据差异分析的可能阈值。据我所知,相应的作者只是将两个样本组之间具有不同比例的数据集混合了几次,以模拟一个滴定实验,就像lumiBarnes Bioconductor软件包中的那个。

我想在silico中应用这种方法,但我不确定这是否可能或根本就是一个好主意。给定两组名为c1、c2、c3、c4和d1、d2、d3、d4的数组。我可以通过在silico中混合已经派生的数据集来执行类似的方法吗?

举个例子:

100:0

代码语言:javascript
复制
c1,c2,c3,c4,d1,d2,d3,d4
c1,c2,c3,c4,c1,c2,c3,c4

75:25

代码语言:javascript
复制
c1,c2,c3,c4,d1,d2,d3,d4
c1,c2,c3,c4,c1,c2,d3,d4

50:50

代码语言:javascript
复制
c1,c2,c3,c4,d1,d2,d3,d4
c1,c2,c3,c4,d1,d2,d3,d4

..。

参考文献: Du P,Zhang X,Huang C-C,et al.基因芯片分析甲基化水平的Beta值法和M值法的比较。BMC生物信息学。2010;11:587。doi:10.1186/1471210511-587.http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3012676/

LumiBarnes http://www.bioconductor.org/packages/release/data/experiment/html/lumiBarnes.html

EN

回答 1

Stack Overflow用户

发布于 2015-07-01 22:35:28

我将在电子滴定中通过按所需的比率缩放/转换阵列信号(探针强度)来实现此目的。因此,在概念上类似于下面的内容:

group1: c1,c2,c3,c4

group2: d1,d2,d3,d4

100:0

1*group1 : 0*group2

75:25

0.75*group1 : 0.25*group2

50:50

group1 : group2

25:75 0.25*group1 : 0.75*group2

0:100

0*group1 : 1*group2

现在是我对这个过程的思考/注意事项:

1)缩放强度可能不会适当地表示阵列中的噪声(想想MA图)。根据您进行缩放的方式,您需要确保所有强度都在检测的规格范围内,例如,阵列扫描仪可能在2^16处饱和,因此您的强度都不应超过此值。同样,所有探针都可能具有某种最小强度(类似于自动荧光)。我预计,由于阵列检测过程中的一些底板,强度分布不仅应该更低,而且还应该压缩。

2)对于100:0,您不希望将强度设置为0,而是随机采样底部5-10%的探测器强度或采样阵列上的暗控制点以模拟阵列噪声。

3)有许多方法可以达到75:25的比率(3*g1 : 1*g2,1*g1 : 0.333*g2等)。我不确定哪一个是最好的,如果我做这个实验,我会避免3:1转换,因为它有可能“饱和”许多探针(见上文)。

3)缩放/变换阵列强度可能根本不起作用,因为仪器设置可以在一定程度上克服滴定差异。例如,如果阵列上的信号很低,可以通过调整(增加)扫描仪上的探测器增益来解决这个问题。一般来说,当扫描阵列时,你的目标是几个百分比的斑点是饱和的。

我建议这种方法的原因是基于您参考的论文。浏览一下M&M,我的建议更能代表他们在替补席上所做的事情,即在75:25的DNA混合中,你会期望一个样本的信号比另一个样本高3倍。更改组中的样本数量只会更改统计数据的计算方式,因为您正在更改df。而且在某些情况下(当一个组中只有一个相同的情况下)统计数据计算可能会失败,因为没有办法获得每个探测器的方差的良好估计。

我很想知道这是否有效,听起来像是一个有趣的练习。

祝你好运

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/30417922

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档