任意基因的相关性 可以将分组(正常样本和肿瘤样本)与基因的相关性联系 几种算法(免疫丰度、免疫细胞亚型 1.免疫亚型鉴定和可视化 https://www.yuque.com/xiaojiewanglezenmofenshen (小洁老师的链接里:可以检验一下结果是否可靠,即geneMatchErrorReport告诉你有多少基因是在输入数据中不存在的,如果比例过高,那最终计算出来的亚型就不那么可靠) 4.作图了 library 免疫细胞丰度 箱线图:文献代码:https://www.yuque.com/xiaojiewanglezenmofenshen/bsgk2d/rhrbqu 用ssega方法,结合GBM_ER文献里的mmune 泛癌的亚型如何寻找,新版TCGA文献 ppt里的第23张 4.estimate算法 https://www.yuque.com/xiaojiewanglezenmofenshen/bsgk2d/yenun9 每个表型相关模块里的那些基因 模块:具有高拓扑重叠相似性的基因合集。共表达模块是根据非相似性矩阵,利用聚类算法获得。基因与他所属的同一模块内的其他基因往往具有更高的共表达特性。
大家好,又见面了,我是你们的朋友全栈君。 对于科研学子来说,EndNote(或NoteExpress)是管理文献的利器,能够快速筛选文献与录入参考文献,非常适用于参考文献较多的场合。 首先Endnote的安装这里就不赘述,直接附上安装包链接以及汉化补丁:链接:https://pan.baidu.com/s/1xGBWaXqFDsKuws-HGhrtfw 提取码:33v4 接下来就讲讲我们的正题 需要引用文献的时候就从中选择一个插入到文档中,EndNote 会自动给你编号、在文档末尾建立相应的参考文献列表。 但是各种杂志、单位要求的文献著录格式是不一样的,所以在插入文献到文档之前,我们应该选择合适的文献著录格式。 需要填写的项如下图所示: 那么如何体现Endnote文献管理软件的强大之处呢:如果当你想在原有的参考文献前面在插入一篇文献,如你想在原先第36篇文献前再插入一篇文献,那么Endnote会自动将新插入的文献定义为
我们生信技能树在前面给大家整理过大量的带有全套代码在 github 上分享的文献,还有一个专门的共享表格:自带图表复现代码及数据集的单细胞及多组学文章-V1 https://docs.qq.com/sheet 我们秉承着一切分享学习的态度,即将开启2025年的新专辑《Github带有全套代码分享的文献复现2025》,我们以学习文献中的思路,代码技巧为主,带领大家攻破一篇篇文献,将其运行到自己的科研课题中。 下面第一篇学习的文章非常好,作者的数据,代码整理的非常详细见以前的分享: 代码分享|| 见过将代码整理成wiki资源的吗?这是篇极好的学习单细胞与scATAC-Seq组学以及联合分析的文献资源! 50.1 Kb GSM5276942_features-3E4D1L.tsv.gz 297.6 Kb GSM5276942_matrix-3E4D1L.mtx.gz 78.4 Mb GSM5276943 GSE173682 # 存放 GSE173682 的相关数据 到这里,你需要准备好环境,下载好数据和文献,代码,提前熟悉文献内容!
前言 CNS图表复现之旅前面我们已经进行了13讲,你可以点击图表复现话题回顾。如果你感兴趣也想加入交流群,自己去:你要的rmarkdown文献图表复现全套代码来了(单细胞)找到我们的拉群小助手哈。 为了解决这个问题,让我们一起看看文献自己的inferCNV流程是如何使用的,以及对应的数据集。 T,运行该文献他自己的数据集和文献代码后,运行的日志文件如下所示: INFO [2020-10-19 11:17:44] ::process_data:Start INFO [2020-10-19 11 INFO [2020-10-20 09:25:38] Running Sampling Using Parallel with 4 Cores 中间调用了我MAC电脑的4个核心去计算,值得一提的是, 往期回顾 CNS图表复现13—使用inferCNV来区分肿瘤细胞的恶性与否 细胞身份何以在分裂中得以保持?
❝我又继续探索了一下上上周推文复现的science推文数据集,这周的推文就继续写一下。 Science: 数据集:GSE234933 整个推文中需要注意的地方有三点: 作者给出的数据是多个rds格式文件压缩在一块的,解压后循环读取文件并合并成seurat对象 作者给出的细胞亚群信息可以后续添加到 normalization.method = "LogNormalize", scale.factor = 1e4) ,右图是我加入meta信息后重新降维分群得到的,复现可行性很高。」 「这样得出的结果去如果继续复现后续分析就会更方便一点,虽然上次的推文也进行了细胞亚群细分,但是不同的人对亚群细分的认知还是存在差异的。」
我们可以简单的理解为曲线上该点对应的y轴值就是x轴代表的通道的荧光信号值对应的细胞数。 图(1)中100~101(M1)为阴性细胞,101以上的(M2)为阳性细胞;图(2)中2N代表G0/G1期细胞,4N代表G2/M期细胞,两者中间代表S期细胞。 2.流式散点图 流式散点图能够同时表示两个通道的信息,更加直观和常用,x轴表示一个通道的值,y轴表示另一个通道的值,图中每一点代表一个细胞,该点所对应的横坐标值就是该点所代表细胞的x轴通道的值,所对应的纵坐标值就是该点所代表细胞的 例如,分析CD25+调节性T细胞占CD4+T细胞的比例时,此时可以根据CD4的表达情况,将CD4+T细胞设门显示于一个新的流式图中,则该流式图只显示所设门内的细胞,即只显示CD4+T细胞,其他无关细胞不会被显示 在相应散点图中x轴代表CD4信息,y轴代表CD25信息,这样就可以非常直观地计算出调节性T细胞的比例。说白了就是框定一个区域的细胞,让计算机分析该区域各类细胞的比例。
[j]之前,则称这种排序算法是稳定的,否则称为不稳定的。 下标为4的e,它的父结点就是(4-1)/2 = 1(舍去小数) 堆的两个特性 结构性:用数组表示的完全二叉树。 有序性:任一结点的关键字是其子树所有结点的最大值(或最小值)。 6的位置已经被确定,它左边的数都比它小,右边的数都比它大,如果它左右两边都是有序的,那么整个数组就有序里。 操作系统中内存的栈和堆与数据结构中的栈和堆要区分开来。 队列也可以实现。 归并排序 基本思想 归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法,的一个非常典型的应用。 归并排序有空间复杂度的消耗,因为它的核心算法需要开辟一个临时数组。它的空间复杂度是O(N),这是它跟其他算法的主要差异。
强烈要求我们推荐纯粹的R语言的文献图表复现全套代码,其实很容易检索到,2020奶牛7月仅仅是单细胞高分(IF>9)文章就有一百多篇,全部的单细胞相关文章有六七百篇了。 一般来说,公布代码,都是在GitHub,所以只需要关键词合适,搜索十几篇带有配套文章的图表的数据和代码很正常。 我从这些CNS文章里面精挑细选了一个非常值得大家花时间跟下去的,就是新鲜出炉的发表在CELL杂志的:Therapy-Induced Evolution of Human Lung Cancer Revealed 文章的主线就是分群,然后继续分群。细胞数量也不多,大家的电脑基本上都可以hold住,第一次分群如下: ? 无限量函数学习 我们也可以解析每个代码 每个人写代码的习惯不一样,而且有更好的rmarkdown书写方式,大家都可以运行一遍作者提供的数据和代码,在他们的基础上面进行创作和发挥: --- title:
大家好,又见面了,我是你们的朋友全栈君。 常见几种java排序算法 1.插入排序 2.分治排序法,快速排序法 3.冒泡排序 low版 4.冒泡排序 bigger版 5.选择排序 6. 比较 1.插入排序 这个打麻将或者打扑克的很好理解, 比如有左手有一副牌1,2,4,7 ,来一张3的牌, 是不是就是手拿着这张牌从右往左插到2,4之间 一次插入排序的操作过程: 将待插元素,依次与已排序好的子数列元素从后到前进行比较 层层细分 接下来,我们通过示图来展示上述分区算法思路的过程: public class QuickSort { public static void sort(int[] arr if(flag){ break; } } } } 5.选择排序 选择排序也是一种简单直观的排序算法 / \ / * `4 2 3 8 3 * 构建最大顶堆, 变成父节点都比子节点大的树 * @param a */ public static void createTopMaxHeap(int[]
本文讲述的是"将外部发送来的请求均匀分配到对称结构中的某一台服务器上"的各种算法,并以Java代码演示每种算法的具体实现,OK,下面进入正题,在进入正题前,先写一个类来模拟Ip列表: 轮询(Round 基于概率统计的理论,吞吐量越大,随机算法的效果越接近于轮询算法的效果。 源地址哈希算法的代码实现大致如下: 前两部分和轮询法、随机法一样就不说了,差别在于路由选择部分。 源地址哈希算法的缺点在于:除非集群中服务器的非常稳定,基本不会上下线,否则一旦有服务器上线、下线,那么通过源地址哈希算法路由到的服务器是服务器上线、下线前路由到的服务器的概率非常低,如果是session 最小连接数(Least Connections)法 前面几种方法费尽心思来实现服务消费者请求次数分配的均衡,当然这么做是没错的,可以为后端的多台服务器平均分配工作量,最大程度地提高服务器的利用率,但是实际情况是否真的如此
package fib /** Fibonacii的几种算法实现 */ // 直接循环计算 func Fib(n int) int { f := [3]int{0, 1, 1} if ] } for i := 2; i <= n; i++ { f[i&1] += f[(i+1)&1] } return f[n&1] } //递归算法 { if n < 3 { return 1 } return fib_recursion(n-1) + fib_recursion(n-2) } //尾递归算法 可以明显看出,直接计算,无交换的算法是最快的。
在进行AD采样时,常常都会对采样数据进行滤波,以达到更好一点的效果。下面分享几种较简单而常用的滤波算法: 限幅滤波法 限幅滤波法又称程序判断滤波法 。 、液位的变化缓慢的被测参数有良好的滤波效果。 缺点: 对于测量速度较慢或要求数据计算速度较快的实时控制不适用,比较浪费 RAM 。 ,可消除由于脉冲干扰所引起的采样值偏差。 End:以上就是本次的分享。滤波算法有很多种,本文分享的是几种较为简单但却实用的。如有错误,欢迎指出!
(3)计算每一类中中心点作为新的中心点。 (4)重复以上步骤,直到每一类中心在每次迭代后变化不大为止。也可以多次随机初始化中心点,然后选择运行结果最好的一个。 ? ? 2、均值漂移聚类 均值漂移聚类是基于滑动窗口的算法,来找到数据点的密集区域。这是一个基于质心的算法,通过将中心点的候选点更新为滑动窗口内点的均值来完成,来定位每个类的中心点。 然后去除相似窗口,最终形成中心点集及相应的分组。 算法步骤: (1)确定滑动窗口半径r,以随机选取的中心点C半径为r的圆形滑动窗口开始滑动。 均值漂移类似一种爬山算法,在每一次迭代中向密度更高的区域移动,直到收敛。 (2)每一次滑动到新的区域,计算滑动窗口内的均值来作为中心点,滑动窗口内的点的数量为窗口内的密度。 (4)步骤一到三会产生很多个滑动窗口
MD5加密 md5加密算法在PHP中是最常见的加密算法,这个算法是不可逆的,通常用于加密用户的密码等信息来保证用户的信息安全。 来自 RFC 1321 的解释 - MD5 报文摘要算法:MD5 报文摘要算法将任意长度的信息作为输入值,并将其换算成一个 128 位长度的"指纹信息"或"报文摘要"值来代表这个输入值,并以换算后的值作为结果 > Crypt()加密算法 crypt()加密算法是一种不可逆的加密算法,他有两个参数,一个是需要加密的字符串,另外一个是盐值(或者成为干扰字符串),如果没有指定第二个参数那么将自己随机生成一个干扰字符串并且是以 > sha1加密算法 sha1加密算法和MD5加密算法一样时不可逆的,有两个参数,一个是要加密的字符串,第二个是bool值,如果指定第二个参数为TRUE,则返回二进制格式的字符串,如果不指定则默认为FALSE ,所以如果你想实现真正的加密,并不推荐这个加密算法。
对一个排序算法来说,一般从如下3个方面衡量算法的优劣: 时间复杂度:主要是分析关键字的比较次数和记录的移动次数。 空间复杂度:分析排序算法中需要多少辅助内存。 稳定性:若两个记录A和B的关键字值相等,但排序后A、B的先后次序保持不变,则称这种算法是稳定的;反之,就是不稳定的。 > temp; j--) { //逐个向后移 a[j + 1] = a[j]; } //temp插入位置 a[j + 1] = temp; } 4、 快速排序算法 快速排序的原理:选择一个关键值作为基准值。 while(h > 0) { for(int i = h; i < nElem; i++) { //每个增量间隔内,实现插入排序,两个for循环和插入排序一样,只不过第二个for循环里参数略有调整而已
,统计单词出现的次数(WordCount)。 的替代品。 ://my.oschina.net/leejun2005/blog/83045 http://blog.csdn.net/techdo/article/details/7433222 4、 跨平台的脚本语言:python map: #! 说明:列举了上述几种方法主要是给大家一个不同的思路, 在解决问题的过程中,开发效率、执行效率都是我们需要考虑的,不要太局限某一种方法了。
服务端布署的优点: 改进的性能:网站页面加载和发送的请求/数据变少了,用户浏览会更流畅 更高的安全性:在TMS服务器上,你可以完全控制发送的数据,可以更好地保护访问者数据。 Protection),Safari的ITP(Intelligent Tracking Prevention),它们都是在浏览器里内置机器学习用于识别第三方跟踪,会直接屏蔽第三方跟踪。 第三方模式:它是从Google的域名www.googletagmanager.com加载GTM跟踪代码,GA4收集到的数据发送到Google的域名www.google-analytics.com,这两个域名相对于你自己的域名 ,叫Google代码网关,需要有使用CDN才可以使用这种方式,它是从自己的域名加载GTM跟踪代码,GA4收集到的数据是发送到自己的域名,然后再转发给GA4服务器。 (这种方式在Adobe Analytics里叫CNAME布署)。 优点:有服务端布署的优点,布署又没服务端那么麻烦 建议:如果有使用CDN,建议布署,CloudFlare内置支持这种方式
注意到这个研究是因为自己也一直在看乳腺癌相关文献,2021年1月新鲜出炉的,标题是:《Prevalence and reclassification of BRCA1 and BRCA2 variants 让我们来看看,他为什么只有4个参考文献: 其中两个参考文献是中国人的类似的*BRCA1/*2 研究队列: Germline mutations in cancer susceptibility genes Int J Cancer. 2019; 还有一个参考文献是韩国人队列: The prevalence and spectrum of BRCA1 and BRCA2 mutations in Korean 不过,最后一篇参考文献就很有意思了,曾经一度刷爆朋友圈:Accurate classification of BRCA1 variants with saturation genome editing. 6434 healthy controls in 19 medical centers in 11 Chinese provinces 不过,这些变异位点毕竟是来源于测序数据,那么如何从fastq格式的测序数据准确的定位到跟参考基因组不一样的各式各样的变异位点呢
在python中列表的常用方法主要包括增加,删除,查看和修改。下面以举例子的方法具体说明,首先我们创建两个列表,列表是用[ ]表示的,里面的元素用逗号隔开。 a=[‘hello’,78,15.6,‘你好’] b=[78,1,1,4,5,6,1] 一.增加 方法一:a.append('tom') # 在a列表最后追加一个元素tom ['hello', ,查看一部分列表中的元素: 代码:print(a[0:3]) print(b[4::-1]) 结果:'hello', 78, 15.6] [5, 4, 1, 1,78] 3.查找列表中的某一个元素的具体位置: print(a.index(15.6)) 结果为2 表示15.6这个元素在a列表的第三个位置 4.查找元素出现的次数 [1, 6, 5, 4, 1, 1, 78]
一文看懂人工智能里的算法(4个特征+3个算法选择 Tips) ? 人工智能有三驾马车:数据、算法、算力。本文重点介绍算法相关的知识。 本文将介绍算法在人工智能里的概念,算法的4个特征、6个通用方法。以及在选择算法时需要注意的3个点。 什么是算法? 简单的说,算法就是:解决问题的手段,并且是批量化解决问题的手段。 菜谱就是一种“算法”,只要按照菜谱的方法做,就能做出对应的菜。 ? 人工智能里的算法主要是用来训练模型的。 机器学习 一共有7步,第3步就是选择合适的算法模型。 通过训练得到最后的可预测模型。 ? 算法的4个基本特征 ? 算法具有下面4个特征: 1、可行性 2、确定性 3、有穷性 4、拥有足够的情报 (关于这4项特征详细的说明我后面会文章介绍) 算法的6个基本方法:计算机的算法和人类计算的方式不同,大致有6种不同的思路