首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏菜鸟学数据分析之R语言

    gcRMA算法-聚类分析PCA

    计算样品两两之间的pearson相关系数 >dist.lower<as.dist(1pearson_cor)#得到Pearson距离的下三角矩阵 >hc<-hclust(dist.lower,"ave")#聚类分析 > plot(hc)#聚类画图 > sampleNames <- sub(pattern = "\\.CLL",replacement = "",colnames(eset))#PCA分析 > groups CLL6 progres. 22 CLL7 progres. 23 CLL8 progres. 24 CLL9 stable 从上述列表信息可知稳定组和恶化组,从聚类分析可知 通过采用两个主成分构建分类,可以看出稳定组(矩形)和恶化组(菱形)根本不能很好分开,在主成分分析时,考虑两个组成分的代表性以及累计贡献率,若低于60%,需要采用多维尺度分析

    1.4K40发布于 2020-08-06
  • 来自专栏IT技术订阅

    内存空间分析

    程序执行的内存分析过程 为了让初学者顺利的分析内存,更加容易的体会程序执行过程中内存的变化,加深理解。我们将 JAVA 虚拟机内存模型进行简化。 System.out.println(t2.age); System.out.println(t2.name); t2.study(); } } 运行内存空间分析 : 从图内存分配可以得出如下结论:  同一类的每个对象有不同的成员变量存储空间。

    75510编辑于 2022-05-10
  • 来自专栏Python程序员杂谈

    webpy 源码分析概览

    今天花了点时间把看了web.py的代码分析了一遍,稍稍的总结成一个图片,供有兴趣的人参考。 原因 在开始之前先来说下分析它代码的原因,昨天是打算给wechat这个项目加上异常处理,可是发现在服务器返回400错误之后,客户端获取到得responseText和我服务器端定义的不一样,我服务器端是这么返回错误的 源码分析开始 不管目的是什么,反正最后还是把关键代码通读了下,整理成下面这个,不是很详细,但对于想分析的人来说应该会有些帮助: .. image:: http://the5fireblog.b0.upaiyun.com 顺着再往下看 CherryPyWSGIServer 是继承自HTTPServer的。

    89730发布于 2019-03-01
  • 来自专栏育种数据分析之放飞自我

    GWAS分析中QQ和曼哈顿如何看?

    大家好,我是邓飞,GWAS分析应该是可视化最靓的仔了,五颜六色,形状各异,真叫人眼花缭乱,看了又看。 GWAS最直观的结果,就是曼哈顿,看一下GWAS分析是否理想,就是看有没有点超过了阈值线,类似鲤鱼跃龙门,我们希望它有,但也不希望它太多! QQ和曼哈顿是嘛意思? GWAS分析中,会有一个结果,每个SNP的P值,可以根据这个值,以及SNP的染色体和物理位置,进行作图。 常见的是QQ和曼哈顿。 所以,好的GWAS分析,有结果的QQ,都是前期在直线上,后面上翘。有点翘的QQ才是好的QQ。 GWAS分析中,原理就是SNP位点和控制性状的基因存在LD状态,即SNP的分型可以代表基因的不同分型,所以,真实的显著位点应该是在基因两侧分布的,有一个上升和下降的趋势,比如这样的: 「坏的曼哈顿

    2.7K30编辑于 2022-12-13
  • 来自专栏机器之心

    关于算法 & 分析的基础知识概览

    今天内容很多,坐稳~ 目录 算法 & 分析 基础知识 连通与非连通 未加权与加权 有向与无向 非循环和循环 算法 & 分析 分析使用基于的方法来分析连接的数据。 我们可以:查询数据,使用基本统计信息,可视化地探索、展示,或者将信息预处理后合并到机器学习任务中。的查询通常用于局部数据分析,而计算通常涉及整张和迭代分析算法是分析的工具之一。 算法提供了一种最有效的分析连接数据的方法,它们描述了如何处理以发现一些定性或者定量的结论。算法基于图论,利用节点之间的关系来推断复杂系统的结构和变化。 分析算法具有广泛的应用潜力:从防止欺诈,优化呼叫路由,到预测流感的传播。

    3.5K30发布于 2019-05-17
  • 来自专栏程序员千羽

    Java性能分析之火焰

    火焰来了 Java性能分析火焰是什么? java性能分析火焰的所做的事情就是能够分析出java程序运行期间存在的性能问题,因为某段代码拖慢整个程序执行是不允许的,因此靠火焰的绘制和分析就可以找出类似的“问题代码段”。 那么这个是怎么来的呢? 首先跟大多数监控系统一样,数据采集+前端绘图,这个也是根据某些数据绘制而成的,绘图工具本篇文章采用FlameGraph,而负责收集这些数据的工具,这里采用async-profiler,这个工具会在程序运行期间向 生成火焰 接下来就可以慢慢进行性能分析

    1.8K20发布于 2021-01-14
  • 来自专栏C/C++基础

    维诺分析与实现

    1.问题描述 1.1 定义 维诺(Voronoi Diagram)又叫泰森多边形或 Dirichlet ,由两邻点连线的垂直平分线组成的连续多边形构成。 2.算法分析与设计 Voronoi 有着按距离划分邻近区域的普遍特性,应用范围广。生成 V 的方法很多,常见的有分治法、扫描线算法和Delaunay三角剖分算法。 遍历结束,所有维诺边被找到,根据边画出维诺。 2.2 生成 Delaunay 三角网 建立Voronoi的关键是Delaunay三角网的生成。 ; // 构造外接圆圆心以及半径 voronoi.circle_center(centerPoint, site1, site2,site3,ref radius); } } 2.4 复杂度分析 3.实验结果 随机生成点: 生成 Delaunay 三角形网: 生成 Voronoi : 生成 Voronoi 的可执行程序和源码工程文件见 here。

    1.3K00编辑于 2024-05-24
  • 来自专栏又见苍岚

    OpenCV 图像分析之 —— 积分

    积分是一种允许子区域快速求和的数据结构,本文记录 OpenCV 图像分析中的 积分 相关内容。 积分 使用积分是数字图像处理中常用的一种方法,通常能够很大程度的加速计算过程,比如均值滤波,非局部均值滤波,以及Harr计算等。 OpenCV 实现 通过 OpenCV 的cv2.integral()函数,你可以轻松地计算积分。 OpenCV支持积分的三种变体,分别是总和、平方求和以及倾斜求和。 times (H+1)$, float64 格式 tilted 对旋转了45度的图像进行积分 $(W+1)\times (H+1)$,int32 或 float32 float64 格式 sdepth 正常和倾斜的积分输出深度 , cv2.CV_32S, cv2.CV_32F, 或 cv2.CV_64F sqdepth 平方的积分输出深度,cv2.CV_32F, 或 cv2.CV_64F 示例代码 map = np.ones

    2.3K10编辑于 2022-08-09
  • 来自专栏Python in AI-IOT

    Python数据分析--雷达

    最近阅读学习了林骥老师的《数据化分析 Python 实战》,书中讲好的技能应该刻意的练习,而不是简单的重复。 林骥老师将数据可视化分析源代码分享在他的GitHub空间https://github.com/linjiwx/mp 引用林骥老师关于雷达的使用场景: 雷达的背景一圈一圈地像雷达,用多边形来展现数据的大小 endpoint=False) # 增加第一个 angle 到所有 angle 里,以实现闭合 angles = np.concatenate((angle, [angle[0]])) # 倒转顺序,以让雷达顺时针显示 set_thetagrids(angles*180/np.pi, labels=label) ax2.set_thetagrids(angles*180/np.pi, labels=label) # 画雷达

    1.7K10编辑于 2022-04-25
  • 来自专栏PowerBI x Python

    对比分析之【雷达

    ---- 突然浏览到上图,用雷达来衡量一个人各方面的能力——这在体育和游戏网站上非常常见。毫无疑问,我们也可以借鉴做到Power BI的对比分析里。于是就有了下图的方案。 左侧是筛选器(金额单位、时间、行业类别、公司)+公司logo,右侧是雷达。多维度的雷达里包含了ROA、ROE、营收等常见的财务分析指标。 由于Power BI里没有原生雷达,需要在AppSource上搜。关键字是Radar,搜“雷达”无效。结果有三个,用法大同小异,本文用的是第二个。

    1.6K10发布于 2021-08-31
  • 来自专栏Python in AI-IOT

    Python数据分析--子弹

    最近阅读学习了林骥老师的《数据化分析 Python 实战》,书中讲好的技能应该刻意的练习,而不是简单的重复。 林骥老师将数据可视化分析源代码分享在他的GitHub空间https://github.com/linjiwx/mp 子弹,它的样子有点像子弹,能够表达比较丰富的信息,例如表现好、中、差的取值范围,并突出显示实际值与目标值的差异情况 image.png 林老师GitHub子弹代码如下: # 导入所需的库 import numpy as np import matplotlib as mpl import matplotlib.pyplot ax.spines['bottom'].set_visible(False) ax.spines['left'].set_visible(False) # X 轴的刻度线朝内,调整线条的长度,让其贴近条形 family':'SimHei', 'color':'#00589F', 'size':15} # 标示制图的作者信息 ax2.text(1, 0.2, ' 制图:林骥\n' + r'$@$' + '数据化分析

    71230编辑于 2022-04-20
  • 来自专栏Python in AI-IOT

    Python数据分析--斜率

    最近阅读学习了林骥老师的《数据化分析 Python 实战》,书中讲好的技能应该刻意的练习,而不是简单的重复。 林骥老师将数据可视化分析源代码分享在他的GitHub空间https://github.com/linjiwx/mp 斜率,可以快速展现两组数据之间各维度的变化,特别适合用于对比两个时间点的数据。 斜率的优势,是能快速看到每个类别前后发生的变化,并能根据线条的陡峭程度,直观地感受到变化的幅度。 df.values fig, axes=plt.subplots(2,3,figsize=(4, 6)) fig.set_facecolor('w') axes=axes.flatten() # 画斜率

    1.3K30编辑于 2022-04-22
  • 来自专栏芒果先生聊生信

    差异分析,oncomine做热

    数据库做基因组学的分析(机制一); STRING互作和GO/KEGG分析探讨可能的信号通路(机制二); TISIDB/TIMER分析肿瘤免疫特征(机制三)。 前面说过,生信分析的实验只是开源数据的分析、整合,复现是学习生信论文技能的最好方式。基因的差异表达是首要任务。差异分析最好的工具就是ONCOMINE和R语言分析GEO或TCGA数据库的数据。 ? ONCOMINE数据库的全景热和散点图是最常见的。怎样才能做出文章能用的类似图形呢? 这里涉及很多步骤,比如注册ONCOMINE数据库(已经介绍),怎样搜索做出ONCOMINE数据库的全景热(这次介绍),怎样使用PPT做表做。这里,我们选取数据少点的举例作图,掌握方法是关键。 这个是可编辑的,以后统计其他家族基因可以复制应用。 ? 当然,oncomine数据库的功能很多,转录水平的差异分析只是其中的一部分功能而已。

    2.1K20发布于 2020-07-07
  • 来自专栏Python in AI-IOT

    Python数据分析--哑铃

    最近阅读学习了林骥老师的《数据化分析 Python 实战》,书中讲好的技能应该刻意的练习,而不是简单的重复。 林骥老师将数据可视化分析源代码分享在他的GitHub空间https://github.com/linjiwx/mp 首先介绍哑铃: 哑铃,是指用一条横线连接两个点、看起来有点像哑铃的,主要是用来强调从一个点到另一个点的变化 < 0].iloc[:, 1], ymax=df[df['变化']< 0].iloc[:, 2], color=c['浅蓝色'], zorder=1, lw=5,label='下降') # 绘制哑铃两头的圆点

    2.4K51编辑于 2022-04-20
  • 来自专栏软件方法

    门诊挂号分析序列

    (464***03) 2012-04-23 10:08:04 潘老师,麻烦看一下这个分析序列对不对 ? Tomcat (25***495) 2012-04-23 10:32:47 两个? 3504847) 2012-04-23 10:32:53 右键点竖条,Start new activation... (464***03) 2012-04-23 10:33:14 是不是要画一个新的业务序列

    79710发布于 2021-01-29
  • 来自专栏全栈程序员必看

    路径分析「建议收藏」

    路径分析步骤 3.1 安装和加载程序包,及数据读取 install.packages(“ggplot2”) install.packages(“plspm”) install.packages .1 <- rda(DATA ~ TOC + TN + NH4N +NO3N+ NO2N + TP + PO43P, data = DATA) vif.cca(spe.1)‍‍ 3.4 路径分析 (sat_pls)‍ ##Outer Model结果中Loading需大于0.7;根据结果逐步去除每个模块中Loading值小于0.7的变量,直至所有变量Loading > 0.7,重新运行路径分析模型 中的总效应柱状依次复制到4.1路径的AI画板中,各柱状设置为上边缘对齐; 柱状图中横坐标修改为对应模块名称,并将柱状颜色修改为与路径4.2中相对应的颜色; 柱状的x和y轴坐标刻度数字字体大小设置为 学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组” 点击阅读原文 版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。

    2.3K10编辑于 2022-09-28
  • 来自专栏Python in AI-IOT

    Python数据分析--堆叠

    最近阅读学习了林骥老师的《数据化分析 Python 实战》,书中讲好的技能应该刻意的练习,而不是简单的重复。 林骥老师将数据可视化分析源代码分享在他的GitHub空间https://github.com/linjiwx/mp 堆叠条形,用于展示不同类别之间占比数据,常常能起到很好的对比效果。 0, np.sum(data, axis=1).max()) # 定义颜色 category_colors = [ c['蓝色'], c['浅蓝色'], c['浅橙色']] # 画堆叠水平条形

    1.2K10编辑于 2022-04-24
  • 来自专栏育种数据分析之放飞自我

    基因型数据绘制PCA和聚类分析

    下面看一下利用基因型SNP数据进行PCA计算,以及可视化的分析。 很多软件可以分析PCA,这里介绍一下使用plink软件和R语言,进行PCA分析,并且使用ggplot2绘制2D和3D的PCA。 绘制后的如下: 2-D PCA: 图片解释,将每个品种用不同的颜色表示,同时绘制置信区间圆圈,X坐标是PC1,解释24.9%的变异,Y坐标是PC2,解释10.61%的变异。 然后使用R语言,计算PCA,并绘制PCA。 lty.hide=2,lty.grid = 2) legend("topright",c("A","B","C"),fill=c('red','green',"blue")) 聚类分析思路 如果进行GWAS分析,PCA加进去就很有必要!

    3.5K41发布于 2021-11-26
  • 来自专栏马超的博客

    无向环路子分析与虚拟子生成

    Here's the table of contents: 无向环路子分析与虚拟子生成 •ONgDB数据库集成APOC和OLAB-APOC组件•使用函数分析无向环路返回布尔值•使用过程分析无向环路返回路径节点序列 ID•通过一组节点序列生成查询环路的CYPHER•通过一组节点序列查询环路•分析的环路并查询环路•返回一个原子性ID•JSON-STRING封装•获取所有顶点路径•分析的环路并查询环路之后生成虚拟图 CALL olab.schema.all.path(graphData) YIELD loopResultList RETURN loopResultList AS allPath •执行结果 十、分析的环路并查询环路之后生成虚拟图 案例实现了完整的分析过程,对输入的原始子寻找无向环路,并以虚拟图的方式返回结果。 首先加载一个子,使用olab.schema.loop对子的无向环路进行分析生成路径节点序列列表,列表中每一个元素就是一条完整的环路。

    1.1K10编辑于 2022-07-04
  • 来自专栏医学和生信笔记

    单基因差异分析并绘制火山和热

    介绍下绘制火山和热的方法,如何在火山或者热图中标记特定的基因,顺便学习下EnhancedVolcano包绘制火山。 前面已经介绍了单基因富集分析:单基因富集分析 数据准备 使用TCGA黑色素瘤的转录组数据,使用easyTCGA,1行代码下载,即可得到6种表达矩阵和临床信息,而且是官网最新的数据: library(easyTCGA 然后进行差异分析,这里也是用easyTCGA1行代码解决: sample_group <- ifelse(expr["HOPX",] > median(t(expr["HOPX",])), "high" 绘制火山需要差异分析的结果,我们再增加一列信息展示这个基因是上调、下调还是没意义。 首先是准备热需要的数据,其实就是表达矩阵的可视化而已。

    1.1K21编辑于 2023-08-30
领券