搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏生信课程note＋实验知识
TCGA分析-数据下载2
是TCGA分析-数据整理-2的上一步https://cloud.tencent.com/developer/article/2353514title: "xiaohe"output: html_documentdate 通过将 eSet 数据框中的第一列赋值给新的变量 eSet，可以方便地对这些数据进行后续的分析和处理。#上述代码提取表达矩阵，但是提取出来是0行，不存在。 #2.提取表达矩阵#clinical<- pData(eSet)#具体来说，pData()函数是从eSet中提取“数据”部分,即提取临床信息。 do.call(cbind,re)class(re2)## [1] "data.frame"exp=as.matrix(re2)#strsplit(fs, "_", simplify=T) 是将字符串 #2，函数会应用于矩阵的每一行（即，纵向）。
83320编辑于 2023-11-01
来自专栏生信课程note＋实验知识
TCGA分析-数据整理2
title: "三大R包差异分析"output: html_documenteditor_options: chunk_output_type: console1.三大R包差异分析rm(list = > logFC_t);table(k2)#> k2#> FALSE TRUE #> 4256 629DEG1$change = ifelse(k1,"DOWN",ifelse(k2,"UP", topTags(fit, n=Inf)class(DEG2)#> [1] "TopTags"#> attr(,"package")#> [1] "edgeR"DEG2=as.data.frame(DEG2 -06 0.0015882179k1 = (DEG2$PValue < pvalue_t)&(DEG2$logFC < -logFC_t)k2 = (DEG2$PValue < pvalue_t)&(DEG2 ="NOT"]cg2 = rownames(DEG2)[DEG2$change !="NOT"]cg3 = rownames(DEG3)[DEG3$change !
63210编辑于 2023-10-31
来自专栏python数据分析实践
python数据分析浅谈(2）
直接信息主要分析图表数值变化和趋势，潜在信息主要分析这种趋势的驱动因子。直接信息是数据分析的基础，潜在信息是区别数据分析水平高低的重要尺度。本节的主要内容：介绍数据分析中的一些“坑”，主要包括： 1）明确分析目的 2）数据质量管理和建议 3）统计模型选择与应用 4）关于显著性检验的提醒 01 时刻明确分析目的话听起来很简单，做起来可没那么容易 2）数据来源：对于直接从网上获取的数据，需要更加小心，了解我们该专业/行业的权威数据网站十分有必要。这里有几个方法可供参考：1）查找本领域的相关研究，他们大多都标注了数据来源，根据提供的信息直接查找即可。2）咨询他人以了解本领域常用的几个权威数据网站，并注意收藏。 2）数据适用性：就如1中所述，不同的模型对数据的要求也不同。
47610编辑于 2023-02-23
来自专栏R语言数据分析
表达芯片数据分析2
db) ls("package:hgu133plus2.db") #列出R包里都有啥 ids <- toTable(hgu133plus2SYMBOL) #把R包里的注释表格变成数据框}# 方法2 方法4 自主注释，了解一下#https://mp.weixin.qq.com/s/mrtjpN8yDKUdCSvSUuUwcA图片一个探针对应多个基因——非特异性探针需要去除；练习GSE42872下载数据并进行差异分析绘制火山图 ', getGPL = F)#网速太慢，下不下来怎么办#1.从网页上下载/发链接让别人帮忙下，放在工作目录里#2.试试geoChina,只能下载2019年前的表达芯片数据class(eSet)length step1output.Rdata")rm(list = ls()) load(file = "step1output.Rdata")# 1.Group----library(stringr)# 标准流程代码是二分组，多分组数据的分析后面另讲 ")###########################################rm(list = ls()) load(file = "step2output.Rdata")#差异分析library
75120编辑于 2023-09-27
来自专栏数据科学与人工智能
数据科学小技巧2：数据画像分析
阅读完本文，你可以知道： 1 利用pandas_profiling库生成数据画像 "对于AI，我们不去改变，我们就会改变。" 第二个数据科学小技巧：数据画像分析。我们使用pandas_profiling库可以快速地对原始数据进行画像和分析。一 notebook代码 ? 二运行结果数据画像报告包括五个部分第一部分：概况分析 ? 第二部分：变量分析 ? 第三部分：相关性分析 ? 第四部分：缺失值分析 ? 第五部分：抽样数据检视 ? 你若是想快速了解你的数据，并且数据规模不是很大，可以采用这种方法来解答。
96510发布于 2020-03-12
来自专栏人力资源数据分析
人力资源数据分析指南（2） - 数据分析基础
很多人觉得数据分析是一个很高深的技能，要学会数据分析好像要会很多专业的软件，然后要和很多的数字打交道，要逻辑感非常强，其实数据分析没有大家想象的那么复杂，通过学习你也可以学会人力资源的数据分析。首先我们对数据分析要有正确的认识： 1、不要为了分析而分析，需要给出结果很多人在做数据分析的时候追求那种美观的高大上的界面，把重点放在图表的美化，然后在数据的分析维度上，纯粹为了分析而分析 2、数据分析不是EXCEL，不是图表我们对数据分析的呈现一般是复杂的图表，美观的数据图，还有一些交互的操作，但是数据分析并不单单是这些，数据分析更加关注你的数据分析的思维，你对你分析内容的理解，你要通过你的分析给与结论和指引数据分析的类型 Types of data analysis ? 数据分析根据数据的类型分为3种， 1、基础信息类数据 2、职能业务数据分析 3、效能数据分析 ? 2、职能类数据这类数据主要是人力资源各个模块的动态数据，包含人员结构，人员流动，入离职，招聘，培训，薪酬等这些模块，然后以这些模块中的关键指标为基础，进行数据的分析。 ?
1K20发布于 2020-02-25
来自专栏SeanCheney的专栏
《Python数据分析》2nd
《Python数据分析》（Python for Data Analysis, 2nd Edition）第二版出了，目前还没有中文版，这版的代码适用于Python 3.6 。 PDF下载（英文）：https://github.com/iamseancheney/pythonbooks/blob/master/Python%20for%20Data%20Analysis%2C%
1.3K80发布于 2018-04-24
来自专栏程序员小王
Python数据分析之Matplotlib（2）
绘制折线图： import matplotlib.pyplot as plt x=range(2,26,2) y=[15,13,14.5,17,20,25,16,26,27,22,18,15] plt.plot import matplotlib.pyplot as plt x = range(2, 26, 2) y = [15, 13,14.5,17,20,25,26, 26, 27, 22, 18, 15] 所以需要第二步骤）【总结】方式二用时才设置，且不会污染全局字体设置，更灵活方式三、方式四不需要对字体路径硬编码，而且一次设置，多次使用，更方便）设置x y 轴的刻度间距： plt.xticks(range(2,25
88630发布于 2019-07-02
来自专栏Corley的开发笔记
Python数据分析实战（2）使用Pandas进行数据分析
文章目录一、Pandas的使用 1.Pandas介绍 group_by()的使用 2.使用Pandas进行College数据分析二、鸢尾花数据集分析 1.基础操作 2.数据分析三、电影评分数据分析一、Pandas的使用 1.Pandas介绍 Pandas的主要应用包括：数据读取数据集成透视表数据聚合与分组运算分段统计数据可视化对电影数据的分析：平均分较高的电影不同性别对电影平均评分 0 7 0 Name: C, dtype: int64 2.使用Pandas进行College数据分析新建college_data目录，下放College.csv如下： ? 963624318 在群文件夹Python数据分析实战中下载即可。由上处数据处理和分析的过程中可以看到，在数据处理过程中，合并、透视、分组、排序这四大类操作是最经常用的，需要熟练掌握。
4.6K30发布于 2020-08-26
来自专栏气象学家
数据集 | MERRA-2全球再分析数据集
导读 MERRA-2是一套长时间序列的在分析数据集，其中包括各种气象变量，像净辐射、温度、相对湿度、风速等。同时，MERRA-2数据覆盖全球，空间分辨率为0.5 ° x 0.625 °，时间分辨率为1小时。这种气象数据在定量遥感中的应用可以说是十分的广泛。我们今天就一块来看一下这种数据。 01 我们今天就把整理好的MERRA-2数据分享给大家，从1980年到2019年1月的数据，时间分辨率已经聚合成一天的。首先我们看一下MERRA-2的净辐射数据。 ? 这一景为MERRA-2一天的平均净辐射数据（也有一天的最大值和最小值），这个数据由于是采用同化算法计算得来的，所以全球没有空缺，是一个空间连续的数据。 02 我们再看一下全球的风速数据 ? 04 我们再来看一下MERRA-2官方网站上的一些根据MERRA-2数据做好的图。 ? ? MERRA-2数据分辨率比较粗，显示的时候就会看出来网格。
11.9K42发布于 2020-06-17
来自专栏锦小年的博客
Python数据分析(2)-pandas数据结构操作
pandas是一个提供快速、灵活、表达力强的数据结构的Python库，适合处理‘有关系’或者‘有标签’的数据。在利用Python做数据分析的时候，pandas是一个强有力的工具。 pandas库有两种数据结构，Series和DataFrame。前者适合处理一维数据，也就是单变量；后者适合分析多维数据，不过也仅仅只能是二维。 ] [ 8. 12. 1. 10. 12. 17. 4. 3. 13. 2. ] [ 5. 19. 8. 12. 15. 19. 10. 1. 3. 2. ] [ 2. 15. 4. 13. 10. 14. 1. 5. 5. 1.]] 2.
1.9K110发布于 2018-01-02
来自专栏GIS与遥感开发平台
数据集 | MERRA-2全球再分析数据集
导读 MERRA-2是一套长时间序列的在分析数据集，其中包括各种气象变量，像净辐射、温度、相对湿度、风速等。同时，MERRA-2数据覆盖全球，空间分辨率为0.5 ° x 0.625 °，时间分辨率为1小时。这种气象数据在定量遥感中的应用可以说是十分的广泛。我们今天就一块来看一下这种数据。 01 我们今天就把整理好的MERRA-2数据分享给大家，从1980年到2019年1月的数据，时间分辨率已经聚合成一天的。首先我们看一下MERRA-2的净辐射数据。这一景为MERRA-2一天的平均净辐射数据（也有一天的最大值和最小值），这个数据由于是采用同化算法计算得来的，所以全球没有空缺，是一个空间连续的数据。 04 我们再来看一下MERRA-2官方网站上的一些根据MERRA-2数据做好的图。 MERRA-2数据分辨率比较粗，显示的时候就会看出来网格。
7.4K40编辑于 2022-04-29
来自专栏数据科学（冷冻工厂）
ATAC-seq分析：数据介绍（2）
数据本教程中，我们将使用三组已发布的数据。 4.1. data_1 第一个数据集来自原始 ATACseq 论文[2]。我们将使用 ATACseq_50k_Rep2 示例 GEO - GSM1155958 可以从 ENA 以 FASTQ 格式获取数据。 SAMN02192806 - [here](https://www.ebi.ac.uk/ena/data/view/SAMN02192806 “SAMN02192806”) 4.2. data_2 对于第二个数据集我们还将使用对齐数据作为BAM[8] 文件，该文件可在此处找到。 5. 参考数据对于 ATACseq 分析，我们需要一些参考数据。下载上述文件并解压缩 ATAC_Workshop.zip 后，您应该将 Sorted_ATAC_50K_2.bam 和 Sorted_ATAC_50K_2.bam.bai 文件移动到 ATAC_Workshop
67320编辑于 2023-02-27
来自专栏音视频开发技术
ffplay源码分析2-数据结构
2. ，指向的数据区将被拷入SDL音频缓冲区。有多种策略可以用来区分空和满的标志： 1) 总是保持一个存储单元为空：“读指针”==“写指针”时为空，“读指针”==“写指针+1”时为满； 2) 使用有效数据计数：每次读写都更新数据计数，计数等于0 可以看到，FrameQueue使用上述第2种方式，使用FrameQueue.size记录环形缓冲区中元素数量，作为有效数据计数。按照这样的设计思路，如果rindex_shown为2，队列中就会保留最后2帧。但keep_last机制有什么用途呢？希望知道的同学指点一下。
1.5K20发布于 2019-04-02
来自专栏草根专栏
Python数据分析(二): Pandas技巧 (2)
数据的选取和索引 ? Pandas对数据的基本操作 ?
78260发布于 2018-03-01
来自专栏数据科学（冷冻工厂）
ATAC-seq分析：数据介绍（2）
我们将使用 ATACseq_50k_Rep2 示例 GEO - GSM1155958 可以从 ENA 以 FASTQ 格式获取数据。 SAMN02192806 - here4.2. data_2对于第二个数据集，我们将 UCSD 的 Bing Ren 生成的 ATACseq 作为 ENCODE 联盟的一部分。原始数据和处理后的 BAM 文件可从 ENCODEs 门户网站获得T-Reg - ENCSR724UJSFQ 文件可以在此处找到 read1 和此处的 read2。我们还将使用对齐数据作为BAM 文件，该文件可在此处找到。5. 参考数据对于 ATACseq 分析，我们需要一些参考数据。下载上述文件并解压缩 ATAC_Workshop.zip 后，您应该将 Sorted_ATAC_50K_2.bam 和 Sorted_ATAC_50K_2.bam.bai 文件移动到 ATAC_Workshop
1K40编辑于 2023-01-27
来自专栏数据科学（冷冻工厂）
空间转录组: DLPFC数据集分析 (2)
引言本系列讲解空间转录组学 (Spatial Transcriptomics) 相关基础知识与数据分析教程[1]，持续更新，欢迎关注，转发，文末有交流群！ getTopHVGs(dec, prop = 0.1) # number of HVGs selected length(top_hvgs) ## [1] 1424 降维接下来，我们使用主成分分析我们保留前 50 个主成分（PCs）以供后续下游分析。这样做既能减少噪声，也能提高计算效率。我们还在前 50 个 PCs 上运行 UMAP，并保留前 2 个 UMAP 成分用于可视化。 # update column names for plotting colnames(reducedDim(spe, "UMAP")) <- paste0("UMAP", 1:2) 聚类接下来， store cluster labels in column 'label' in colData colLabels(spe) <- factor(clus) 通过在X-Y空间中绘制群集标签，并与该数据集可用的手动注释参考标签
21210编辑于 2025-11-19
来自专栏生信菜鸟团
GEO数据分析流程之芯片2
今天的是三周合计15天的数据挖掘授课学员一点一滴整理的授课知识点笔记哦，还有互动练习题哈，欢迎大家点击文末的阅读原文去关注我们学员的公众号哦！ Group(实验分组)和ids(探针注释)rm(list = ls()) load(file = "step1output.Rdata")library(stringr)# 标准流程代码是二分组，多分组数据的分析后面另讲 :hgu133plus2.db")#看这个R包中有那些数据ids <- toTable(hgu133plus2SYMBOL)#提取R包中有用的信息，tablehead(ids)# 方法2 读取GPL网页的表格文件 str_detect(ids2$symbol,"///");table(k2) ids2 = ids2[ k1 & k2,] # ids = ids2#如果不用修改上面的内容，就直接ids=ids2 因子： Group factor(Group) #.变成因子后没有引号 #水平因子里面的取值，顺序重要，第一个位置上的是参考水平 # 应该让对照组在前，处理组在后，保证差异分析不反
36310编辑于 2024-06-28
来自专栏人人都是数据分析师
数据分析(2)|数据分析师应该如何构建指标体系
2为什么要搭建数据指标体系 2.1 搭建数据运营分析框架一个APP的构建与运营工作通常由多个角色分工实现，由于大家的工作重点不同，仅关注一个方面的数据就如同管中窥豹，无法全面了解产品运营情况，不能提出行之有效的分析建议（2）使用时长使用总时长是指在某一统计统计周期内所有从APP启动到结束使用的总计时长。使用时长还可以从人均使用时长、单次使用时长等角度进行分析。 ? 不同类型的推广方式，可从不同的维度做数据的分析。具体的分析方法与安卓是类似的，主要是分析活跃和留存数据。（2）页面访问路径分析主要是统计用户从打开应用到离开应用整个过程中每一步的页面访问和跳转情况。目的是达成App的商业目标，即引导用户更高效的完成App的不同模块的任务，最终促进用户付费。
1.3K30发布于 2021-05-13
来自专栏CDA数据分析师
数据分析，需要当心这2个误区
平时无论是进行用户调研、产品运营还是竞品分析，都少不了对于数据的分析，如果项目中出现某些分歧谁也无法说服谁时，很多时候也都是拿数据说话，可见在开发产品的时候，对数据的统计与分析十分重要。大家都说数据是客观的，但其实数据受背景环境、统计者、统计方法、分析者看法等多重因素影响，以致我们在统计和分析时却常常陷入误区，得不到正确的答案。下面简单说一下关于数据的两个常见误区。误区一：把某一类型数据当做全部数据，导致分析结果错误先说个小故事：二战时英国空军希望增加飞机的装甲厚度，但如果全部装甲加厚则会降低灵活性，所以最终决定只增加受攻击最多部位的装甲。这个故事里本应是对全部飞机进行分析，但统计样本没有包含已经损毁的飞机，所以得出的结论只是根据部分数据，或者说是根据具有同样特征（受伤）的某一类数据推论出的，并不能代表全部类型的数据，所以得出的结果很可能是错误的这一方面需要意识，在统计、分析数据时要时刻想着还有没有其他的情况，还有没有我们没有想到的数据类型，这些数据是不是能代表全部类型，尝试站在更高的角度去解读这些数据，而不是拿到数据后立刻就盲目分析。
719100发布于 2018-02-11

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

TCGA分析-数据下载2

TCGA分析-数据整理2

python数据分析浅谈(2）

表达芯片数据分析2

数据科学小技巧2：数据画像分析

人力资源数据分析指南（2） - 数据分析基础

《Python数据分析》2nd

Python数据分析之Matplotlib（2）

Python数据分析实战（2）使用Pandas进行数据分析

数据集 | MERRA-2全球再分析数据集

Python数据分析(2)-pandas数据结构操作

数据集 | MERRA-2全球再分析数据集

ATAC-seq分析：数据介绍（2）

ffplay源码分析2-数据结构

Python数据分析(二): Pandas技巧 (2)

ATAC-seq分析：数据介绍（2）

空间转录组: DLPFC数据集分析 (2)

GEO数据分析流程之芯片2

数据分析(2)|数据分析师应该如何构建指标体系

数据分析，需要当心这2个误区

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐