首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 10X HD数据分析进行COMMOT信号流分析

    作者, Evil Genius今天我们更新一个简单的内容,10X HD分析COMMOT。 读取数据,我们读取16um的数据import commot as ctimport scanpy as scimport pandas as pdimport numpy as npadata = sc.read_visium var: 'gene_ids', 'feature_types', 'genome' uns: 'spatial' obsm: 'spatial'超过13万的spot,1万8的基因数量简单的数据分析 , adata.var.highly_variable]sc.tl.pca(adata, svd_solver='arpack')sc.pp.neighbors(adata, n_neighbors=10 sc.pl.spatial(adata,color = 'leiden')plt.savefig('sample.HD.spatial.png',bbox_inches = 'tight')配受体,我们就跑前10

    29420编辑于 2025-03-06
  • 来自专栏数据的力量

    数据分析师必需具备的10分析思维

    该思维方法的关键是:建立长远目标、全局观念、整体概念、完整地分析数据,不做井底之蛙。 三、下切思维 数据是一个过程的结果反映,怎样通过看数据找到更多的原因以及隐藏在现象背后的真相,需要我们下切思维,把事物切细了分析,把过程拆分细了分析。 此时关键是要知道数据的构成、分解数据的手段、对分解后的数据的重要程度的了解。也就是说那些数据需要分解分析? 这也如同显微镜原理 四、求同思维 当一堆数据摆在我们面前时,表现出各异的形态,然而我们却要在种种的表象背后,找出其有共同规律的特点。关键是找到共性的东西进行分析,还要客观。 八、离开思维 通过,数据分析,你发现你处在一个不太有利的地位,那么,此时,你就要有离开思维去替你想办法,离开困境。关键是学会自我调节,自我放松。实际情况如:遇到难解的结,你怎么办?

    1.1K30发布于 2018-06-20
  • 来自专栏PPV课数据科学社区

    数据分析师必需具备的10分析思维

    该思维方法的关键是:建立长远目标、全局观念、整体概念、完整地分析数据,不做井底之蛙。 三、下切思维 数据是一个过程的结果反映,怎样通过看数据找到更多的原因以及隐藏在现象背后的真相,需要我们下切思维,把事物切细了分析,把过程拆分细了分析。 此时 关键是要知道数据的构成、分解数据的手段、对分解后的数据的重要程度的了解。也就是说那些数据需要分解分析? 这也如同 显微镜原理 四、求同思维 当一堆数据摆在我们面前时,表现出各异的形态,然而我们却要在种种的表象背后,找出其有共同规律的特点。 关键是找到共性的东西进行分析,还要客观。 八、离开思维 通过,数据分析,你发现你处在一个不太有利的地位,那么,此时,你就要有离开思维去替你想办法,离开困境 。 关键是学会自我调节,自我放松。 实际情况如:遇到难解的结,你怎么办?

    97970发布于 2018-04-20
  • 课前准备----10X HD数据基础分析

    作者,Evil Genius现在我们的课程来到HD的分析阶段了。 重要的放前面,为了提高下游分析的灵敏度和精度,建议使用SpotClean调整spot swapping,这有助于减少由于附近点的bleed导致的点交换污染,从而提高分析的准确性。 10X HD默认输出8um、16um bin数据,如果需要调整,比如调整到20 um的精度,需要用到参数visium的捕获策略。HD的捕获策略大家能找到其中所有的不同吗? Space Ranger分析HD数据的前准备,图像校准选择Visium HD Manual Alignment上传图片(注意这是cytoassist生成的图片,非常大)选择芯片信息确定锚点识别核心的三个锚点调整基准点 非常大)For H&E images, as in this case, select brightfield.标记landmarks确保准确度通常情况需要设置5-8个标记评估匹配度输出比对文件结束进行数据分析输入文件

    40220编辑于 2024-08-14
  • 来自专栏CDA数据分析师

    【干货】数据挖掘的10分析方法

    其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。 它是一种监督式学习的方法,它广泛的应用于统计分类以及回归分析中。支持向量机将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面。 将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。 10.CART:分类与回归树 CART,ClassificationandRegressionTrees。在分类树下面有两个关键的思想。 第一个是关于递归地划分自变量空间的想法;第二个想法是用验证数据进行剪枝。

    2K80发布于 2018-02-11
  • 来自专栏嵌入式音视频

    AI数据分析-数据可视化模块

    NumPy(Numerical Python) 是科学计算基础库,提供大量科学计算相关功能,比如数据统计,随机数生成等。 Numpy 是 Python 语言在科学计算领域取得成功的关键之一,如果想通过 Python 语言学习数据科学、人工智能(包括深度学习、语言处理等分支),就必须学习 Numpy。 pip 命令安装Numpy,语法格式如下: pip install numpy ---- 【示例1】 测试 numpy 模块安装是否成功 import numpy as np a=np.arange(10 as np x=np.arange(0,6,dtype=int) print(x) 执行结果如图 ---- 【示例 7】arange()函数指定起始值、终止值及步长 x=np.arange(10,20,2 print(x) 执行结果如图 ---- 【示例8】arange()函数创建二维数组 b=np.array([np.arange(1,4),np.arange(4,7),np.arange(7,10

    96320编辑于 2023-03-16
  • 来自专栏林德熙的博客

    win10 UWP 九幽数据分析

    九幽数据统计是统计和分析数据来源,用户使用,先申请账号 http://www.windows.sc 创建应用 图片要72*72的,然后请看图片,记密钥 在项目Nuget进行搜索,然后下载安装 在App.xaml.cs

    62730发布于 2019-03-13
  • 来自专栏张俊红

    10周拿下数据分析师认证 !!

    真诚的向大家推荐,《腾讯课堂数据分析师认证课程》,该课程也是腾讯课堂指定认证课程。专为在校学生、0~3年职场新人量身定制,真正体系化、专业化帮大家提升数据分析能力,成为大厂抢手的数据分析人才。 10种商业模型 面对不同的场景,应用不同分析模型解决问题 5W2H分析模型、AARRR分析模型、RFM客户价值模型、A/B 测试模型、用户分成模型、SWOT分析模型、购物篮分析模型、波士顿矩阵分析、生命周期模型 》 专注于培养行业TOP10%的数据分析师 长按识别,添加课程老师微信 报名、课程咨询 《数据分析师认证课程》 专注于培养行业TOP10%的数据分析师 长按识别,添加课程老师微信 报名、课程咨询 终生学习辅导 主课程《10周成为数据分析师》,另外还附赠数据分析师高阶录播课程,覆盖0-8年数据分析师必备专业技能。 》 专注于培养行业TOP10%的数据分析师 长按识别,添加老师微信 报名、课程咨询

    87040编辑于 2022-04-21
  • 来自专栏Dance with GenAI

    AI数据分析:集中度分析和离散度分析

    在deepseek中输入提示词: 你是一个Python编程专家,要完成一个Python脚本编写的任务,具体步骤如下: 读取Excel表格:"F:\AI自媒体内容\AI行业数据分析\toolify月榜\toolify2023 2列第21行-31行; 然后按照上面的计算步骤一直计算到第15列第21行-31行; 计算第2列第1行(设为数据起点)到第15列第1行(设为数据终点)数据组的简单年均增长率,写入第16列第1行,然后计算第 2行,第3行数据,一直计算到第20行; 计算第2列第1行(设为数据起点)到第15列第1行(设为数据终点)数据组的复合年均增长率,然后计算第2行,第3行数据,一直计算到第20行; 注意:每一步都输出信息到屏幕 但是代码要整合在一起 计算复合年均增长率的时候,年数n是固定值:13 源代码: import pandas as pd import numpy as np # 读取Excel文件 file_path = "F:\\AI 自媒体内容\\AI行业数据分析\\toolify月榜\\toolify2023年-2024年月排行榜汇总数据.xlsx" df = pd.read_excel(file_path) # 计算第2列到第15

    35710编辑于 2024-06-24
  • 来自专栏山行AI

    PandasAI——让AI数据分析

    前言 PandasAI是一款数据分析领域的ChatGPT应用,本文对原项目进行翻译旨在进行知识科普和梳理。 这个项目的github地址为:https://github.com/gventuri/pandas-ai PandasAI Pandas AI 是一个 Python 库,它为 Pandas(一款流行的数据分析和操作工具 还可以看一下另一个有用的链接[10]。 PandasAI 设计用于与 Pandas 共同使用。 隐私和安全 为了生成运行的 Python 代码,我们取 dataframe 的head,将其随机化(对敏感数据使用随机生成,对非敏感数据进行打散)并只发送head。 PandasAI对象 我们主要关注一下它的run方法: 环境变量 由于需要借助LLM(大模型)的能力进行分析结果生成,这里需要设置LLM的API key。

    2.3K40编辑于 2023-06-14
  • 来自专栏Dance with GenAI

    AI数据分析:根据Excel表格数据进行时间序列分析

    ChatGPT中输入提示词: 你是一个Python编程专家,要完成一个Python脚本编写的任务,具体步骤如下: 读取Excel表格:"F:\AI自媒体内容\AI行业数据分析\toolify月榜\toolify2023 自媒体内容\AI行业数据分析”,图片标题为:2023年Top20 AI应用近一年的发展趋势; 显示图片; 注意:每一步都输出信息到屏幕 源代码: import pandas as pd import matplotlib.pyplot 自媒体内容\AI行业数据分析\toolify月榜\toolify2023年-2024年月排行榜汇总数据.xlsx' try: df = pd.read_excel(file_path) print("Excel ', ':', (0, (5, 10)), (0, (3, 5, 1, 5))] # 定义不同的虚线样式 # 绘制每条线 try: for i in range(len(y_data)): data_line 应用近一年的发展趋势') plt.xlabel('月份') plt.ylabel('月访问量') plt.legend() # 保存图片 output_dir = r'F:\AI自媒体内容\AI行业数据分析

    58410编辑于 2024-06-24
  • 来自专栏CDA数据分析师

    【干货】数据分析师必懂的10分析思维

    该思维方法的关键是:建立长远目标、全局观念、整体概念、完整地分析数据,不做井底之蛙。 三、下切思维 数据是一个过程的结果反映,怎样通过看数据找到更多的原因以及隐藏在现象背后的真相,需要我们下切思维,把事物切细了分析,把过程拆分细了分析。 此时 关键是要知道数据的构成、分解数据的手段、对分解后的数据的重要程度的了解。也就是说那些数据需要分解分析? 这也如同 显微镜原理 四、求同思维 当一堆数据摆在我们面前时,表现出各异的形态,然而我们却要在种种的表象背后,找出其有共同规律的特点。 关键是找到共性的东西进行分析,还要客观。 八、离开思维 通过数据分析,你发现你处在一个不太有利的地位,那么,此时,你就要有离开思维去替你想办法,离开困境 。 关键是学会自我调节,自我放松。 实际情况如:遇到难解的结,你怎么办?

    66970发布于 2018-02-11
  • 来自专栏GEE数据专栏,GEE学习专栏,GEE错误集等专栏

    AI Earth数据集——中国10米地物分类数据集(AIEC)

    AIEarth中国10米地物分类数据集(AIEC) 简介与Notebook示例¶ 达摩院AI Earth团队自研的中国区10m分辨率地物分类产品,数据包含2020-2022年中国逐年土地覆盖信息。 AI EarthSentinel地物分类中国年度产品 AI Earth中国10米地物分类数据集(AIEC)是一个用于地物分类的数据集。 该数据集包含了中国范围内的高分辨率遥感影像,并对影像中的地物进行分类。前言 – 人工智能教程 AIEC数据集的分辨率为10米,覆盖了中国的各个地区。 10 波段 名称 描述 最小值 最大值 Map 用地类型 1 9 土地分类 数值 类型 1 耕地 2 林地 3 草地 4 灌木 5 湿地 6 水体 7 人造地表 8 裸地 9 冰雪 数据检索 import AI Earth团队,数据版权归AI Earth所有,用户使用中请遵守AI Earth平台用户协议中相关条款。

    1.8K00编辑于 2024-05-24
  • 来自专栏PPV课数据科学社区

    【职业】数据分析师必懂的10分析思维

    该思维方法的关键是:建立长远目标、全局观念、整体概念、完整地分析数据,不做井底之蛙。 三、下切思维 数 据是一个过程的结果反映,怎样通过看数据找到更多的原因以及隐藏在现象背后的真相,需要我们下切思维,把事物切细了分析,把过程拆分细了分析。 此时 关键是要知道数据的构成、分解数据的手段、对分解后的数据的重要程度的了解。也就是说那些数据需要分解分析? 这也如同 显微镜原理 四、求同思维 当一堆数据摆在我们面前时,表现出各异的形态,然而我们却要在种种的表象背后,找出其有共同规律的特点。 关键是找到共性的东西进行分析,还要客观。 八、离开思维 通过数据分析,你发现你处在一个不太有利的地位,那么,此时,你就要有离开思维去替你想办法,离开困境 。 关键是学会自我调节,自我放松。 实际情况如:遇到难解的结,你怎么办?

    75940发布于 2018-04-18
  • AI 如何让数据管理效率提升 10 倍?

    从自然语言查询到智能运维,从跨域数据协作到实时决策支持,AI 正在重塑数据库的每一个细胞。本文将带你直击 2025 年最前沿的技术突破与行业实践,揭秘 AI 如何让数据管理效率提升 10 倍。 金融:从智能风控到精准定价 智能风控:某大型金融机构基于同城双活集群,通过实时分析用户行为数据,将欺诈识别准确率提升至 98%; 精准定价:某普惠金融平台采用智能数据库,数据处理时间压缩 70%,支撑百万级小微贷款的智能发放 零售:实时洞察与动态优化 供应链优化:某电商平台通过向量数据库实时分析用户浏览、购买数据,将库存周转率提升 25%,缺货率下降 15%; 个性化推荐:通过自然语言查询 “被点赞最多的商品前十名”,系统自动生成 全栈智能解决方案 领先的云数据库平台推出的Data Agent 系列,覆盖数据全生命周期: Data Agent for Analytics:用户只需描述需求,系统自动完成数据清洗、特征分析到可视化报告生成 ,效率提升 30%; 智能运维大脑:基于 10 万 + 工单经验,自动诊断 CPU、死锁等 8 类异常,实现 “问题发现 - 优化” 全链路自治。

    50410编辑于 2025-08-27
  • 来自专栏简说基因

    一键分析10X单细胞数据

    今天我们来介绍一种更为简单的方法:一键处理 10X 下机数据。 STARSolo 分析 10X 基因组学的 v3 化学版本数据。 可以看到,该流程主要调用 RNA STARSolo 进行数据处理,最后将 log文件和 gene counts 文件交给 MultiQC 进行汇总。 运行流程 运行流程非常简单,这也是一键分析的含义。 只需要设置: • 参考基因组(可以是服务器内置的,也可以是自己上传的) • GTF文件(可以自行上传,或使用平台提供的) • Barcode文件(来自于10X下机数据) • cDNA文件(来自于10X下机数据 如果下机数据有多条 Lane,可以直接使用 RNA STARsolo 工具进行分析: https://usegalaxy.cn > 工具 > RNA STARSolo

    35010编辑于 2025-01-08
  • 来自专栏CSDNToQQCode

    Python可视化数据分析10、Matplotlib库

    Python可视化数据分析10、Matplotlib库 前言 博客:【红目香薰的博客_CSDN博客-计算机理论,2022年蓝桥杯,MySQL领域博主】 ✍本文由在下【红目香薰】原创,首发于CSDN ✍ 2022年最大愿望:【服务百万技术人次】 Python初始环境地址:【Python可视化数据分析01、python环境搭建】  ---- 环境需求 环境:win10 开发工具:PyCharm Community Edition 2021.2 数据库:MySQL5.6 ---- 前置环境 pip3 config set global.index-url https://repo.huaweicloud.com 散点图可以提供两类关键信息: 特征之间是否存在数值或者数量的关联趋势,关联趋势是线性的还是非线性的 如果某一个点或者某几个点偏离大多数点,则这些点就是离群值,可以进一步分析这些离群值是否在建模分析中产生很大的影响 Y = np.arange(-2, 2, 0.1) # Y坐标数据 X, Y = np.meshgrid(X, Y) # 计算3维曲面分格线坐标 # 用于计算X/Y对应的Z值 def f(x,

    1.1K20编辑于 2022-11-30
  • 来自专栏数据科学(冷冻工厂)

    ChIP-seq 分析数据与Peak 基因注释(10

    数据 今天,我们将继续回顾我们在上一次中研究的 Myc ChIPseq。这包括用于 MEL 和 Ch12 细胞系的 Myc ChIPseq。 可在此处[1]找到 MEL 细胞系中 Myc ChIPseq 的信息和文件 可在此处[2]找到 Ch12 细胞系中 Myc ChIPseq 的信息和文件 在数据目录中,我们按照上一节中概述的处理步骤提供了来自 基因注释 由于转录因子,如名称所示,可能调节其靶基因的转录,我们使用 ChIPseeker 包将代表潜在转录因子结合事件的峰与其重叠或最接近的 mm10 基因相关联。 library(TxDb.Mmusculus.UCSC.mm10.knownGene) library(ChIPseeker) peakAnno <- annotatePeak(macsPeaks_GR annoDb="org.Mm.eg.db") peakAnno 这使我们能够生成峰及其预测目标基因的 GRanges 或数据框。

    66650编辑于 2023-03-21
  • 来自专栏Python大数据分析

    seaborn常用的10数据分析图表

    内置示例数据集 seaborn内置了十几个示例数据集,通过load_dataset函数可以调用。 其中包括常见的泰坦尼克、鸢尾花等经典数据集。 # 查看数据集种类 import seaborn as sns sns.get_dataset_names() import seaborn as sns # 导出鸢尾花数据集 data = sns.load_dataset sns.scatterplot import seaborn as sns sns.set() import matplotlib.pyplot as plt %matplotlib inline # 小费数据集 as sns sns.set() import matplotlib.pyplot as plt %matplotlib inline uniform_data = np.random.rand(10 inline titanic = sns.load_dataset("titanic") ax = sns.countplot(x="class", data=titanic) plt.show() 10

    92461编辑于 2022-04-03
  • 来自专栏Datawhale专栏

    10年学术论文的数据分析

    本文使用arXiv公开的论文数据集,聚焦2008年-2020年计算机各个方向论文数据,对其进行了数据探索性分析和可视化分析,什么是2020年最火的方向,排名前五的又是哪些呢? 一起来看看结论和数据分析过程。 1.3 取data的子集进行处理 抽取数据的5%进行分析,否则数据量太大,处理时间太长。 (89846, 10) 1.6 存储转换后的数据,后面可以直接进行读取 data_merge.to_csv('D:/Code/Github/data/data_subset_merge.csv',index = False) 二、 数据探索性分析 2.1 查看数据的缺失信息 可以看到group_name之后的部分列,都有缺失数据 data_merge.info() 2.2 统计不同大类的论文数量

    93720发布于 2021-01-20
领券