首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏R语言及实用科研软件

    🤗 Harmony | 超好用的单细胞测序数据合并3和5数据合并)(二)

    1写在前面 上一期我们介绍了常用的三种合并datasets的方法: Harmony; rliger; Seurat。 本期我们继续介绍其中的harmony包,如何用于3'和5'数据合并。 rliger) library(RColorBrewer) library(tidyverse) library(reshape2) library(ggsci) library(ggstatsplot) 3示例数据 4初步合并 4.1 简单合并 这里我们先用merge将2个数据集简单合并在一起。(这里我们默认做过初步过滤了哈,具体的大家可以看一下上期的教学。) verbose = F) pbmc_harmony <- RunUMAP(pbmc_harmony, reduction = "pca", dims = 1:30, verbose = F) 5harmony合并数据 5.1 合并前 harmony合并前,PCA明显分离。

    1.4K10编辑于 2023-02-24
  • 来自专栏R语言及实用科研软件

    🤗 Rliger | 超好用的单细胞测序数据合并3和5数据合并)(三)

    1写在前面 之前我们介绍了常用的三种合并datasets的方法: Harmony; rliger; Seurat。本期我们继续介绍其中的rliger包,如何用于3'和5'数据合并。 rliger) library(RColorBrewer) library(tidyverse) library(reshape2) library(ggsci) library(ggstatsplot) 3示例数据 4初步合并 4.1 简单合并 这里我们先用merge将2个数据集简单合并在一起。(这里我们默认做过初步过滤了哈,具体的大家可以看一下第一期的教学。) 这里需要跟大家说下,rlinger在ScaleData时没有将数据中心化,我们需要设置为F。 pbmc_liger) pbmc_liger <- ScaleData(pbmc_liger, split.by = "orig.ident", do.center = F) ---- 4.3 合并数据

    92620编辑于 2023-02-24
  • 来自专栏R语言及实用科研软件

    🤗 Seurat | 超好用的单细胞测序数据合并3和5数据合并)(一)

    1写在前面 随着scRNAseq技术的普及,成本的降低,大家可以在公共数据库找到越来越多的datasets,但如何合并这些datasets就成为了一个大问题,比较推荐的方法包括: Harmony; rliger 我们常见的2种应用场景就是: 3'和5'不同datasets的合并; 整合只有部分重叠的datasets,(举个栗子:全血scRNAseq数据3'PBMC数据合并。 rliger) library(RColorBrewer) library(tidyverse) library(reshape2) library(ggsci) library(ggstatsplot) 3示例数据 查看信息 这个时候我们看一下合并后的pbmc_seurat数据,我们拥有了两个assay,intergated和RNA。 合并后,PCA结果完美重叠。

    2K11编辑于 2023-02-24
  • 来自专栏单细胞天地

    Seurat4.0系列教程3合并数据

    在此,我们将合并两个 10X PBMC 数据集:一个包含 4K 细胞,一个包含 8K 细胞。数据集可以在这里[1]找到。 首先,我们在数据中读入并创建两个Seurat对象。 Seurat对象 要合并两个以上的对象,只需将多个对象的向量传递到参数中即可:我们将使用 4K 和 8K PBMC 数据集以及我们以前计算的 2,700 PBMC的Seurat 对象来演示此情况。 library(SeuratData) InstallData("pbmc3k") pbmc3k <- LoadData("pbmc3k", type = "pbmc3k.final") pbmc3k " "4K" "8K" table(pbmc.big$orig.ident) ## pbmc3k PBMC4K PBMC8K ## 2638 4340 8381 基于标准化数据合并 默认情况下,将基于原始计数矩阵合并对象, 如果你想合并标准化的数据矩阵以及原始计数矩阵,则应这样做,添加merge.data = TRUE。

    8.6K51发布于 2021-07-02
  • 来自专栏技术路漫漫

    GeoJson数据合并

    本文主要是基于geojson-merge,实现多个geojson文件合并为一个geojson文件,以便实现基于该文件进行数据分析展示 geojson合并概述 当前在 datav的geoatlas中,可以下载单个地市或区县的数据 库: npm i @mapbox/geojson-merge 支持两种方式进行合并 方式1-文件方式合并 该方式是每个geojson文件作为数组,传入到merge方法中进行合并,具体如下: var geojsonUtil 此处返回的是JSONStream对象 var mergeStream = geojsonUtil.mergeFeatureCollectionStream(fileNames); // 直接文件方式合并结果会导致一部分数据丢失 console.log("json文件合并完毕"); }); 注意:当前将福建省各个地市文件合并后,得到的结果会出现一部分数据丢失 方式2-内存数据合并 更推荐的一种方式是,将所有json文件读取到内存中 datas.push(JSON.parse(fs.readFileSync(fileDir + file.name, "utf8"))); } }); // merge之后得到的是json对象,写入数据文件时需要通过

    4.3K00发布于 2020-06-19
  • 来自专栏素质云笔记

    R语言数据合并数据增减、不等长合并

    sort 升序排列元素 rev 反转所有元素 order 获取排序后的索引 table 返回频数表 cut 将数据分割为几部分 split 按照指定条件分割数据 rbind 行合并 cbind 列合并 merge 按照指定列合并矩阵或者数据框 一、数据合并 1、merge()函数 最常用merge()函数,但是这个函数使用时候这两种情况需要注意: 1、merge(a,b),纯粹地把两个数据集合在一起 rbind()按照横向的方向,或者说按行的方式将矩阵连接到一起 rbind/cbind对数据合并的要求比较严格:合并的变量名必须一致;数据等长;指标顺序必须一致。 四、不等长合并 1、plyr包 rbind.fill函数可以很好将数据进行合并,并且补齐没有匹配到的缺失值为NA。 #————————————————————————————不等长合并 #如何解决合并数据不等长问题——两种方法:do.call函数以及rbind.fill函数(plyr包) #rbind.fill函数只能合并数据框格式

    14.7K12发布于 2019-05-28
  • 来自专栏java编程那点事

    合并数据

    如同ProtocolBuffer,Avro,Thrift一样,Parquet也是支持元数据合并的。用户可以在一开始就定义一个简单的元数据,然后随着业务需要,逐渐往元数据中添加更多的列。 在这种情况下,用户可能会创建多个Parquet文件,有着多个不同的但是却互相兼容的元数据。Parquet数据源支持自动推断出这种情况,并且进行多个Parquet文件的元数据合并。 因为元数据合并是一种相对耗时的操作,而且在大多数情况下不是一种必要的特性,从Spark 1.5.0版本开始,默认是关闭Parquet文件的自动合并数据的特性的。 可以通过以下两种方式开启Parquet数据源的自动合并数据的特性: 1、读取Parquet文件时,将数据源的选项,mergeSchema,设置为true 2、使用SQLContext.setConf // 一个是包含了name和age两个列,一个是包含了name和grade两个列 // 所以, 这里期望的是,读取出来的表数据,自动合并两个文件的元数据,出现三个列,name、age、grade /

    1.3K10编辑于 2023-02-25
  • 来自专栏数据小魔方

    数据透视表多表合并|字段合并

    今天要跟大家分享的内容是数据透视表多表合并——字段合并! 因为之前一直都没有琢磨出来怎么使用数据透视表做横向合并(字段合并),总觉得关于表合并绍的不够完整,最近终于弄懂了数据透视表字段合并的思路,赶紧分享给大家! 数据仍然是之前在MS Query字段合并使用过的数据; 四个表,都有一列相同的学号字段,其他字段各不相同。 建立一个新工作表作为合并汇总表,然后在新表中插入数据透视表。 Ctrl+d 之后迅速按p,调出数据透视表向导 选择多重合并计算选项: ? 选择自定义计算字段 ? 分别添加三个表区域,页字段格式设置为0(默认)。 ? 此时已经完成了数据表之间的多表字段合并! ? 相关阅读: 数据透视表多表合并 多表合并——MS Query合并报表

    8.9K80发布于 2018-04-10
  • 来自专栏明明如月的技术专栏

    文件切割合并器 3 合并类Merge

    javax.swing.JOptionPane; import javax.swing.JPanel; import javax.swing.JTextField; //用于切割后的文件合并 InitFrame{ private static final long serialVersionUID = 1L; public Merge() { super("文件合并 ; JOptionPane.showConfirmDialog(Merge.this, label_result,"文件合并-打开目录", JOptionPane.INFORMATION_MESSAGE =1) { JLabel label_result = new JLabel("无配置信息,或者配置信息不唯一,无法合并文件!!") ; JOptionPane.showConfirmDialog(Merge.this, label_result,"文件合并-错误提示", JOptionPane.INFORMATION_MESSAGE

    74140发布于 2021-08-27
  • 来自专栏python3

    python3 图片横向合并

    安装必要库 pip install Pillow 代码 import os import glob import time from sys import argv from PIL import Image # 多少张图片合成一张 merge_count = 2 merge_queue = [] min_width = 9999999 min_height = 99999999 if len(argv) <= 1: exit() if not os.path.exists("output")

    74610发布于 2020-01-02
  • 来自专栏全栈程序员必看

    m3u8文件合并 app(m3u8合并失败)

    电脑端合成m3u8方法 利用.bat文件 步骤如下 手机端 PC端 利用.bat文件 bat文件是dos下的批处理文件。批处理文件是无格式的文本文件,它包含一条或多条命令。 步骤如下 手机端 从Quark下载高清视频又时是采用了m3u8格式存储。 首先下载一款缓存视频合并的APP,成功合成 若提示有失效文件,再采用PC端方法。 缓存视频合并APP展示: PC端 从Quark文件找到缓存文件发送到电脑。 在文件中建立文本文件(.txt)。 打开文本文件输入 // 文件有后缀的 copy/b(空格)*.ts(空格)需要建立合并视频文件名.ts; // 文件无后缀的,直接去掉后缀即可 copy/b(空格)*(空格)需要建立合并视频文件名; 4 .保存文本文件,并将后缀名.txt修改为.bat 5.点击运行 6.运行问题修改 // 文件有后缀的(此段文字可不复制) copy/b(空格)*.ts(空格)需要建立合并视频文件名.ts

    4.3K10编辑于 2022-07-28
  • 来自专栏快乐学Python

    Pandas DataFrame 数据合并、连接

    在此典型情况下,结果集的行数并没有增加,列数则为两个元数据的列数和减去连接键的数量。 DataFrame中用作 连接键的列名 left_index:使用左则DataFrame中的行索引做为连接键 right_index:使用右则DataFrame中的行索引做为连接键 sort:默认为True,将合并数据进行排序 False可以提高性能 suffixes:字符串值组成的元组,用于指定当左右DataFrame存在相同列名时在列名后面附加的后缀名称,默认为('_x','_y') copy:默认为True,总是将数据复制到数据结构中 ;大多数情况下设置为False可以提高性能 indicator:在 0.17.0中还增加了一个显示合并数据中来源情况;如只来自己于左边(left_only)、两者(both) merge一些特性示例: ): 其中参数的意义与merge方法基本相同,只是join方法默认为左外连接how=left 1.默认按索引合并,可以合并相同或相似的索引,不管他们有没有重叠列。

    4.6K50发布于 2019-06-27
  • 来自专栏完美Excel

    Excel应用实践14:合并多个工作簿中的数据—示例3

    本例中,要合并的工作簿放置在同一文件夹中,为方便描述,这些工作簿名称和其要合并数据工作表如下(假设要合并的工作簿有3个): “工作簿1.xlsm”中的工作表“完美Excel” “工作簿2.xlsm”中的工作表 “excelperfect” “工作簿3.xlsm”中的工作表“微信公众号” 这些工作表都有相同的列标题,但是数据行数不同。 要求: 1.将这些工作簿中的工作表合并到名为“合并.xlsm”工作簿的工作表“数据”中。 2.在“合并.xlsm”工作簿工作表“数据”的列F中,放置对应行数据来源工作簿工作表名,例如如果数据行2中的数据来自工作表“完美Excel”,则在该行列F单元格中输入“完美Excel”。 3.要合并的工作簿工作表,例如工作簿1.xlsm中的“完美Excel”数据发生变化后,在“合并.xlsm”工作表中运行代码后,会清除“数据”工作表中原先的数据并重新合并上述工作簿中的工作表数据

    2.6K40发布于 2019-07-19
  • 来自专栏全栈程序员必看

    python 数据合并函数merge( )

    b 3 4 b 4 df2 key value2 0 a 0 1 c 1 2 c 2 3 c 3 4 c 4 pd.merge(df1,df2) ##以df1、df2中相同的列名key进行连接,默认 a 2 3 b 3 4 b 4 df4 rkey data2 0 a 0 1 c 1 2 c 2 3 c 3 4 c 4 pd.merge(df3,df4,left_on=’lkey’,right_on=’rkey’) ### 内连接,默认how=’inner’ lkey (np.arange(12).reshape(3,4),index=list('abc'),columns=['v1','v2','v3','v4']) df6=pd.DataFrame(np.arange (12,24,1).reshape(3,4),index=list('abd'),columns=['v5','v6','v7','v8']) df5 v1 v2 v3 v4 a 0

    1.8K10编辑于 2022-08-10
  • 来自专栏不积跬步无以至秃顶

    数据拆分、合并思路(Java)

    (IOException e) { throw new RuntimeException(e); } return BaseResponse.success("导入成功"); 查询: 这里需要把数据库查到的季度数据合并为年度数据 ,难点在于如何分页,如何在不需要知道该年有几条数据的前提下把查到的数据合并. 我的思路是根据项目和年份分组,再通过mysql的GROUP_CONCAT()函数合并数据 SELECT a.project_id,a.project_name,a. `quarter` 合并前的数据长这个样子: 合并后的数据长这个样子: GROUP_CONCAT()函数返回的字段类型是String,这里拿到数据后,需要用到String类的方法split(","),该方法会以形参中指定的字符分割字符串 ,并返回一个String[],拿到数据后遍历数据,填充数据,即可实现数据合并.

    78760编辑于 2023-08-30
  • 来自专栏Reinvent Data Science

    Milvus 数据合并机制

    大量零碎的数据段有两个明显缺点: 不利于元数据管理,对 SQLite/MySQL 的访问频繁 索引过于分散,影响查询的性能 因此 Milvus 后台落盘任务会不断地把这些小数据合并成大数据段,直到合并后的数据段大小超过 | 旧版本合并机制的缺点 在 0.9.0 版本以前,数据段的合并策略是简单粗暴的:先从元数据拿到一批需要被合并数据段,然后循环遍历合并。如下图所示: ? 假设拿到 7 个数据段: 1. 从第一个开始合并到第三个,segment_8 已经超过 1024MB 的大小,就停止对 segment_8 的合并; 2. 接着从第四个合并到第六个,合并为 segment_9; 3. 合并的时候,仅对层内数据段进行合并,这样就避免了小数据段和大数据段的合并,减少磁盘写入量,减少过大的临时文件。那么我们来看一下在上一节的场景下,使用新的合并策略后,磁盘的使用量有没有缓解: ? 可以看到,三次插入和合并操作完成后,数据合并为 segment_6,但 segment_1 没有参与合并,其他四个数据段被标记为软删除。磁盘占用量为 100MB+8KB,磁盘写入数据量为 8KB。

    1.3K10发布于 2020-07-14
  • 来自专栏数据小魔方

    数据透视表多表合并

    今天跟大家分享有关数据透视表多表合并的技巧! 利用数据透视表进行多表合并大体上分为两种情况: 跨表合并(多个表在同一工作薄内) 跨工作薄合并(多个表分别在不同工作薄内) 跨表合并(工作薄内表合并) 对于表结构的要求: 一维表结构 列字段相同 无合并单元格 在弹出的数据透视表向导中选择多重合并计算数据区域,点击下一步。 选择创建自定义字段,继续点击下一步。 ? 在第三步的菜单中选定区域位置用鼠标分别选中四个表的数据区域(包含标题字段)。 ---- 跨工作薄合并(多个表分别在不同工作薄内) 对于表结构的要求: 一维表结构 列字段相同 无合并单元格 本案例所用到的数据结构如下: 一共有四张表分布于两个工作薄 分布结构: 西区销售——四川| 合并步骤: 与工作薄内的表间合并差不多,首先插入——数据透视表向导(快捷键:Alt+d,p) 选择多重合并计算字段——创建自定义字段。 ? 将两个工作薄中的四张表全部添加到选定区域。 ? ?

    14K40发布于 2018-04-10
  • 来自专栏全栈程序员必看

    m3u8合并解密 TS视频文件分片合并解密

    m3u8合并解密 TS视频文件分片合并解密 支持QQ、UC浏览器等缓存视频合并解密(此软件免费使用) qq群:1062927028 图片: 合并解密成功 TS是日本高清摄像机拍摄下进行的封装格式 m3u8是一个TS切片列表文件,它记录视频的每个切片的时长与顺序,m3u8是一种文本文件,非视频文件,是UTF-8编码格式的文本文件,可以用文本编辑器打开如下: #EXTM3U #EXT-X-TARGETDURATION 8.341667, file:///storage/emulated/0/QQBrowser/视频/.437d2301016a6559213c05495aad48f8/2.ts 加密后的ts文件不能直接合并或播放 ,需要使用key对每个ts文件进行合并解密。

    6.6K50编辑于 2022-09-07
  • 来自专栏大数据开发

    数据开发-HBase合并

    当HBase合并时,会清空以下三种数据 1.标记为删除的数据。 当我们删除数据时,HBase并没有把这些数据立即删除,而是将这些数据打了一个个标记,称为“墓碑”标记。 如果列族中设置了TTL过期时间,则在合并的过程中,发现过期的数据将被删除。 3.版本合并 若版本号超过了列族中预先设定的版本号,则将最早的一条数据删除。 HB1SD.png 三、HBase合并分类 aHR0cHM6Ly9ub3RlLnlvdWRhby5jb20veXdzL3B1YmxpYy9yZXNvdXJjZS9iYWJkYTc5NzhiMDQxNTgzM2E1NmYyNjVjN2FlNzdkOC94bWxub3RlLzUzQ0FFRTVBRTUwNzQwQzJCNzEyOTY0NTUxRTk5RjczLzYyNTI4 (3)手动触发 1.由于很多业务担心MajorCompaction影响读写性能,所以选择在低峰期手动触发合并。 2.当用户修改表结构后,希望立刻生效,则手动触发合并3.运维人员发现硬盘空间不够,则会手动触发合并,因为删除了过期数据,腾出空间。

    1.1K21发布于 2021-05-10
  • 来自专栏Python与Excel之交

    EXCEL小技巧,3秒进行多表合并

    前言 压身小技不定期更新一个小技能哦~ 在办公工作中一些让人快捷又便利的小技巧~ Hi~又隔着屏幕见面了! 有份不知道来历的成绩工作簿,里面包括语文、数学、英语等9科成绩表。 现需要在总分工作表B2:

    40720发布于 2021-08-05
领券