首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏PyStaData

    PythonforResearch | 2_数据处理

    ], 'col2': [5,6,7,8]} df = pd.DataFrame(data=d) df col1col2015126237348 d = [(1, 2 ,3 ,4), (5, 6, 7 , 8)] df = pd.DataFrame(data=d) df 01230123415678 由字典创建 d = {'row1': [1,2,3,4], 'row2': [5,6,7,8]} ,'col3','col4'] df col1col2col3col4row25678row311121314 df.rename(columns={'col1' : 'column1', 'col2 ' : 'column2'}) column1column2col3col4row25678row311121314 使用df.rename()是复制后修改,不会对原来的 df 覆盖。 df = df.rename(columns={'col1' : 'column1', 'col2' : 'column2'}) #or df.rename(columns={'col1' : 'column1

    4.5K30发布于 2020-08-17
  • 来自专栏生信小驿站

    数据处理神器tidyverse(2)ggplot2

    数据处理神器tidyverseggplot2 ? tidyverse包其中包含着一个重要的可视化包---ggplot2。 Ggplot2是由Hadley Wickham制作的数据可视化软件包,它基于一组称为图层的原则。 基本思想是ggplot2将数据的几何对象(圆圈,线条等),主题和比例放在上面。 在这里,你可以通过总结每年的预期寿命并将结果输入ggplot而不必定义任何中间变量来对dplyr操作与ggplot2进行一些巧妙的组合。 continent year avg_lifeExp ## <fct> <int> <dbl> ## 1 Africa 1952 39.1 ## 2 自定义ggplot2 虽然我们在这里保留了默认的ggplot2功能,但是你可以用ggplot2来做很多事情。 例如,通过练习,您将学习如何通过将多个层组合在一起来生成高度自定义的绘图。

    2.9K30发布于 2019-08-29
  • 来自专栏数据科学(冷冻工厂)

    单细胞Seurat - 数据处理 (2)

    默认情况下Seurat每个数据集返回 2,000 个特征。这些将用于下游分析,例如 PCA。 pbmc), 10) # plot variable features with and without labels plot1 <- VariableFeaturePlot(pbmc) plot2 <- LabelPoints(plot = plot1, points = top10, repel = TRUE) plot1 + plot2 缩放数据 接下来,我们应用线性变换(“缩放”),这是 ## PC_ 2 ## Positive: CD79A, MS4A1, TCL1A, HLA-DQA1, HLA-DQB1 ## Negative: NKG7, PRF1, CST7, GZMB GNLY ## Negative: LTB, IL7R, CKB, VIM, MS4A7 VizDimLoadings(pbmc, dims = 1:2, reduction = "pca")

    76910编辑于 2024-02-22
  • 来自专栏python3

    Python 数据处理2

    ("sheet5") sheet2 = excel.add_sheet("sheet2") sheet3 = excel.add_sheet("sheet3") sheet1.write(0,0,"hello  world") sheet2.write(1,0,"hello") sheet3.write(2,0,"test test") excel.save("hello1.xlsx") 执行结果: ? 合并多个pdf文件为一个pdf文件 安装pypdf2 # pip install pypdf2 import PyPDF2 import os # 建立一个装pdf文件的数组 xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx )      os.chdir(r"C:\Users\Shinelon\PycharmProjects\Python3\datachuli\aminglinux") pdfWriter = PyPDF2. PdfFileWriter()  # 生成一个空白的pdf文件 for pdf in pdfFiles:     pdfReader = PyPDF2.PdfFileReader(open(pdf, 

    84920发布于 2020-01-10
  • 来自专栏全栈程序员必看

    2×3方检验prism_SPSS之方检验

    那么什么是方检验呢? 01 方检验的定义 方检验是一种极为典型的对总体分布进行检验的非参数检验方法。用于检验数据是否与某种概率分布的理论数字相吻合,进而推断样本数据是否来自该分布的问题。 2. 在主对话框中,单击【选项】按钮,打开图2所示的【方检验:选项】对话框。 图2 在该对话框中可以定义所输出的统计量和缺失值的处理方式。 在该例中,方检验的原假设为10个数字出现的概率之间无显著性差异。 操作步骤 (1) 打开数据文件。 (2) 对数据进行加权,从菜单栏选择【数据】→【加权个案】命令,打开【加权个案】对话框。 结果解读 表1 描述性统计量表 表2 期望频率和观测频率表 表2显示出各个分组的观测频率和期望频率以及两者之间的差值,从表中可以看出,期望频率为80.5,Residual代表的是残差,最大残差为10.5 表3 方检验表 表3中x2=4.627,渐进方法的概率p值为0.866,远大于显著性水平0.05,因此可以接受原假设,证明该20面体是均匀的。

    3.6K00编辑于 2022-08-29
  • 来自专栏python3

    2-3 选项控件

    2-3 选项控件 u本节学习目标: n了解选项控件的基本属性 n掌握如何设置选项控件的属性 n掌握统计页面选项控件页面基本信息 n掌握选项控件的功能操作控制 2-3-1 简介 在 Windows 一般选项卡在Windows操作系统中的表现样式如图2-3所示。 ? 图2-3 图片框控件的属性及方法 2-3-2 选项控件的基本属性 图片框控件是使用频度最高的控件,主要用以显示窗体文本信息。 其基本的属性和方法定义如表2-3所示: 属性 说明 MultiLine 指定是否可以显示多行选项。如果可以显示多行选项,该值应为 True,否则为 False。 使用这个集合可以添加和删除TabPage对象 表2-3 选项控件的属性 2-3-3 选项控件实践操作 1. 图2-4 设置tabControl控件的属性 ? 图2-5 设置tabControl控件的属性完成效果图 接下来,设置选项的提示信息,即当鼠标移动到某个页面后,弹出提示信息。

    2.1K10发布于 2020-01-07
  • 来自专栏编程

    Python数据处理2)-NumPy的ndarray

    2.基本属性:shape和dtype ndarray对象包括了两个最基本的属性,一个是shape(表示各维度大小),一个是dtype(表示数组数据类型)。

    1.1K50发布于 2018-02-02
  • 来自专栏气象学家

    Satpy基础系列教程(2)-TROPOMI L2数据处理

    y2 = np.meshgrid(np.arange(xmin,xmax+dx,dx)-dx/2. .pcolormesh(x2,y2,z) ax3.axis([x2.min(),x2.max(),y2.min(),y2.max()]) # using the boundaries gives correct plot ax4.set_title("Correct ticks") ax4.pcolormesh(x2,y2,z) ax4.axis([x2.min(),x2.max(),y2.min(),y2. Fig 2. = plt.subplot(2, 2, 2, projection=projection) add_province(ax2, provinces, west, east,

    2.8K32发布于 2020-02-26
  • 来自专栏云深之无迹

    Sony RX100M2(黑2)multiport端口

    在我网上冲浪的时候,我看见一个商品里面的介绍,居然有我以前的黑2,这里就做一番探索。 多功能的拍摄手柄 好像有2 我去找了一下这个接口,嘿,还真的支持 黑有6代,可以看看各代之间的区别 RX100M4 实现了 4K 超采样短片、高速慢动作短片、高速连拍、无畸变电子快门 4 大特性 一张黑1拍摄的照片 黑不适合作为第一部摄影入门相机。 但是当你腻了了那种镜头换换换 又虚化 又星空又长曝的看似自己是个摄影家的行为… 你就值得拥有黑。 黑是一种生活。 黑像个玩具,更令人放松,自然。 不要再拿黑比什么底了… 现在我连GoPro的视频截图都能接受了…还提什么虚化 色彩 高感…而恰恰gopro拿出来的照片是单反永远拍不到的。 一个玩具,一种生活方式而已… https://service.sony.com.cn/DI/i-Manual/DSC-RX100M2/cs/contents/01/index.html M2的说明书

    43330编辑于 2022-03-07
  • 来自专栏全栈程序员必看

    SD MMC MS TF

    SD的技术是基于MultiMedia(MMC)格式上发展而来,大小和MMC差不多,尺寸为32mm x 24mm x 2.1mm。 SD与MMC保持着向上兼容,也就是说,MMC可以被新的SD设备存取,兼容性则取决于应用软件,但SD却不可以被MMC设备存取。 Mini SD MiniSD由松下和SanDisk共同开发。 Mini SD只有SD37%的大小,但是却拥有与SD存储一样的读写效能与大容量,并与标准SD完全兼容,通过附赠的SD转接还可当作一般SD使用 TF(Micro SD) 又称T-Flash 是一种超小型(11*15*1MM),约为SD的1/4,可以算目前最小的储存了。TF是小卡,SD是大卡,都是闪存的一种。TF卡尺寸最小,可经SD转换器后,当SD使用。 MMC MMC(Multimedia Card) 翻译成中文为“多媒体”。是一种快闪存储器标准。

    4.7K20编辑于 2022-09-03
  • 来自专栏AIUAI

    Caffe2 - (十八) 图片数据处理函数

    Caffe2 - 图片数据处理函数 Caffe2 提供了对图片进行加载、裁剪、缩放、去均值、batch 等处理的函数 - helper.py. ## @package helpers # Module caffe2.python.tutorials.helpers from __future__ import absolute_import from __future__ import division import skimage.transform def crop_center(img, cropx, cropy): y, x, c = img.shape startx = x // 2 - (cropx // 2) starty = y // 2 - (cropy // 2) return img[starty:starty + cropy, startx:startx .swapaxes(0, 1) return img def bgr(img): # switch to BGR img = img[(2, 1, 0), :, :]

    517100发布于 2019-02-18
  • 来自专栏Vincent-yuan

    java之struts2数据处理

    这里的数据处理,指的是页面上的数据与Action中的数据的处理。 struts2中有3种方式来接收请求提交的数据。分别是:属性驱动方式、对象驱动方式、模型驱动方式 1. return msg; } public void setMsg(String msg) { this.msg = msg; } } struts2会做基本的数据类型转换 2.对象驱动方式 在servlet处理中,获取表单项的值后,需要手动创建对象。 在struts2中,提供了一种对象驱动方式,可以直接在Action处理类中获取对象,不再需要手动创建对象。 所以,strut2提供了模型驱动。 模型驱动综合了属性驱动和对象驱动的优点,但是模型驱动具有侵入性。 使用模型驱动处理类,需要实现 ModelDriven 接口 。 一般都是在对象驱动和模型驱动中选择 补充: 响应数据 在页面中获取struts2的响应数据有2个要点:   1.获取的数据必须是处理类的属性,并且提供了get/set 方法   2.在页面中可以通过 el

    55520发布于 2019-09-10
  • 来自专栏测试开发干货

    面试复习系列【python-数据处理-2

    知道为什么我要单独拿出2章来给大家普及numpy和pandas么? 因为,在不久的将来,我即将更新ai测试领域的具体应用教程,这算是给大家提前打打基础,扫扫盲。 import pandas as pd s = pd.Series([1,2,3,4,5]) 这个运行后,我们打印s,得到的结果是这样的:左边第一列是行标,第二列开始是内容 我们也可以创建个多列的, s = pd.Series({"a":1,"b":2}) print(s) 结果如下: 但是这样创建看起来就不舒服,所以我们用DataFrame方法来创建。 = pd.Series({"a":1,"b":2},index=["a","b"]) 创建复合型序列 df = pd.DataFrame({'a':1,"b":pd.Series([1,2,3]),"c ) print(df) #查看内容 print(df.describe) #查看统计 print(df.head(2)) #查看头部2行 print(df.tail(2)) #查看倒数2行 print(

    1.2K30编辑于 2022-05-20
  • 来自专栏算法channel

    2数据处理的小功能,非常实用!

    :A列值大于其平均值,且 B列值大于 5 的行 方法 1 df[ (df['A'] > df["A"].mean()) & (df['B'] > 5)] 注意,& 前后必须要各自加一对 () 方法 2 cr1 = df['A'] > df["A"].mean() cr2 = df['B'] > 5 df[cr1 & cr2] 方法 3 mean = df["A"].mean() df.query("

    45240发布于 2020-05-08
  • 来自专栏数据分析1480

    R&Python Data Science 系列:数据处理2

    承接R&Python Data Science 系列:数据处理(1)继续介绍剩余的函数。 ,在构建评分woe赋值的时候特别好用。 2.2 case_when函数 用于多条件赋值,评分Woe赋值的时候使用起来很方便。 (2) diamonds3 = diamonds >> tail(3) diamonds2 >> bind_rows(diamonds3) ? R语言实现 ##bind_rows()函数 diamonds2 = diamonds %>% head(2) diamonds3 = diamonds %>% tail(3) diamonds2 %>%

    1.1K10发布于 2019-10-28
  • 来自专栏数据科学(冷冻工厂)

    CUT&Tag 数据处理和分析教程(2

    /tools/FastQC/fastqc -o ${projPath}/fastqFileQC/${histName} -f fastq ${projPath}/fastq/${histName}_R2. histName}/*_R1_*.fastq.gz >${projPath}/fastq/${histName}_R1.fastq.gz cat ${projPath}/data/${histName}/*_R2_ *.fastq.gz >${projPath}/fastq/${histName}_R2.fastq.gz

    38110编辑于 2025-03-06
  • 来自专栏全栈程序员必看

    方检验x2什么意思_方检验和方差分析

    x2检验(chi-square test)或称方检验 x2检验(chi-square test)或称方检验,是一种用途较广的假设检验方法。 按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本题x2=10.01即x2>x20.001 通过实例计算,读者对方的基本公式有如下理解:若各理论数与相应实际数相差越小,x2值越小;如两者相同,则x2值必为零,而x2永远为正值。 又因为每一对理论数和实际数都加入x2值中,分组越多,即格子数越多,x2值也会越大,因而每考虑x2值大小的意义时同时要考虑到格子数。因此自由度大时,x2的界值也相应增大。 α=0.05 2.计算x2值 3.确定P值和分析 本题v=(2-1)(4-3)=3,据此查附表20-1: x20.01(3)=11.34,本题x2=15.08,x2>x20.01

    6.7K20编辑于 2022-09-20
  • 来自专栏算法channel

    玩转Pandas,让数据处理更easy系列2

    正是通过这两个强大的数据结构和基于它们建立的各种操作,才使得Pandas称霸数据处理领域工具库,关于这篇请参考: 玩转Pandas,让数据处理更easy系列1 02 DataFrame结构剖析 因为DataFrame 接下来,创建一个pd_data,分别作如下操作: #创建pd_data,values是二维list,index默认(0,1,2,...) ,columns: ['A','B','C'] pd_data = pd.DataFrame([ [4, 9, 1], [3, 5, 2] ], columns = list('ABC') ) ?

    74830发布于 2018-07-25
  • 来自专栏全栈程序员必看

    cf,mmc,sd,sm,xd,记忆棒的区别是什么?

    小(是CF卡尺寸的1/5左右),外形尺寸只有32mm×24mm×1.4mm,而其重量不超过2g。 大小犹如一 张邮票的SD记忆,重量只有2克,但却拥有高记忆容量、快速数据传输率、极大的移动灵活性以及很好的安全性。 (SD外型采用了与MMC厚度一样的导轨式设计,以使SD设备可以适合MMC) SD接口除了保留MMC的7针外,还在两边加多了2针,作为数据线。 采用了NAND型Flash Memory,基本上和SmartMedia的一样,平均数据传输率能达到2MB/s。 袖珍的外形尺寸,外形尺寸为 20mm×25mm×1.7mm,总体积只有0.85立方厘米,约为2克重,是目前世界上最为轻便、体积最小的数字闪存

    4.3K30编辑于 2022-09-01
  • 来自专栏单细胞天地

    数据处理基础—ggplot2了解一下

    5.8 ggplot2简介 5.8.1 什么是ggplot2 ggplot2是由Hadley Wickham设计的R软件包,它有助于数据绘图。在本实验中,我们将简要介绍该软件包的一些功能。 如果您想了解更多关于如何使用ggplot2的信息,我们建议您阅读Hadley Wickham撰写的“ggplot2 Elegant graphics for data analysis”。 , seq(1, 10, 2)] + 3 test[11:20, seq(2, 10, 2)] = test[11:20, seq(2, 10, 2)] + 2 test[15:20, seq(2, 10 , 2)] = test[15:20, seq(2, 10, 2)] + 4 colnames(test) = paste("Cell", 1:10, sep = "") rownames(test) 让我们尝试将基因聚类的数量设置为2: pheatmap(test, kmeans_k = 2) ?

    2.3K30发布于 2020-03-31
领券