首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏二猫の家

    【GEE】2、探索数据

    2背景 要将遥感集成到您的研究和分析中,学习如何解析 Google 地球引擎上可用的大量栅格数据非常重要。了解这些数据的分类方式有助于开始此过程。 华盛顿和爱达荷州边界上的美国国家高程数据。 3图像采集探索 现在我们已经了解了我们可以使用的数据的深度和广度,我们可以花点时间详细探索一个集合。 在搜索栏中输入数据名称的结果。 如果我们点击数据的名称,我们会看到一个弹出窗口,其中包含一个“导入”按钮(以红色突出显示)。单击此按钮将自动将数据加载到脚本工作区中。 要查找我们数据的空间分辨率,请再次键入数据名称并单击搜索栏中的结果(即“MYD10A1.006 Aqua Snow Cover Daily Global 500m”)。 Google Earth Engine 中可用的一些数据可用于每日测量(即 MODIS),而其他数据可能是每月(即 WorldClim)。

    99041编辑于 2023-11-05
  • 来自专栏气象学家

    数据 | MERRA-2全球再分析数据

    导 读 MERRA-2是一套长时间序列的在分析数据,其中包括各种气象变量,像净辐射、温度、相对湿度、风速等。 同时,MERRA-2数据覆盖全球,空间分辨率为0.5 ° x 0.625 °,时间分辨率为1小时。这种气象数据在定量遥感中的应用可以说是十分的广泛。 我们今天就一块来看一下这种数据。 01 我们今天就把整理好的MERRA-2数据分享给大家,从1980年到2019年1月的数据,时间分辨率已经聚合成一天的。 首先我们看一下MERRA-2的净辐射数据。 ? 这一景为MERRA-2一天的平均净辐射数据(也有一天的最大值和最小值),这个数据由于是采用同化算法计算得来的,所以全球没有空缺,是一个空间连续的数据。 02 我们再看一下全球的风速数据 ? 04 我们再来看一下MERRA-2官方网站上的一些根据MERRA-2数据做好的图。 ? ? MERRA-2数据分辨率比较粗,显示的时候就会看出来网格。

    11.8K42发布于 2020-06-17
  • 来自专栏GIS与遥感开发平台

    数据 | MERRA-2全球再分析数据

    导读 MERRA-2是一套长时间序列的在分析数据,其中包括各种气象变量,像净辐射、温度、相对湿度、风速等。 同时,MERRA-2数据覆盖全球,空间分辨率为0.5 ° x 0.625 °,时间分辨率为1小时。这种气象数据在定量遥感中的应用可以说是十分的广泛。 我们今天就一块来看一下这种数据。 01 我们今天就把整理好的MERRA-2数据分享给大家,从1980年到2019年1月的数据,时间分辨率已经聚合成一天的。 首先我们看一下MERRA-2的净辐射数据。 这一景为MERRA-2一天的平均净辐射数据(也有一天的最大值和最小值),这个数据由于是采用同化算法计算得来的,所以全球没有空缺,是一个空间连续的数据。 04 我们再来看一下MERRA-2官方网站上的一些根据MERRA-2数据做好的图。 MERRA-2数据分辨率比较粗,显示的时候就会看出来网格。

    7.4K40编辑于 2022-04-29
  • 来自专栏一英里广度一英寸深度的学习

    深度学习入门数据--2.fasion-mnist数据

    Fasion-MNIST是一位老师推荐给我的,要求我在做完MNIST-handwriting数据之后,再玩一下fmnist。这个数据也是28*28的灰度图像,你可以从下面的图片看清图片内容。 这个数据是由一家德国的时尚科技公司Zalando提供的,我觉一家公司把定位成时尚科技公司,而不是电商平台,是把科技创新能力作为主要生产力。 本文主要用Keras编写模型,训练数据,并以清晰的可视化方式展示。 查看数据 数据可以从git仓库上下载,https://github.com/zalandoresearch/fashion-mnist fasion-mnist 作为tensorflow分类教程数据, colab.research.google.com/github/margaretmz/deep-learning/blob/master/fashion_mnist_keras.ipynb 运行以上程序,10分钟会验证准确率能达到

    2K20发布于 2019-03-06
  • 来自专栏生信技能树

    不同的GSE数据有不同的临床信息,不同的分组技巧

    但是不同的GSE数据有不同的临床信息,那么我们应该挑选合适的临床信息来进行分组呢? pData pd就是这个数据临床信息,查看后如下 ? 如何去冗余,见原文对表型数据框进行去冗余。 阅读文章后发现原文把样本分为2组:肿瘤与正常,而且总共只有43个样本,而临床信息有47个样本,说明有效信息列含有3个或3个以上元素,可以再缩小范围。 对数据框再用apply循环去查找文章作者是用哪一列来分组的 apply(pd1,2,table) ? 所以我们需要对数据取子集。

    10.7K33发布于 2019-11-11
  • 来自专栏GEE数据专栏,GEE学习专栏,GEE错误集等专栏

    GEE数据——Cloud Score+ S2_HARMONIZED数据

    Cloud Score+ S2_HARMONIZED数据是由统一的哨兵-2 L1C数据制作的,Cloud Score+的输出可用于识别相对清晰的像素,并有效去除L1C(大气顶部)或L2A(表面反射率 Cloud Score+ S2_HARMONIZED 数据包括两个质量保证波段,即 cs 和 cs_cdf,这两个波段都根据表面能见度在 0 和 1 之间的连续刻度上对单个像素的可用性进行评分,其中 前言 – 人工智能教程 Cloud Score+ S2_HARMONIZED集合中的图像与制作这些图像的单个哨兵-2 L1C资产具有相同的id和system:index属性,因此可以根据共享的system 整个哨兵-2 档案的 Cloud Score+ 回填工作目前正在进行中,随着新结果被添加到 Cloud Score+ 集合中,数据可用性日期将定期更新。 代码: // Harmonized Sentinel-2 Level 2A collection. var s2 = ee.ImageCollection('COPERNICUS/S2_SR_HARMONIZED

    54110编辑于 2024-02-02
  • 来自专栏GEE数据专栏,GEE学习专栏,GEE错误集等专栏

    NASA数据——对流层中的 AIRSAqua L2 CO2 数据

    AIRS/Aqua L2 CO2 in the free troposphere (AIRS+AMSU) V005 (AIRX2STC) 对流层中的 AIRS/Aqua L2 CO2 (AIRS+AMSU AIRS 二氧化碳(CO2)标准检索产品包括二氧化碳的检索估算值,以及与检索相关的误差估算值。与 AIRX2RET 不同,该标准产品的水平分辨率约为 110 公里(1x1 度)。 一个 AIRS 颗粒被设定为 6 分钟的数据,15 个跨轨道足迹,22 条沿轨道线。 由此产生的 AIRS 2 级产品包括这些云清除的红外辐射和大气温度 T(p)、水蒸气 H2O(p)和臭氧 O3(p)的检索剖面,名义空间分辨率为天底 45 公里。 Spatial Coverage:-180.0,-60.0,180.0,90.0 时间覆盖范围:2002-09-01 至 2012-03-02 文件大小:每个文件 0.4 MB 数据分辨率

    32700编辑于 2024-05-24
  • 来自专栏DrugOne

    Data | TrialBench:多模态 AI 可用的临床试验预测数据平台

    这一数据由香港科技大学(广州)陈晋泰助理教授联合南京大学符天凡副教授、IQVIA 、哈佛医学院等团队合作推出,构建了首个面向人工智能的多模态临床试验预测平台。 数据已向全球开放,研究者可通过以下链接获取和使用: https://huyjj.github.io/Trialbench/。 为什么要做这个平台? 平台亮点 TrialBench 汇集了 23 个子数据,覆盖 8 大预测任务,具体包括: 一、预测试验时长,即估计一项临床试验从开始到结束可能持续多久。 研究团队不仅设计了这些任务,还提供了基线模型、评价指标和多模态融合方法,确保数据“开箱即用”。 数据效果验证 Python与R包的使用 已有应用与验证 TrialBench 发布不久,已经被业界与学界关注并应用。

    26010编辑于 2025-10-14
  • 来自专栏智药邦

    多组学数据临床数据开发|DNAnexus完成2亿美元的H轮融资

    2022年3月8日,基于云的生物医学数据分析公司DNAnexus宣布完成一轮2亿美元的融资,以加快其技术的全球应用,将复杂的多组学和临床数据转化为切实的见解和个性化治疗。 DNAnexus提供技术和产品,以支持这个快速增长的生态系统,并从大量的基因组、多基因组和临床数据集中获得关键的洞察力。 在我们发展业务和支持我们的客户利用大规模临床、多组学数据产生的新一轮生物医学见解时,Blackstone 将是一个强大的合作伙伴。" DNAnexus 平台使生命科学行业能够从多组学、临床和表型数据中获得关键的见解,以加快新型疗法的开发和交付,使其更快、更经济地进入有需要的患者手中。 关于 DNAnexus 为改善人类健康状况,研究人员和临床医生需要获取复杂而敏感的生物医学数据和创新技术,以实现新颖的见解。然而,这些数据往往不兼容或难以处理。

    47620编辑于 2022-04-13
  • 来自专栏自然语言处理

    MMsegmentation教程 2: 自定义数据

    通过重新组织数据来定制数据 最简单的方法是将您的数据进行转化,并组织成文件夹的形式。 如下的文件结构就是一个例子。 通过混合数据去定制数据 MMSegmentation 同样支持混合数据去训练。 当前它支持拼接 (concat) 和 重复 (repeat) 数据。 重复数据 我们使用 RepeatDataset 作为包装 (wrapper) 去重复数据。 pipeline=train_pipeline ) ) 拼接数据2种方式去拼接数据。 pipeline=train_pipeline ) ) data = dict( imgs_per_gpu=2, workers_per_gpu=2, train = [

    1.2K42编辑于 2022-03-04
  • 来自专栏数据科学(冷冻工厂)

    空间转录组: DLPFC数据分析 (2)

    引言 本系列讲解 空间转录组学 (Spatial Transcriptomics) 相关基础知识与数据分析教程[1],持续更新,欢迎关注,转发,文末有交流群! 我们还在前 50 个 PCs 上运行 UMAP,并保留前 2 个 UMAP 成分用于可视化。 "UMAP" dim(reducedDim(spe, "PCA")) ## [1] 3614 50 dim(reducedDim(spe, "UMAP")) ## [1] 3614 2 # update column names for plotting colnames(reducedDim(spe, "UMAP")) <- paste0("UMAP", 1:2) 聚类 接下来, store cluster labels in column 'label' in colData colLabels(spe) <- factor(clus) 通过在X-Y空间中绘制群集标签,并与该数据可用的手动注释参考标签

    15810编辑于 2025-11-19
  • 来自专栏AIUAI

    Caffe2 - (十)训练数据创建

    Caffe2 - 训练数据创建 caffe2 使用二值 DB 存储模型训练的数据,以 key-value 格式保存, key1 value1 key2 value2 key3 value3 buffer: 记录 Tensors,也叫多维数组(multi-dimensional arrays, together),tensor 数据类型及数据 shape 信息. 以 UCI Iris 数据为例,Iris 花朵分类数据,其包括 4 种实值特征来表示花,对三种类型的花进行分类. 数据格式: 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2 将数据放入 Caffe2 DB,key - train_xxx,value - 使用 TensorProtos 来存储每个数据样本的两个 tensor,feature 和 label. # 测试 # 从

    78420发布于 2019-02-18
  • 来自专栏Tom

    基于CelebA数据的GAN模型-2

    前两篇我们介绍了celeB数据 CelebA Datasets——Readme 基于CelebA数据的GAN模型 直接上代码咯 导入依赖: # example of a gan for generating model.add(Conv2D(128, (5,5), strides=(2,2), padding='same')) model.add(LeakyReLU(alpha=0.2)) # downsample to 10x10 model.add(Conv2D(128, (5,5), strides=(2,2), padding='same')) model.add(LeakyReLU model.add(Conv2DTranspose(128, (4,4), strides=(2,2), padding='same')) model.add(LeakyReLU(alpha=0.2 1=0.5) model.compile(loss='binary_crossentropy', optimizer=opt) return model 加载我们上一篇文章写到的numpy压缩数据包点

    81520编辑于 2023-02-14
  • 来自专栏paddle深度学习

    paddle深度学习2 数据的构建

    在深度学习中,无论是做哪项任务,图像、文本或是声音,都涉及到数据的处理,而数据通常包含在数据集中paddle当中有两个重要的类是和数据相关的:Dataset和DataLoader【Dataset】它位于 paddle.io.Dataset,用于定义数据这里只介绍它的__getitem__和__len__两个方法1. 当我们使用索引操作符 [] 时,实际上是调用了 __getitem__ 函数__getitem__ 函数接收一个索引作为参数,并返回对应索引位置的数据样本2. 它定义了获取数据长度的行为下面的代码使用Dataset定义了一个基础的数据:import paddleclass MyDataset(paddle.io.Dataset): def __init shuffle=True)for batch in dataloader: print(batch)可以看到,因为设置batchsize=2,每次会取出2数据而shuffle=True使得数据的顺序被打乱了这里显示我们的数据类型是

    49710编辑于 2024-05-17
  • 来自专栏GEE数据

    Landsat 8 C2 RAW 数据

    数据名称: Landsat8_C2_RAW 数据来源: USGS 时空范围: 2020年1月-2023年3月 空间范围: 全国 数据简介: Landsat8_C2_RAW数据是经过缩放和校准的辐射亮度产品 该数据提供了高质量的地球观测数据,可用于研究地表和大气的各种变化。 Landsat 8 C2 RAW 数据是基于Landsat 8 卫星获取的原始遥感数据。 持续更新:Landsat 8 C2 RAW 数据是一个持续更新的数据。每当Landsat 8 卫星获取新的遥感数据时,这些数据将被添加到数据集中,以保持数据的最新性。 此外,USGS 还提供了一些教程和培训材料,帮助用户理解和使用Landsat 8 C2 RAW 数据。 总之,Landsat 8 C2 RAW 数据是一组提供高质量地球观测数据的卫星遥感数据。 key为LANDSAT_8/02/T1/RAW的Landsat8_C2_RAW类数据 * @Name : Landsat8_C2_RAW_T1数据 */ /** */ //指定检索数据

    49710编辑于 2024-02-18
  • 烟火数据烟雾明火2类别数据VOC-6460张

    数据格式:Pascal VOC格式(不包含分割的txt文件,仅仅包含jpg图片和对应的xml) 图片数量(jpg文件个数):6460 标注数量(xml文件个数):6460 标注类别数:2 标注类别名称 ,"fire"] 每个类别标注的框数: smoke count = 7901 fire count = 11066 使用标注工具:labelImg 标注规则:对类别进行画矩形框 重要说明:本数据对图片中烟雾和明火进行 2个类别标注,其中烟雾类型有交通事故,森林火灾,建筑失火,柴木生火等,明火有蜡烛,柴火,火灾类型,奥运火炬等 特别声明:本数据不对训练的模型或者权重文件精度作任何保证,数据只提供准确且合理标注 图片示例

    18810编辑于 2025-07-21
  • 来自专栏新智元

    NIH开源迄今最大临床医疗图像数据,用深度学习构建通用疾病检测模型!

    ---- 新智元报道 来源:HIN 作者:大明,闻菲 【新智元导读】NIH临床中心最新公布了一个迄今规模最大的多类别、病灶级别标注临床医疗CT图像开放数据DeepLesion,研究人员在此基础上训练深度神经网络 CT图像数据DeepLesion,也是迄今全球规模最大的多类别、病灶级别标注的开放获取临床医疗图像数据。 Summers),他是医生里面对技术理解特别深刻的,为获取这个临床的大规模医疗数据提供了极大的帮助和指导。” “总之,这是一个给人很大想象和发挥空间的数据。”闫轲说。 大规模的临床数据库是AI在临床真正落地的唯一路径;但标注几乎永远不可能是完美的,这就对新的更鲁棒的深度学习算法提出了更多以及更高的要求。 (数据构建和病灶检测) [2] https://arxiv.org/abs/1707.03891(ISBI2017, body part regression) [3] https://arxiv.org

    5.6K20发布于 2018-08-16
  • 来自专栏数据科学和人工智能

    数据 | 图书数据

    下载数据请登录爱数科(www.idatascience.cn) 由电商平台爬取的图书信息,包括书名、出版信息、当前价格等。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 当当网搜索页面爬取。

    2.9K40编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | 行星数据

    下载数据请登录爱数科(www.idatascience.cn) 其记录了2014年之前天文学家在恒星(除了太阳)周围发现的行星的信息。 1. 字段描述 2. 数据预览 3. 数据来源 来源于UCI机器学习库。

    2.1K20编辑于 2022-03-30
  • 来自专栏数据科学和人工智能

    数据 | 订购数据

    下载数据请登录爱数科(www.idatascience.cn) 该数据记录了一家全球超市4年的订购数据,包含订单的订单号、下单时间、发货时间、运输模式、顾客名称和地区等信息。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    2.2K30编辑于 2022-03-30
领券