首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏火星娃统计

    geo数据挖掘-2

    geo数据挖掘-2 sunqi 2020/7/11 1.概述 对下载的数据进行处理,提取表达矩阵,并匹配探针信息,基因名 教程来自:https://github.com/jmzeng1314/GEO/ ' # 上章的geo包 library(GEOquery) # 下载文件,如果存在则不进行下载 if(! GSM1052620 (6 total) ## varLabels: title geo_accession ... cell type:ch1 (34 total) ## varMetadata colnames(Table(gpl)) head(Table(gpl)[,c(1,12)]) probe2gene=Table(gpl)[,c(1,12)] head(probe2gene ) save(probe2gene,file='probe2gene.Rdata') } # 获得平台的所有探针 load(file='probe2gene.Rdata') # 需要的时候通过

    1.5K21发布于 2020-09-15
  • 来自专栏R语言 / Linux

    GEO数据挖掘-2

    GEO数据挖掘—2 四、代码分析流程 1. 下载数据并从中提取有用信息 gse_number = "GSE56649" eSet <- getGEO(gse_number, destdir = '. require(hgu133plus<em>2</em>.db))BiocManager::install("hgu133plus<em>2</em>.db") library(hgu133plus<em>2</em>.db) ls("package:hgu133plus<em>2</em> /<em>geo</em>/query/acc.cgi? ="";table(k1) k<em>2</em> = ! str_detect(ids<em>2</em>$symbol,"///");table(k<em>2</em>) ids<em>2</em> = ids<em>2</em>[ k1 & k<em>2</em>,] # ids = ids<em>2</em> } ​ # 方法3 官网下载注释文件并读取

    1.1K01编辑于 2023-03-18
  • 来自专栏孔德雨的专栏

    Mongodb Geo2d索引原理

    ongoDB的geo索引是其一大特色,本文从原理层面讲述geo索引中的2d索引的实现。 2d 索引的创建与使用 通过 db.coll.createIndex({"lag":"2d"}, {"bits":int})) 来创建一个2d索引,索引的精度通过bits来指定,bits越大,索引的精度就越高 2d索引的理论 Mongodb 使用一种叫做Geohash的技术来构建2d索引,但是Mongodb的Geohash并没有使用国际通用的每一层级32个grid的Geohash描述方式(见wiki geohash 2d索引的默认精度是长宽各为26,索引把地球分为(2^26)(2^26)块,每一块的边长估算为 2*PI*6371000/(1<<26) = 0.57 米 mongodb的官网上说的60cm的精度就是这么估算出来的 查询 对于geo2D索引的查询,常用的有geoNear和geoWithin两种。

    3.5K00发布于 2017-04-01
  • 来自专栏医学数据库百科

    GEO2R差异表达分析软件

    前两天我们对GEO数据库来了一个大致的介绍GEO数据集详细介绍GEO数据库介绍 (一)。我们对于目标数据集,我们做的第一个事情就是差异分析,来寻找有差异的结果。 我们今天介绍的这个GEO2R也只是把这个算法更加方便使用了而已。 PS:GEO2R只是适用于表达谱芯片。对于二代测序是不适用的,我们下面说到的数据类型都是表达谱芯片来进行阐述的。 2 GEO2R GEO2R就是一个基于GEO数据库来对表达谱芯片进行差异分析的一个软件。我们在每个数据集的下面都可以看到这个软件的的入口。 关于logFC logFC,全称是log2 foldchange。foldchange可以代表变化倍数,如果处理组的表达均值是8;对照组的表达均值是2,那么foldchange就是4。 而log2 fold change就是2。所以我们默认的logFC > 1,则代表两组之前差异在2倍以上的为有意义。 logFC的绝对值, 由于相较于对照组,基因的变化并不一定是升高的。也有降低的。

    1.5K40发布于 2020-06-15
  • 来自专栏生信菜鸟团

    GEO数据分析流程之芯片2

    require(hgu133plus2.db))BiocManager::install("hgu133plus2.db")#安装library(hgu133plus2.db)#加载ls("package :hgu133plus2.db")#看这个R包中有那些数据ids <- toTable(hgu133plus2SYMBOL)#提取R包中有用的信息,tablehead(ids)# 方法2 读取GPL网页的表格文件 ,按列取子集##https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi? ="";table(k1) k2 = ! str_detect(ids2$symbol,"///");table(k2) ids2 = ids2[ k1 & k2,] # ids = ids2#如果不用修改上面的内容,就直接ids=ids2

    31710编辑于 2024-06-28
  • 来自专栏生信修炼手册

    GEO2R:对GEO数据库中的数据进行差异分析

    GEO数据库中的数据是公开的,很多的科研工作者会下载其中的数据自己去分析,其中差异表达分析是最常见的分析策略之一,为了方便大家更好的挖掘GEO中的数据,官网提供了一个工具GEO2R, 可以方便的进行差异分析 在网页上可以看到GEO2R的按钮,点击这个按钮就可以进行分析了, 除了差异分析外,GEO2R还提供了一些简单的数据可视化功能。 1. 2. Profile graph 该选项用于展示某个探针/基因在所有样本中的分布,结果示意如下 ? 点击Sample values, 可以看到对应的表达量值,示意如下 ? GEO2R进行差异分析的步骤如下 1. 定义样本分组 通过Define groups按钮定义样本分组,首先输入一个group的名字,然后选择对应的样本,示意如下 ? 2. 全部基因的结果可以通过Save all results导出,通过GEO2R, 可以在没有任何编程基础的情况下,顺序的完成差异分析。 ·end· —如果喜欢,快分享给你的朋友们吧—

    7.4K23发布于 2020-05-08
  • 来自专栏sherry笔记

    GEO

    'tibble', 'dplyr', 'stringr', 'ggplot2' 'tinyarray') Biocductor_packages <- c('GEOquery', 'hgu133plus2. quietly = T) ) { BiocManager::install(pkg,ask = F,update = F) require(pkg,character.only=T) }}2. <- eSet@annotation;gpl_number## [1] "GPL570"#捷径find_anno(gpl_number) #打出找注释的代码## `library(hgu133plus2. db);ids <- toTable(hgu133plus2SYMBOL)` and `ids <- AnnoProbe::idmap('GPL570')` are both avaliableids

    52230编辑于 2023-07-24
  • 来自专栏生信技能树学习笔记

    GEO数据挖掘2(分组+探针注释的获取)

    require(hgu133plus2.db))BiocManager::install("hgu133plus2.db") #安装并加载R包,R包完整的名字应该是搜索到的名字+.dblibrary(hgu133plus2 .db)ls("package:hgu133plus2.db") #查看该R包里所有的数据and函数ids <- toTable(hgu133plus2SYMBOL)head(ids)2.从GPL网站提取探针注释在该 = b[,c("ID","Gene Symbol")] colnames(ids2) = c("probe\_id","symbol") #更改行名 k1 = ids2$symbol! str\_detect(ids2$symbol,"///");table(k2) ##去掉对应多个基因名的探针id ids2 = ids2[ k1 & k2,]并不一定所有的探针注释中开放性探针都是" ",所以要看一下如图片这里我们可以取数据框子集查看里面的内容是什么ids2$[410,2] 3.探针平台的官网寻找4.自主注释(自学一下)#https://mp.weixin.qq.com/s/mrtjpN8yDKUdCSvSUuUwcA

    2.6K31编辑于 2023-02-18
  • 来自专栏syj生信

    GEO

    ', getGPL = F)#getGEO有从GEO中下载数据到工作目录下,并将数据读取到R中。 #若数据没有取logexp = log2(exp+1)#之所以要+1是因为害怕exp有数据=0,这样log2(0)就是负无穷了。 require(hgu133plus2.db))BiocManager::install("hgu133plus2.db")library(hgu133plus2.db)ls("package:hgu133plus2 GPL网页的表格文件,按列取子集https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi? str_detect(ids2$symbol,"///");table(k2)# 去掉表格中一个基因对应多个探针的那一行,///代表把两个基因分隔开 ids2 = ids2[ k1 & k2,]}方法

    2K51编辑于 2023-04-04
  • 来自专栏生信菜鸟团

    利用GEO2R在线进行DEG表达分析

    GEO2R 是一个交互式网络工具,允许用户比较GEO系列中的两组或多组样品间鉴定在实验条件下差异表达的基因。 GEO2R 使用 DESeq2 、GEOquery 和 limma 对 NCBI 计算的原始计数矩阵进行差异表达分析。 2. 使用GEO2R进行分析 ,只有显示"Analyze with GEO2R"的数据集才可以进行此分析。 3. 在“Set”处可以选择需要展示的列表信息。 4. 对结果进行解读(详情查看:https://www.ncbi.nlm.nih.gov/geo/info/geo2r.html#interpret ) 是不是看起来跟自己写代码一模一样的差异分析一条龙啊!

    1.3K10编辑于 2024-06-11
  • GEO优化助手】GEO优化人才维度

    200+维度的AI搜索权重模型(含用户画像、内容时效性、权威性等)建立AI答案引用率、情感倾向、转化率等核心KPI体系典型案例:某新能源汽车品牌通过GEO策略经理主导的"时空注意力机制"优化,将本地化服务场景中的 例如,某B2B软件企业通过RAG优化,使AI在回答"CRM系统对比"时,功能描述准确率提升40%,客户咨询转化率增长40%。 2025年,分期乐通过技术巡检打掉一批利用GEO制造虚假客服电话的黑灰产组织,这些组织通过AI批量生成伪原创内容并发布链接,导致用户被诈骗的案例激增。 从"危机公关"到"AI舆情管理":建立负面引用预警机制,当AI答案中出现"虚假宣传""质量差"等负面评价时,2小时内启动纠偏流程。 4.1 从"通用优化"到"垂直领域专家"随着AI搜索的细分化,未来将出现医疗GEO工程师、金融GEO分析师、法律GEO顾问等垂直岗位。

    66710编辑于 2025-09-02
  • 来自专栏生信技能树

    GEO2R更新后可以分析bulk RNAseq

    GEO2R简介 GEO2R是由GEO数据库提供的一个交互式网络工具,允许用户比较GEO数据集中样本/组别间的差异,以确定在不同实验条件下差异表达的基因。 GEO2R的结果显示为按p值排序的基因表,并作为图形图的集合,以帮助可视化差异表达基因和评估数据集质量。 GEO2R一般通过数据集下方的蓝色按钮进入并使用。 GEO2R入口 GEO2R的优缺点 GEO2R使用来自Bioconductor项目的各种R包,以最常用的芯片分析为例,其后台调用芯片分析的经典包Limma,通过数据清洗,差异分析等过程,最后获得用户可以直接使用的差异基因列表 GEO2R beta版更新 详细内容见:https://www.ncbi.nlm.nih.gov/geo/info/geo2r.html 1、亮点 主要增加了对RNAseq数据分析的支持。 目前GEO2R支持使用DESeq2GEO及SRA库中的数据进行差异分析,输入文件是NCBI-computed raw count matrices。

    1.2K21编辑于 2023-09-19
  • 来自专栏悠扬前奏的博客

    Geo Hash

    工作需要,实现了一下Geo Hash算法。 尽量直接使用位操作,比网上常见的字符串判断位值得写法效率应该高一点。 TODO:循环的写法可以再优雅一点;注释可以再清晰一点。 * 该精度下最小经度 */ private double minLon; private final static char[] DIGITS = {'0', '1', '2' } } /** * hash编码 * * @param lat 纬度 * @param lon 经度 * @return geo - i * 2 > 0 && bitSet.get(hashLength * BASE_BIT_NUM - 2 - i * 2)) { result[2][1] = encode(southLat, lon); // 东南 result[2][2] = encode(southLat,

    1.1K20发布于 2021-11-24
  • 来自专栏R语言&linux

    geo(三)

    step4output.Rdata') library(clusterProfiler) library(ggthemes) library(org.Hs.eg.db) library(dplyr) library(ggplot2) 对上调/下调/所有差异基因进行富集分析 f2 = paste0(gse_number,"_KEGG.Rdata") if(! } load(f2) #(3)看看富集到了吗? kegg_plot_function.R") g_kegg <- kegg_plot(kk.up,kk.down) g_kegg #g_kegg +scale_y_continuous(labels = c(4,2,0,2,4,6 )) 3.辅助资料 # GSEA:https://www.yuque.com/docs/share/a67a180f-dd2b-4f6f-96c2-68a4b86fe862?

    54500编辑于 2023-02-11
  • GEO

    log2(FC)=log2(x)-log2(y)=log2(x/y)log2(FC)常见阈值,1,2,1.5作者:mayoneday链接:https://www.jianshu.com/p/3c290fee634f 代码在GEO_learnmore里2.里的多分组数据多数据联合分析,思路.:1各自两两差异分析,再将差异基因取交集2.先合并,后差异分析原则上选择同一芯片平台的GSE? $exp = geo$exp[,k]geo$pd = geo$pd[k,]3.annoGene(只接受ENSEMBL or SYMBOL找注释)/clusterProfiler(接受ENTREZID转化为 (ids) = c("probe_id","symbol")exp4 = trans_array(geo$exp,ids)4.trans_array既可以用于GEO数据行名转化(探针名转化为symbol geo_download代码汇总geo = geo_download(gse)pd = geo$pdgeo$exp = log2(geo$exp+1)#,destdir=tempdir()表示不使用工作目录下的路径

    77910编辑于 2024-03-10
  • 来自专栏个人技术博客

    ⑦【Redis GEO 】Redis常用数据类型:GEO

    个人简介:Java领域新星创作者;阿里云技术博主、星级博主、专家博主;正在Java学习的路上摸爬滚打,记录学习的过程~ 个人主页:.29.的博客 学习社区:进去逛一逛~ ⑦Redis GEO 基本操作命令 Redis GEO主要用于存储地理位置信息,并对存储的选项进行操作: 1.添加地理位置的坐标 2.获取地理位置的坐标 3.计算两个地理位置间的距离 4.根据用户给定的经纬度坐标来获取指定范围内的地理位置集合 latitude member ...] longitude —— 精度 latitude —— 维度 member —— 位置名称 geoadd city 121.48941 31.40527 "广州" 2. geopos city 广州 # 获取空间名称“广州”的经纬度 geopos city 深圳 # 没有存储“深圳”的空间名称,返回nil 3.geohash 获取保存位置的geohash值 Redis GEO georadiusbymember city 广州 2000 km withcoord withdist count 2

    87110编辑于 2023-11-26
  • GEO优化助手】GEO优化人才如何评估

    在这场搜索革命中,生成式引擎优化(Generative Engine Optimization, GEO)已从SEO的延伸技术演变为数字营销的核心战场。 与传统SEO聚焦网页排名不同,GEO直接优化内容在AI生成答案中的"引用权重",使品牌信息无需点击即可触达用户决策链顶端。 这种变革催生出全新的职业生态:GEO策略架构师、语义优化工程师、多模态内容设计师等新兴岗位需求年增长达34%,但企业普遍面临人才评估标准缺失的困境。 本文基于印度理工学院GEO框架、头部企业实践及2000+岗位JD分析,构建覆盖战略、技术、内容、数据四大维度的GEO人才评估体系,为行业提供可落地的评估标准。 未来五年,随着量子计算、脑机接口等技术的突破,GEO人才评估将向"超大规模索引优化""神经语义理解"等前沿领域延伸。

    44610编辑于 2025-09-02
  • GEO优化助手】如何培养GEO优化人才

    生成式引擎优化(GEO):如何构建面向AI时代的优化人才体系引言:当搜索进入“认知建构”时代2025年,全球生成式引擎优化(GEO)市场规模突破89亿美元,年复合增长率达43%。 在DeepSeek、Perplexity等AI搜索平台日均调用量超2亿次的背景下,企业内容被AI模型引用的概率成为新的流量入口。 (每300字内容包含1个数据、1个案例、1个对比表格)提升AI可理解性。 四、未来展望:GEO人才的战略价值随着AI搜索流量向头部平台集中,GEO优化能力已成为企业数字战略的核心竞争力。Gartner预测,到2026年,缺乏GEO人才的企业将在AI搜索流量中边缘化。 正如《2025年GEO优化白皮书》所言:“GEO不是SEO的替代品,而是数字营销从‘流量争夺’到‘心智渗透’的质变。”

    36310编辑于 2025-09-02
  • 来自专栏科研猫

    GEO数据库挖掘(2)--快速锁定目标数据

    在上一期的推文 GEO数据库挖掘(1)--SCI文章速成 ,我们讲解了关于GEO数据库的背景知识,想必大家也了解了GEO是一个非常实用和权威的基因表达谱数据库。那么如何检索自己想要的数据呢? ,出现了一个下拉菜单,一个是“results in GEO DataSets”,另一个是“results in GEO Profiles”,我们选择上面一个(绿框所示)。 2 Step2:过滤 点击上面的检索结果后,然后我们会进入到GEO DataSets的结果页面,如下图所示。 此外,还有一个需要我们知道的就是一个分析工具—GEO2R,这个工具是GEO官方开发的使用R语言来进行差异表达分析的工具,十分好用,通过GEO2R可以快速便捷地筛选出我们想要的差异表达基因。 当然仅仅进行差异表达分析,发文章是远远不够的,后面的文章,我们会继续给大家讲解GEO2R的使用以及我们自行开发的一整套GEO数据挖掘自动化工具,卖个关子,敬请期待哟~ 本期重点回顾(Take home

    5.3K86发布于 2019-09-24
  • 来自专栏allsmallpi博客

    redis geo 全网最好用的redis-geo

    当乘客下单后,会通过乘客的位置查询附近司机然后进行匹配 2GEO简介 reids在版本 3.2.0之后,引入了geo功能,可用于处理地理位置。 spring-boot-starter-web org.springframework.boot spring-boot-starter-data-redis GEO redis命令:geodist key 北京 上海 */ public Distance geoDist(String key, String member1, String member2, Metric metric) { return redisTemplate.opsForGeo().distance(key, member1, member2, metric); = "geo_key"; /** * 使用redis+GEO,上报司机位置 */ @PostMapping("addDriverPosition") public

    1.9K20发布于 2021-02-25
领券