首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生物信息与临床医学专栏

    基因风险评分3

    PRSice是当前比较流行的多基因风险评分工具,它主要是用R语言编写的,运行速度快,可以高通量处理大数据。 Target文件:该文件是包含个体基因型信息的文件,我们可以使用--target参数来指定该文件,PRSice支持两种格式的target文件,一种是PLINK格式的二进制文件,包括bed、bim和fam 3. Phenotype文件:这是一份表型文件,这个文件的前两列必须是FID(家系ID)和IID(个体ID),其余的列存储的都是表型信息。

    1.9K10发布于 2020-08-27
  • 来自专栏数据猿

    投稿 | 大数据服务还是那个大数据服务吗?

    数据服务的现在及未来:智能+生态模式 未来人工智能+大数据生态模式将更多的应用于在商业场景下。HCR慧辰TMT研究部认为,大数据服务未来将有以下四种模式: 一是形成数据资源和计算资源提供平台。 PaaS服务将数据处理能力作为模块开放出来,使得数据挖掘技术的使用门槛和成本大幅降低,更多企业有能力利用云端数据服务创造附加价值。 另外也会形成基于数据存储、处理及挖掘技术的整体服务解决方案提供商,企业可以将数据服务完全外包给第三方机构,第三方机构也可以通过这种方式在云端整合资源并优化技术,提高准确率,同时产生推动行业发展的效果。

    1.1K70发布于 2018-04-19
  • 来自专栏张善友的专栏

    承载WCF 数据服务

    WCF 数据服务默认使用IIS 作为 Data Service 宿主,很显然这是个极好的选择,我们可以利用 IIS 强大的基础功能。 And Server Side Processing http://www.eggheadcafe.com/tutorials/aspnet/7597ebc9-868a-420b-96d0-119d3a501d60

    96950发布于 2018-01-22
  • 来自专栏生物信息学、python、R、linux

    GENIE3||基因调控网络推断

    GENIE3是一种从基因表达数据推断基因调控网络的方法。它训练预测数据集中每个基因表达的随机森林模型,并将转录因子(TF)的表达用作输入。 然后使用不同的模型来得出TF的权重,测量它们各自的相关性以预测每个靶基因的表达。GENIE3的输出是一张带有调节基因,靶基因及权重的表格,它表示TF(输入基因)在预测目标中的权重。 library(GENIE3) exprMatr <- matrix(sample(1:10, 100, replace=TRUE), nrow=20) rownames(exprMatr) <- paste GENIE3利用回归树从表达数据推断基因调控网络(以加权邻接矩阵的形式)。 weightMat[1:5,1:5] ? inst/doc/GENIE3.html

    2.9K20发布于 2020-12-02
  • 来自专栏Linyb极客之路

    数据服务开发经验

    有状态服务或者说数据服务,上线遇到问题很棘手,回滚无济于事;而且数据加载通常都很慢,部署时间长;最终导致不敢修改代码,谨小慎微;服务质量也是能忍就忍,不愿意深度优化。 在我负责顺风车LBS以来,感受愈加强烈;区别于无状态服务,数据服务的几个方面需要格外关注。(此处假设数据服务类似redis基于内存,数据量大到需要磁盘存储,关注点会有所不同。) 对应数据服务,把锁分散在各层,尽量减少锁等待。 ? 以一个多级hash+跳表结构为例,操作跳表时,锁粒度已经可以非常细。 持久化方法 内存数据和binlog哪个先写?binlog文件多久刷盘? struct Data { Header header; int dsize; void* data; }; 最后 还有两个无状态服务也会面临的重点,功能边界划分和线下环境搭建:内部数据服务不同于开源项目 自研数据服务听起来非常高大上,高性能数据存储、分布式架构设计、解决业务痛点,对外宣传的一把好手;实际上只要根据业务场景,合理分析,完成稳定高效的数据服务非常简单。

    1.2K40发布于 2019-03-07
  • 来自专栏单细胞测序

    单细胞测序—标准流程代码(3)—marker 基因富集分析_差异基因

    单细胞测序—标准流程代码(3)—marker 基因富集分析_差异基因过了很久之后才想起来继续整理单细胞测序的标准分析流程。 那么由cosg得到marker基因富集出来的各种通路就都是上调的,而不存在下调。ps:猜想,不一定正确。问3:Reactome 通路与kegg的区别? 2 差异基因2.1 step3_deg_then_anno.R差异基因的选定与可视化主要在step3_deg_then_anno.R这个脚本中rm(list=ls())options(stringsAsFactors cluster.order=seq(0,23,1), pSize=0.4, tile.col = c("#EE3B3B #1F1F1F", "#66CD00", "#0000FF", "#97FFFF", "#528B8B", "#9400D3"

    2.2K11编辑于 2024-09-04
  • 来自专栏生信技能树

    3D基因组—实验技术

    一、3D基因组之ChIP-seq 基因组的三维立体结构的主要组成是DNA和蛋白质。研究基因组的三维立体结构就是研究DNA与蛋白之间的互作。ChIP一直是研究蛋白与DNA互作的重要方法。 Hi-C数据强大我们已经看到,但想精确地模拟3D基因组的结构,还需要与ChIP-seq、RNA-seq、DNase-seq、FAIRE-seq等联合分析,才能精确构建3D模型。 ? 如下图所示,在母本染色体中,三个基因是分开的,在父本染色体中,3基因经过环形折叠在一起。 ? 2. 3C-模型空间结构验证 3C的基本流程如下图所示。 3C技术主要捕获的是两基因间的互作,因此这种技术常用来验证基因间的互作。 ? 下图所描述的是基因promoter区与增强子区的互作验证,我们可以看到FIP1L1与914kb处的增强子有互作。 ? 3.CRISPR-模型功能验证 我们利用CRISPR 技术敲掉CTCF motif,使CTCF无法结合,基因组的3D结构模型被破坏,相应基因的表达受到影响,细胞功能也可能会受到影响。

    1.5K31发布于 2019-05-08
  • 来自专栏Y大宽

    TBtools基因家族分析详细教程(3)基因家族成员的进化分析1

    多序列比对与可视化 Mega(Muscle)进行序列比对,JalView进行多序列比对结果的可视化 2进化树构建与可视化 氨基酸替代模型的选择,构建ML进化树(注意比对结果修剪参数),进化树美化 3从进化水平分析 motif模式 4从进化水平分析domain 5从进化水平分析基因结构变化 6合并分析以上三者 ---- 1多序列比对与可视化 下载Mega 导入42家族序列信息 ? image.png 3从进化水平分析motif模式 ? image.png 如下 ? image.png 结果如下 ? image.png !! image.png 5从进化水平分析基因结构变化 ? image.png 也可以环形展示 ? image.png 6合并分析以上三者 ? image.png 结果如下 ?

    15.1K55发布于 2018-10-08
  • 来自专栏Y大宽

    TBtools基因家族分析详细教程(3)基因家族成员的进化分析2

    基因-共线性的定义与常见算法原理 物种内的共线性分析 文件准备(物种比对到自身的.blast文件,物种基因信息文件.gff文件),运行MCScanX,输出collinear和tandem文件 基因家族成员的来源分析 (如何复制得到) 不同物种之间的共线性分析 共线性分析结果可视化 ---- 1 共线性分析:与同线性的联系 用途: 识别直系同源gene 蛋白编码基因注释 发现进化事件 2物种内的共线性分析 3基因家族来源分析 4不同物种之间的共线性分析 共线性分析 数据文件下载genome.fa,gff3,protein.fa 2数据文件格式转换(TBtools) 3共线性分析 4解读文本输出结果 -----开始---- 1 2 获得所有基因的位置信息 ? 如下 ? 下面可以把刚才得到的blast结果文件简化,也可以不做,做的话,下面 ? 3 菠萝自身的比对的结果如下 ? 获得基因间关系的link文件 结果如下 ? image.png 可以看出和视频中不一样,因为我和作者用的不是同一个基因家族 对于比对到自身的(单个基因组)的还可以做其他的 ?

    25.8K36发布于 2018-10-08
  • 来自专栏大数据文摘

    金融数据服务创业机会

    编者按:本文来自潘星键(@星键V;微信:akavir),他在汤森路透从事数据质量分析工作近7年,他翻译了今年3月份的一篇文章《Can the Bloomberg Terminal be “Toppled 金融服务业也并非例外,然而,彭博的的金融终端却毫不动摇的继续推进绑定(bundling)策略:一个产品,一个价格——这就意味着全球 32 万彭博终端用户中,所有人都要支付每年 2 万美元的使用费,即便他们仅仅会用到其 3 3、它并不仅仅是关于技术。 大规模的提供金融数据并不是简单的比拼技术, 所以也不是可以单纯的靠提供更好的技术来整合和显示数据就能获胜。 金融数据服务的机会在哪里? 3、众包数据。一种全新的收集金融数据的方式已经产生了。 Estimize通过众包收集公司预估信息(estimates)。Premise通过全球手机用户众包收集宏观数据信息。

    1.5K50发布于 2018-05-22
  • 来自专栏SmartSi

    Hive元数据服务MetaStore

    数据服务客户端通过该配置连接远程元数据。 3. 部署模式 MetaStore 分为三种部署模式:内嵌模式、本地模式以及远程模式。

    10.7K42发布于 2020-09-21
  • 来自专栏EAWorld

    详解数据服务共享发布

    目录: 1.数据服务共享发布核心场景 2.数据服务共享发布技术架构 3.数据服务共享发布关键设计 4.数据服务共享发布安全考虑 5.结束语 1.数据服务共享发布核心场景 按功能划分核心场景 ? 核心场景主要包括四个环节:资源目录生成、数据服务发布、数据服务消费、数据服务监控。 场景四 :从全局了解企业数据服务应用情况 ? 通过数据服务监控自动形成数据监控链路,提供数据服务共享的全貌地图,帮助企业了解数据共享交换的全貌及系统间数据关系,从全局了解企业的数据服务应用情况。 3.数据服务共享发布关键设计 数据服务共享发布设计主要从数据服务发布、故障告警、数据质量核检、数据服务监控四个层面去考虑。 问3:数据共享系统长什么样的,适用于哪些场景,哪些企业? 答:普元有自己的数据服务共享平台,具体的可以从官网(www.primeton.com)查看。

    2.8K52发布于 2019-09-04
  • 来自专栏数据科学(冷冻工厂)

    Scanpy 分析 3k PBMCs:寻找 marker 基因

    寻找 marker 基因 来给每个细胞簇里差异表达明显的基因排个序。通常情况下,要是 AnnData的 .raw 属性已经提前设置好了,就会拿它来用。最便捷快速的方式就是做** t 检验**。 再定义一个标记基因的列表,方便后面用。 ", "GNLY", "NKG7", "KLRB1"],     *["FCGR3A", "MS4A7", "FCER1A", "CST3", "PPBP"], ] 把之前保存有 Wilcoxon 秩和检验结果的那个对象重新加载进来 adata = sc.read(results_file) 把每个簇 0、1、……、7 排名前 10 的基因在一个数据框里展示出来。 sc.pl.violin(adata, ["CST3", "NKG7", "PPBP"], groupby="leiden") 给细胞类型做上标记。

    38710编辑于 2025-06-09
  • 来自专栏EAWorld

    普元数据服务监控解密

    如何有效的管理数据、高效的提供数据服务的其中一个关键就是提供对数据服务的统一监控。 目录: 一、数据服务监控 二、数据采集 三、数据格式化 四、数据存储 五、数据展示 一、数据服务监控 为提供统一、标准、安全、高效的数据服务,我们需要做好一点那就是统一数据运行监控,那么统一数据服务运行监控需要做哪些事情呢 我们可以在网关处添加对数据服务的采集功能。 网关拦截器手动埋点 ? 所以我们只需要极少的代价在数据服务总入口也就是网关进行数据埋点,收集数据详情即可。 异步落日志 ? All线程任务会将每一笔的数据服务记录到案 Top线程任务用来统计数据服务调用访问时长TopN的调用详情。 数据分析线程解析 ?

    89210发布于 2019-07-08
  • 来自专栏HuggingFists

    HuggingFists数据服务发布--功能闭环

    最近,HuggingFists隆重推出了新的功能模块-“数据服务”模块。该模块可以有效的解决HuggingFists算子能力不足时的扩展问题。 为打通这一扩展壁垒,HuggingFists推出了“数据服务”模块。支持以配置的方式添加一个第三方的WebAPI接口,并可使用系统内置的“数据服务调用”算子在流程中调用此接口。 HuggingFists数据服务模块的功能示意图如下: 数据服务中的远程接口管理模块负责集成第三方的Web API接口。允许配置Web接口的请求方法以及接口参数的各类提交方式。 除此外,数据服务还支持将HuggingFists中的数据流程包装成一个API接口对外提供服务,供第三方应用访问。如图中的服务接口管理所示。

    40200编辑于 2024-09-28
  • 来自专栏大数据和云计算技术

    数据服务上云的思考

    OpenStack云计算平台,帮助服务商和企业内部实现类似于 Amazon EC2 和 S3 的云基础架构服务(Infrastructure as a Service,IaaS)。 3、正是因为I层将资源和存储进行了虚拟化然后对上提供,大数据上云最大的两个问题是资源管理和数据存储。 5、对于存储存在同样的问题,HDFS是对物理硬盘的直接抽象成对象存储,并提供3份冗余来保障数据的可靠性。云上的I层对存储通常也会抽象,并且进行一定的冗余,来动态分配给上层应用。 因此I层最好将物理硬盘直接提供出来给大数据服务可见,让用数据的人直接管理数据效率最高。

    1.6K80发布于 2018-03-08
  • 来自专栏大数据文摘

    华尔街甘心购买的数据服务

    3,8月21日下午12:31,Genscape告诉客户将近有100辆原油车从巴肯运到俄克拉荷马州的斯特劳德,并在一个闲置了一年的输油管道卸载,该地区的石油管道通往库欣。 在报告发布的25分钟内合同价格下降了3%,当天下滑了7%,这反映初库欣油罐的增加使得油价走低。WTI油价跌了近7美元。

    2K20发布于 2018-05-23
  • 来自专栏一个会写诗的程序员的博客

    统一数据服务架构

    数据服务化架构 关键技术一:配置即开发 平台用户分为两类角色:其一是数据服务生产方,其二是数据服务调用方。 数据服务生产方只需要配置,做到“配置即开发”,配置包括:1)数据源;2)数据加速到何处;3)接口形态,访问方式;4)配置独立的测试环境,访问隔离的测试数据。 数据服务平台支持了多种模式API,很好满足了多元化需求。此外数据服务平台也支持服务权限、API市场等丰富功能,进一步赋能业务。 大数据服务化平台未来进一步发展方向主要包括: 贴近业务需求:数据服务平台本身是为业务服务,通过赋能业务而对企业带来价值,业务本身在不断发展,未来也会有更多的需求出现,因此数据服务平台本身会不断抽象和沉淀出公共数据服务能力 大数据服务平台的能力建设会朝着统一的 OneService 体系前进。主要包括三个方面: 支持丰富的数据源:包括大宽表、文本文件、机器学习模型(模型也是一种数据资产),来构建完善的数据服务

    2.4K30编辑于 2021-12-16
  • 来自专栏数据D江湖

    数据服务+自助”产品化实践

    来源:虎牙 & DataFun 公众号后台回复: 报告 获取源文件 欢迎添加本站微信:datajh (可上下滑动或点单个图片放大左右滑动查看)

    92720编辑于 2022-12-08
  • 探索ImmGen: 3-查询小鼠基因表观遗传修饰

    分析开放染色质区域:可以选择细胞类型、选定特定区域或者输入目的基因查看染色质开放情况。并且存在三种不同的可视化模式,并可以下载ATAC-seq peaks 数据。 基因在不同发育阶段具有不同的染色质开放区域特征,与基因表达、特定TF结合密切相关。 输入目的基因位点,就可以查看这个基因位点在胸腺细胞不同发育阶段(不同细胞亚群中)中的H3K27ac修饰区域的差异。 3.转录因子分析:通过开放染色质区域(ATAC-seq)数据进行TF motif分析后,可以反过来查询转录因子在所有样本中染色质开放区域的富集情况。是一个总结性的结果。 如基因是否在发育阶段发挥作用,基因是否具有组织特异性、基因位点是否特定表观修饰特征等,都是要结合具体的研究目的。因此就像一本字典,提供参考资料。但如何写出好文章还需要中心思想明确、结构逻辑要合理。

    11610编辑于 2026-01-27
领券