本文依据 CGP Book 加上笔者个人理解写就,并非照搬原文翻译,感兴趣的读者可以从官方渠道了解 CGP。 在 CGP 中,并非将所有类型都视为 Context。我们使用 Context 的目的主要是期望实现一定的“模块化(modularity)”。 CGP 的目标是打破这种差异,使 Context-Generic Provider 更容易实现。2. 在 CGP 中,“开发”属于 Provider。绑定方案:是从候选“方案”中选定一个,将其封装到 Context 内,使其成为功能的“最终逻辑”。在 CGP 中,“绑定”属于 Consumer。 CGP 中,这里的 Provider 属于 Context-Generic Provider。
cell lines 发表时间是:Genome Biology 2014https://doi.org/10.1186/gb-2014-15-3-r47 了解 Cancer Genome Project (CGP ) 数据库 主页: CGP website 是 Genomics of Drug Sensitivity of Cancer (GDSC)计划的数据 The CGP gene expression data The IC50 data for the drugs is available from the CGP website Curve fitting code is now available as 作者选取了Cancer Genome Project (CGP) 数据库里面收录的 700多种细胞系的 138 种药物的作用情况,开发了算法,而且在 4 个符合要求的数据集里面验证了可靠性。 ?
CGP-IP 能够创建图像滤波器,用于去噪、目标检测和质心定位(centroid determination)。 在强化学习任务中使用 CGP 的研究相对较少,本论文将展示首次使用 CGP 作为游戏智能体的研究。 简单而言,笛卡尔遗传规划是遗传规划的一种形式,其中程序表征为有向的、通常由笛卡尔坐标索引的非循环图。 ALE 提供了 CGP 和其他方法之间的定量对比。直接将 Atari 游戏分数与之前研究中的不同方法结果进行对比,以对比 CGP 与其他方法在该领域的能力。 CGP 的独特优势使得其应用在 ALE 上非常合适。通过定长的基因组,小型程序能通过进化生成并被读取以理解。 ,CGP)之前已被证明在图像处理任务中具备使用计算机视觉专用的函数集来进化程序的能力。
Response Portal (CTRP) 和 Genomics of Drug Sensitivity in Cancer (GDSC) 两个数据库资源,而是使用 Cancer Genome Project (CGP sensDataCcle$Primary.Cell.Line.Name)) 24种药物: unique(sensDataCcle$Compound) Cancer Genome Project (CGP data(cgp2016ExprRma) dim(cgp2016ExprRma) data(PANCANCER_IC_Tue_Aug_9_15_28_57_2016) length(unique(drugData2016 = 10, selection = -1, printOutput = TRUE, removeLowVaringGenesFrom = "homogenizeData", dataset = "cgp2014 ") 我们这里以CGP2014的数据来演示,药物选择紫杉醇(Paclitaxel)。
已知的信息就是从直接从上面介绍的数据库下载的,pRRophetic包使用的是CGP和CCLE的数据,但是CCLE的药敏数据只有24种药物和500多个细胞系,数据量比较少,所以通常大家使用的都是CGP的数据 除了cgp2014,你还可以选择cgp2016作为训练数据,cgp2016有251种药物,cgp2014只有138种。 CGP的官网:https://www.cancerrxgene.org/。 ) dim(cgp2016ExprRma) ## [1] 17419 1018 cgp2016ExprRma[1:4,1:4] ## CAL-120 DMS-114 CAL drugData2016 data(cgp2016ExprRma) # cgp2016ExprRma data(bortezomibData) #提取cgp2016的所有药物名字 possibleDrugs2016
Response Portal (CTRP) 和 Genomics of Drug Sensitivity in Cancer (GDSC) 两个数据库资源,而是使用 Cancer Genome Project (CGP ) 可以看到 Cancer Genome Project (CGP)里面的也是一千多个细胞系的2万个基因的表达量矩阵,关键是它药物超过了200种。 library(pRRophetic) # exprMatCcle (ccleData) data(cgp2016ExprRma) dim(cgp2016ExprRma) data = 10, selection = -1, printOutput = TRUE, removeLowVaringGenesFrom = "homogenizeData", dataset = "cgp2014 ") 我们首先使用 默认的 cgp2014数据集,来预测 前面的 硼替佐米(Bortezomib)药物信息,看看是否一致。
Error: (PHP 5.3 and above) Please set 'request_order' ini value to include C,G and P (recommended: 'CGP 这里我们建议用户将配置更改为“CGP”,然后建议我们修改php.ini 因为安装的是新版本,默认是CGP,所以我们要进行相应的修改。 打开文件include/common.inc.php,大概34行左右找到 if(strtoupper(ini_get('request_order')) == 'CGP') 改为
= msigdbr(species = "human", category = "C2") CGP_pathwaysH = split(x = CGP_gene_sets$human_gene_symbol , f = CGP_gene_sets$gs_name) All.Markers$NABA_Matrisome <- All.Markers$gene %in% CGP_pathwaysH$NABA_MATRISOME $NABA_BASEMENT_MEMBRANES, CGP_pathwaysH$NABA_COLLAGENS, CGP_pathwaysH$NABA_ECM_GLYCOPROTEINS, CGP_pathwaysH$NABA_PROTEOGLYCANS, CGP_pathwaysH$NABA_COLLAGENS[! CGP_pathwaysH$NABA_COLLAGENS %in% CGP_pathwaysH$NABA_BASEMENT_MEMBRANES] ), assay = "RNA" ) names
file.exists('Bortezomib_in_cgp2016.Rdata')){ # pRRophetic的安装方式 见 ;https://mp.weixin.qq.com/s/avETGVE8 data(cgp2016ExprRma) dim(cgp2016ExprRma) data(PANCANCER_IC_Tue_Aug_9_15_28_57_2016) length(unique (drugData2016$Drug.name)) unique(drugData2016$Drug.name) cgp2016ExprRma[1:4,1:4] drugData2016[ ) ) Bort_ExprRma=cgp2016ExprRma[,pos] identical(colnames(Bort_ExprRma),Bort_drugs$Cell.line.name ) save(Bort_ExprRma,Bort_drugs,file = 'Bortezomib_in_cgp2016.Rdata') } load(file = 'Bortezomib_in_cgp2016
如图3所示,CGP 允许内部计算对数据进行复用,因为图中节点的输出可以被多次重复使用。这一特性自 CGP 首次提出以来,便引起了进化计算和遗传编程领域研究人员的广泛关注。 为了克服工程问题中遇到的困难,文献中已提出了多种具有不同特性的CGP变体。图4展示了递归CGP(Recurrent CGP)[35],这是一种允许构建重复性/循环结构图的CGP类型。 由于本综述文章的重点并非对所有CGP变体进行全面详述,因此关于CGP变体的更多细节,读者可参考一些专门聚焦于CGP方法的文献 [32], [36]。 此外,还专门开发了一种用于ANN的CGP变体,即递归CGP(Recurrent CGP, RCGP)[34]。 CGP4Matlab:CGP4Matlab [147] 是另一个开源软件工具,支持在Matlab环境中开发笛卡尔遗传编程(CGP)应用。该工具专为信号处理和图像处理问题而开发 [148]。
转录组数据+药物 我仔细看了看参考文献,这个就是我三年前介绍过的:使用CGP数据库的表达矩阵进行药物反应预测 发表这个算法的文章是:Clinical drug response can be predicted lines 发表时间是:Genome Biology 2014 https://doi.org/10.1186/gb-2014-15-3-r47 作者选取了Cancer Genome Project (CGP ) 数据库里面收录的 700多种细胞系的 138 种药物的作用情况,开发了用CGP数据库的表达矩阵进行药物反应预测算法,而且在 4 个符合要求的数据集里面验证了其算法的可靠性。 算法概况起来就是5个步骤: 第一步,把两个表达矩阵(CGP数据库以及自己待预测的表达矩阵)合并,就是Training (cell lines) and test (clinical trial) datasets R包的人已经了无音讯了吧,也不可能是有人来维护它,我看了看包的介绍,重点就是一个pRRopheticPredict函数: Thus, as a proof-of-concept we applied CGP
5 其它细胞系药物作用数据库 提到细胞系药物作用数据库,最出名的是 Cancer Cell Line Encyclopedia (CCLE) 和 Cancer Genome Project (CGP ) / Genomics of Drug Sensitivity in Cancer (GDSC) 这两个: CCLE (www.broadinstitute.org/ccle/) GDSC/CGP ( 其中 GDSC 也就是 CGP,包含着4种数据。
本文基于服务某金融科技企业的真实项目经验,详解如何利用腾讯云容器服务(EKS)、GPU云服务器(CGP)等产品,构建一套支持1000+并发、可用性达99.9%的大模型推理服务,同时将推理成本降低40%。 支持资源弹性伸缩可用性保障:服务全年中断时间不超过8.76小时,故障自动恢复时间≤30秒基于上述需求,我们放弃了传统虚拟机部署方案,采用"云原生+Serverless"混合架构,核心依托腾讯云EKS、CGP 基础设施层:弹性与算力的最佳组合产品组件核心作用选型优势腾讯云EKS容器编排与调度支持GPU节点弹性伸缩,与腾讯云IAM权限系统深度集成CGP GPU服务器推理算力支撑A100机型按需计费,结合预留实例折扣达 模型服务层:高性能推理引擎选型对比当前主流推理引擎后,我们选择TensorRT-LLM与vLLM组合方案,结合腾讯云GPU优化能力实现性能突破:TensorRT-LLM:针对腾讯云CGP服务器的NVIDIA 在用户集中区域的腾讯云边缘节点部署轻量模型,将本地咨询请求的延迟降至50ms以内六、结语:云原生赋能大模型落地本次金融级大模型部署的成功,核心在于腾讯云产品矩阵的协同优势——EKS提供灵活的编排能力,CGP
然后,将这些子图重新整合为三个组合图:① CGP 图、② CGD 图和 ③ CGPD 图。 3 结果和讨论 BioNet在CGP、CGD和CGPD三个数据集上的所有性能指标(包AUROC、AUPRC和AP@20)的表现优于其他方法。 与基于GCN的模型相比,BioNet-CGP在AUROC上比GCN-Total提高了12.5%,在AUPRC上提高了17.1%,在AP@20上提高了31.5%。 图4显示了使用不同数量的GPU训练BioNet-CGP、BioNet-CGD和BioNet-CGPD所花费的时间。随着GPU 数量的增加,时间成本显着降低。 例如,当使用相同大小的数据集(BioNet-CGP)时,BioNet并行模型单个Epoch的计算时间减少了近7个小时。
虽然,N3的接触式栅极间距(Contacted Gate Pitch, CGP)为 45nm,是迄今为止最密集的工艺,领先于Intel 4的50nm CGP、三星4LPP的54nm CGP和台积电 N5 的51nm CGP。
rm(list = ls()) library(pRRophetic) # exprMatCcle (ccleData) data(cgp2016ExprRma) dim(cgp2016ExprRma 57_2016) length(unique(drugData2016$Drug.name)) unique(drugData2016$Drug.name) 如下所示的表达量矩阵和药物信息 : > cgp2016ExprRma drugData2016$Drug.name=='Bortezomib',] dim(Bort_drugs) kp = Bort_drugs$Cell.line.name %in% colnames(cgp2016ExprRma ) table(kp) Bort_drugs=Bort_drugs[kp,] pos=match( Bort_drugs$Cell.line.name ,colnames(cgp2016ExprRma ) ) Bort_ExprRma=cgp2016ExprRma[,pos] 可以看到 Genomics of Drug Sensitivity in Cancer (GDSC) 这个数据库里面虽然是有
方法一 :假设我们对小鼠数据集感兴趣 点击小鼠的M2 这里面有subcategory的详细分类,比如 CGP CP:BIOCARTA CP:KEGG CP:REACTOME control+F网页搜索 # get all human gene sets msigdbr(species = "Homo sapiens") # get mouse C2 (curated) CGP genetic perturbations) gene sets msigdbr(species = "Mus musculus", category = "C2", subcategory = "CGP
在两个细胞系药物数据库找共有差异基因 提到细胞系药物作用数据库,最出名的是 Cancer Cell Line Encyclopedia (CCLE) 和 Cancer Genome Project (CGP ) / Genomics of Drug Sensitivity in Cancer (GDSC) 这两个: CCLE (www.broadinstitute.org/ccle/) GDSC/CGP ( 很简单,把两个数据库里面的乳腺癌细胞系区分 成为干性与否,进行差异分析即可: 干性与否的分组后差异分析 大家可以自己去下 GSE36139 (CCLE).和E-MTAB-783 (CGP).
Cgp9HWBF-eaARQ3lAACY5uUYZq0336.png Cgp9HWBK-BSAHpViAAapoc7YA9U941.png 后续GitHub Pull Request的流程和Github
接下来解释一下CGP和ACGP的主要代码,CGP的代码没有看太懂。 CGP(代码名称为greed_omp_cgp) while~done DR(IN)=0; [v I]=max(abs(DR)); IN=[IN I]; k=k+1;