首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏深蓝居

    使用数据库引擎优化Tuning Advistor和dta

    顺便再提一下,在命令行模式下可以使用dta命令来进行优化操作,输入dta /? 自己看帮助.其他没有什么好说的唯一要提的就是如果不是默认端口,那么我们的连接字符串应该这样写,而且必须用双引号引起来.如下: dta -S "tcp:157.60.15.215,12345" -U sa

    37810编辑于 2022-06-15
  • 来自专栏生信喵实验柴

    独立性t检验

    dta <- read.csv("heatmap.csv",header = T,row.names = 1) # 单个基因t检验 head(dta,1) dta[1,1:5] dta[1,6: 10] t.test(dta[1,1:5],dta[1,6:10]) y <- t.test(dta[1,1:5],dta[1,6:10]) class(y) str(y) for (i in 1:30 ) { y <- t.test(dta[i,1:5],dta[i,6:10])$p.value print(y) } apply(dta, 1, function(x){t.test(x[1:5 ],x[6:10])$p.value}) apply(dta, 1, function(x){t.test(x[1:5],x[11:15],paired = T)$p.value}) apply(dta ){wilcox.test(x[1:5],x[11:15],paired = T)$p.value}) #计算Qvalue,多重假设检验 p.adjust.methods p <- apply(dta

    53810编辑于 2022-10-25
  • 来自专栏PyStaData

    Stata | 删除文件夹下所有文件

    * Create Directories cap mkdir "temp_file" cap mkdir "temp_file\dta" cd "temp_file" * Write Files forvalues echo test -> "dta\test`i'.dta" !echo test -> test`i'.txt } * Generate File Tree ftree,s(.. .txt │ test3.txt │ test4.txt │ test5.txt │ test6.txt │ test7.txt │ test8.txt │ test9.txt │ └─dta test1.dta test10.dta test2.dta test3.dta test4.dta test5 .dta test6.dta test7.dta test8.dta test9.dta 方式一:构造循环 使用 Stata 拓展宏获取路径下所有文件的名称

    5.9K10发布于 2020-07-21
  • 来自专栏全栈程序员必看

    Stata计算莫兰指数基本步骤

    1.1 数据导入 本次案例使用的数据为15-19年全国的人均GDP,数据图如下: Stata中导入数据的方式十分便捷,通常可以分以下两种: 打开数据编辑器,直接将excel数据复制粘贴即可 当有dta 文件时,可在命令行输入use dta文件地址(例如,dta文件在D盘,则使用use "D:/data.dta"即可导入) 1.2 程序包下载 莫兰指数计算的相关程序包需要预先下载,在命令行输入findit spatwmat后,点击sg162程序包即可 二、导入权重矩阵 主要命令如下,注意using后没有引号,standardize表示行标准化 spatwmat using d:/weight.dta Geoda和R主要通过shp文件构建权重矩阵,而Stata可以自行构建dta文件。因此,也更加适合导入自定义权重矩阵。 ) symbol(id) 该图在stata中背景显示是黑底,复制到word中是透明的 全部代码 findint spatwmat #安装程序包 spatwmat using d:/weight.dta

    7.9K30编辑于 2022-09-12
  • 来自专栏智药邦

    Brief Bioinform|跨尺度图对比学习预测药物靶点结合亲和力

    DTA网络中,边的权重是药物-靶点结合亲和力分数的归一化值。如图1B所示,CSCo-DTA利用图卷积网络(GCN)在DTA二部网络上进行特征提取操作。 CSCo-DTA在训练过程中利用原始的配对DTA数据引入了基于监督的损失,以及基于跨尺度对比的损失。 这种方法使CSCo-DTA能够充分利用现有的标记DTA数据,并最大限度地发挥其潜力,通过将跨尺度对比训练目标纳入DTA预测任务中,对两个目标进行了联合优化,提高了训练过程中药物和靶点的表征准确性。 为了说明对比学习的效果,作者还列出了在不加入对比学习损失时的模型(称为CSCat-DTA)的结果。结果表明,CSCo-DTA取得了最优结果,CSCat-DTA取得了次优结果。 最后,CSCo-DTA使用多任务训练策略来优化模型。评价结果表明,CSCo-DTA的性能优于其他方法,并体现出在药物发现中的应用潜力。 参考文献 [1] Wang et al.

    72510编辑于 2024-03-19
  • 来自专栏司六米希

    PCA以及RFE降噪【python】

    matplotlib.pyplot as plt # 时间序列 from stockstats import StockDataFrame import statsmodels.api as sm dta = StockDataFrame.retype(pd.read_excel('MSFT.xls')) arrclose=dta['close'].values.tolist() dates=dta[' date'].values.tolist() print(dates) # 将字符串索引转换成时间索引 dta["date"].index = pd.to_datetime(dta['date'].index ) # 生成pd.Series对象 ts = dta['close'] ts.head() dta=pd.Series(arrclose) dta.index = pd.Index(sm.tsa.datetools.dates_from_range ('2010Q1',length=240)) dta.plot(figsize=(12,8)) # 降噪 ts_log = dta print(ts_log) def draw_moving(timeSeries

    88420编辑于 2022-11-15
  • 来自专栏优雅R

    「R」倾向评分匹配算法——R实例学习

    <- match.data(mod_match) dim(dta_m) ## [1] 2704 8 检查匹配样本中协变量的平衡 fn_bal <- function(dta, variable) { dta$variable <- dta[, variable] if (variable == 'w3income') dta$variable <- dta$variable / 10^ 3 dta$catholic <- as.factor(dta$catholic) support <- c(min(dta$variable), max(dta$variable)) ggplot , "p5numpla") + theme(legend.position = "none"), fn_bal(dta_m, "p5hmage"), fn_bal(dta_m, "w3momed_hsb 检验: lapply(ecls_cov, function(v) { t.test(dta_m[, v] ~ dta_m$catholic) }) ## [[1]] ## ## Welch

    2.2K21发布于 2020-07-03
  • 来自专栏用户8955222的专栏

    DID | 安慰剂检验

    在原始数据集auto.dta中单独剔除核心变量rep78的样本数据 *- b. 将剔除出来的rep78随机打乱顺序,再将随机化的rep78合并至已被处理过的原始数据集中 *- c. , replace } erase rep78_random.dta erase rep78_dropped.dta use placebo_1.dta, clear forvalue _1.dta) erase placebo_`k'.dta } graph set window fontface "Times New Roman" , replace } erase id_random.dta use placebo_1.dta, clear forvalue k = 2/1000 { append using placebo_`k'.dta // 将1,000次回归后did的系数和标准误纵向合并(append)至单独的数据集(placebo_1.dta) erase

    6.6K30发布于 2021-08-27
  • 来自专栏生信小驿站

    R语言之分子指纹(1)计算分子指纹及批量保存sdf格式

    get.fingerprint (mols[[1]], type = 'standard', fp.mode = 'bit',depth = 6, size = 1024) num <- fp@bits dta <- data.frame(mol = 'fpt', fp = 1:1024) dta$fp = 0 dta$mol <- paste0(dta$mol, 1:1024) dta[num , 'fp'] <- 1 rownames(dta) <- dta$mol dta$mol <- NULL names(dta)[1] <- paste0('molecule', i) dt <- cbind(dt, dta) } #统计单个指纹的分布 dt$sum <- rowSums(dt) table(dt$sum) dt[1:6,1:6] # molecule1 molecule2

    2.1K21发布于 2021-01-20
  • 来自专栏DrugOne

    npj Digit. Med. | 基于绑定位点接触图的双模态神经网络助力药物靶点亲和力预测

    DMFF模型的性能和运行效率实验结果 DMFF-DTA实现性能与效率的平衡 除了预测准确性,计算效率也是评估模型实用性的重要指标。研究团队对DMFF-DTA的计算成本和性能平衡进行了深入分析。 与其他最先进的方法相比,DMFF-DTA在性能和计算成本之间取得了良好的平衡。 相比之下,完全基于图的方法如MSGNN-DTA(32.78秒,22,340 MB)和基于结合位点的AttentionMGT-DTA(321.59秒,21,726 MB)在计算资源消耗上明显更高。 DMFF-DTA具有高度可解释性 为了验证DMFF-DTA模型的可解释性及其在学习过程中识别关键互作位点的能力,作者对模型的注意力机制进行了全面的统计和可视化分析。 DMFF模型的可解释性分析结果 胰腺癌案例研究验证了DMFF-DTA的实用价值 为了验证DMFF-DTA在实际药物研发中的应用价值,作者以胰腺癌为例进行了药物重定位研究。

    46000编辑于 2025-02-18
  • 来自专栏DrugOne

    Chem. Sci.|MGraphDTA:基于深层多尺度图神经网络预测药物-靶标亲和力

    预测药物-靶标亲和力 (DTA) 有利于加速药物发现。图神经网络 (GNN) 已广泛用于 DTA 预测。然而,现有的浅层 GNN 不足以捕捉化合物的全局结构。 这些优点表明,所提出的方法提高了 DTA 预测建模的泛化和解释能力。 1 研究背景 药物-靶标亲和力(DTA)预测有利于加速药物筛选的过程。 由于化合物的信息可以用图来描述,所以图神经网络(GNNs)已经被广泛应用于DTA预测。 在该设计中采用了三个较浅的CNN,这是因为在药物-靶标相互作用发生在蛋白质口袋,所以靶标的局部特征在DTA预测中比全局特征要更加重要,而设计深层CNN使其感受野覆盖整个蛋白质可能会引入噪声,从而降低DTA Grad-AAM用于模型可视化 MGraphDTA提高DTA预测模型的泛化能力 我们在7个开源DTA数据集上对MGraphDTA进行测试,MGrahpDTA在所有指标上均优于已有方法,证明该论文所提策略的有效性

    1.1K20编辑于 2022-11-28
  • 来自专栏素质云笔记

    statsmodels︱python常规统计模型库

    PERBLACK + PERHISP + PCTCHRT + \ PCTYRRND + PERMINTE*AVYRSEXP*AVSALK + PERSPENK*PTRATIO*PCTAF' dta PCTYRRND', 'PERMINTE', 'AVYRSEXP', 'AVSALK', 'PERSPENK', 'PTRATIO', 'PCTAF']].copy() endog = dta ['NABOVE'] / (dta['NABOVE'] + dta.pop('NBELOW')) del dta['NABOVE'] dta['SUCCESS'] = endog mod1 = smf.glm (formula=formula, data=dta, family=sm.families.Binomial()).fit() mod1.summary() mod1.predict(dta) formula

    3.6K41发布于 2020-03-27
  • 来自专栏生信喵实验柴

    认识数据框

    genes200[c("CLU","DCN"),] #去除重复 gene ID gene93 <- unique(genes121$gene) #利用数据框的访问功能,一次实现 Excel Vlookup 功能 dta <- genes200[gene93,] dta #数据中包含没有检索到的 gene ID,返回值为 NA,利用 na.omit 删除包含 NA 的行 dta <- na.omit(dta) rownames (dta) <- 1:nrow(dta)#86个行数重命名 write.csv(dta,file = "gene93.csv",row.names = F) 写在最后:有时间我们会努力更新的

    1K20编辑于 2022-10-25
  • 来自专栏软件安装技巧

    Stata软件安装,专业统计分析软件Stata安装包下载,Stata使用

    我们可以使用Stata中的mi impute命令,对缺失值进行估计,例如:Copy Codeuse salary_data.dta, clearmi set mlongmi register imputed work_type) (income_age income_gender income_edu = age gender education), add(10)这里,我们使用salary_data.dta 我们可以使用Stata中的xtmixed命令进行混合效应模型分析,例如:Copy Codeuse PISA_data.dta, clearxtmixed math_score SES fam_educ_bkg || country_code: , mle这里,我们使用PISA_data.dta数据集进行演示,先使用use命令打开数据集。 ) (surface sales_price region, cmissing(white))这里,我们使用car_data.dta数据集进行演示,先使用use命令打开数据集。

    1.2K20编辑于 2023-05-11
  • 来自专栏Kevinello的技术小站

    pandas 大文件操作

    df = pd.concat(chunks, ignore_index=True) STORY 这几天有一个需求是读取.dta文件并转为.csv,google了一下发现pandas也是支持dta格式的 /data/excel/{}.csv' def dta_to_excel(origin_path): CHUNKSIZE = 2000 reader = pd.read_stata( origin_path, iterator=True) file_name = re.sub(r'\.dta', '', origin_path.split('/')[-1]) print /data/origin' # os.listdir:列出目标路径下的所有文件(文件夹) for path in os.listdir(origin_dir): dta_to_excel

    2K21编辑于 2022-08-19
  • 来自专栏生信小驿站

    使用pandas构建简单直观的数据科学分析流程

    reset -f %clear # In[*] import os import pandas as pd os.chdir('C:\\Users\\czh\\Desktop') # In[*] dta = pd.read_csv('USA_Housing.csv', sep=',', header=0) dta.columns Index(['Avg. ['House_size'] = dta['Avg. Area House Age') df2 = drop_age(dta) 对某一列进行热编码 # In[*] pipeline = pdp.ColDrop('Avg. Area House Age') pipeline+= pdp.OneHotEncode('House_size') df3 = pipeline(dta) df3.columns 整合示例:

    1.2K20发布于 2019-12-11
  • 来自专栏生信喵实验柴

    因子列表缺失数据

    genes121 <- read.csv("121genes.csv",header = T,stringsAsFactors = F) gene93 <- unique(genes121$gene) dta <- genes200[gene93,] dta <- na.omit(dta) rownames(dta) <- 1:nrow(dta)#86个行数重命名 alist <- list(dta=dta

    69510编辑于 2022-10-25
  • 来自专栏智药邦

    北京大学陈语谦团队提出DMFF-DTA模型,通过双模态特征融合神经网络进行药物靶点亲和力预测

    准确预测药物与靶点之间的结合亲和力(DTA)对于药物发现至关重要,但由于药物小分子与靶点蛋白质大分子之间相互作用的建模复杂性,准确预测其结合亲和力仍然具有挑战性。 然后,该模块结合连接层和链接注意力方法,获得基于序列模态的DTA嵌入信息。在MFEstr模块中,模型主要使用RdKit方法构建药物图。 最后,该模型将序列模式和图模式的信息连接起来,以实现最终的DTA预测。 图2 案例分析 在这项研究中,作者提出了DMFF-DTA,一种具有双模态特征融合和平衡机制的神经网络模型,用于准确预测药物靶点亲和力。 此外,DMFF-DTA模型使用Uniprot数据库的结合位点信息,在预测具有新的或未注释的结合位点的抑制剂的药物靶点亲和力方面可能存在局限性。

    1.1K10编辑于 2025-03-03
  • 来自专栏PyStaData

    Stata | 爬取企业景气指数与企业家信心指数

    \temp\temp`i'.dta", replace restore } use ". \temp\temp0.dta", clear forvalues i = 1/6{ merge 1:1 _n using ". \temp\temp`i'.dta", nogen } nrow save ". \result\result`p'.dta", replace } dis in result "第 -`p'- 页爬取完毕!" } 数据整理 openall, directory(". ", replace 绘图 use "企业景气指数与企业家信心指数.dta", clear tw (line 工业 季度 if 类型 == 1) /// (line 工业 季度 if 类型 ==

    75510发布于 2020-07-21
  • 来自专栏生信喵实验柴

    文件操作

    #查看数据结构 class(dta) #查看文件头部 head(dta) #查看文件尾部 tail(dta) #查看行名,列名 rownames(dta) colnames(dta) #View 窗口中查看数据 View(dta) #查看数据属性信息 str(dta) 四、函数写入文件 数据处理结束之后,需要将存储在变量中的结果保存到文件中,R 提供了大量写入文件的函数,这些函数通常与 read #写入文件 write.csv(x = dta,file = "matrix.csv",sep = ",",append = F) x:要写入文件中的数据集名字。 file = "vlookup.xlsx",sheetIndex = 1,header = T) #写入 Excel 文件,设置 sheet 名 write.xlsx(x = x,sheetName = "dta ",file = "dta.xlsx",append = F) 六、其他 R 数据格式 除了常规各种文本表格之外,R 还提供了两种文件格式,分别是 RDS 与 Rdata 格式。

    4K10编辑于 2022-10-25
领券