两蛋白间的分子对接—21 与Chatgpt之间的对话需要进行的是SFN和HDAC6两蛋白分子的对接,思路是Uniprot数据库中检索SFN与HDAC6蛋白质,挑选分别率最佳的构象。 使用HDOCK进行分子对接,挑选最佳对接结果导入PYMOL进行可视化。 这是我上一篇分子对接帖子的实现思路,但是是有问题的,在 选择构象的时候,未关注到结构的完整性,在分子对接前需要对分子进行处理,如去除多余配体,水分子等,再进行分子对接 。 以下记录和chatgpt的对话:2 优化后的分析流程具体看最后一条与chatgpt之间的对话现在的分析流程是下载AF-Q9UBN7-F1、AF-P31947-F1的PDB文件,不需要去除水分子和多余配体 使用HDOCK进行分子对接,HDAC6结构为受体,SFN为配体。
从中,18份代表性杂交稻材料被挑选用于构建包含万份个体的F2群体。 基于这些材料的基因型和表型数据,该研究从时间维度上评价了过去半个世纪的杂交育种成就,鉴定改良育种的分子印迹,量化改良育种关键位点的显性度和表型贡献率,总结育种遗传规律,深入解析亚种间杂种优势遗传基础,并构建了基因组选择模型 回顾杂交水稻半个世纪的育种成就 CEMPS 该研究通过分析2,839份杂交稻品种的表型变化趋势,回顾了改良育种的成就:1. 库器官显著增大,包括每穗粒数和有效穗数。 此外,由于训练集包含了大量亚种间杂交稻来源的F2个体,该模型能够有效处理亚种间杂交稻的基因型数据,从而适用于亚种间杂交组合选配,有望推动亚种间杂交稻育种的发展。 中国科学院分子植物科学卓越创新中心韩斌院士和中国水稻研究所杨仕华研究员为论文共同通讯作者,中国科学院分子植物科学卓越创新中心博士后顾周琳、中国水稻研究所龚俊义副研究员、中国科学院分子植物科学卓越创新中心博士研究生朱舟和李真为论文共同第一作者
第一种多性状选择: 分别计算出单性状的育种值,然后根据权重进行选择。这种方法有一定效果,但是模型中没有考虑到性状间的协方差,误差较大。 第二种多性状选择: 在计算时,用多性状模型,直接得到性状的育种值,然后再根据权重进行计算综合育种值进行选择。准确性高。 肯定推荐第二种多性状模型,因为准确性高,一步到位。 1. 多性状模型为何更优 在育种过程中,经常对多个性状进行选择,这些性状可能有遗传相关。 多性状模型可以充分利用性状的表型相关和遗传相关等信息,针对两性状或多性状对个体进行评估。 2. 遗传相关的原因 遗传相关的分子原因,可以分为两类: 第一大类是基因的一因多效和基因间的连锁造成的性状间的遗传相关。 .: 1 1 2 2 2 2 3 3 3 3 ... $ SEX : Factor w/ 2 levels "1","2": 1 1 2 1 2 1 2 1 1 1 ...
很多软件可以分析PCA,这里介绍一下使用plink软件和R语言,进行PCA分析,并且使用ggplot2绘制2D和3D的PCA图。 其中: A品种有200个体 B品种有100个体 C品种有112个体 $ wc -l re2.ped 412 re2.ped SNP个数为:41013 $ wc -l re2.map 41013 re2 = data.frame(pca_re1,Ind = iid) pca_re2$Gen = fid # 把PCA1,PC2,PC2的j解释百分比,命名为相应的轴 xlab = paste0("PC1( ",round(por[1]*100,2),"%)") ylab = paste0("PC2(",round(por[2]*100,2),"%)") zlab = paste0("PC3(",round (por[3]*100,2),"%)") # 绘制2-D PCA图 ggplot(pca_re2, aes(x=X1, y=X2,color=Gen)) + geom_point(size=2) +
Crop Science, 2010, 50(5):1681. 2. 关键词 DH: 双单倍体 GCA: 一般配合力 SCA:特殊配合力 GEBV: 基因组估计育种值 GS: 基因组选择 GS-BP: 基因组选择育种流程 LD: 连锁不平衡 MAS: 分子标记辅助选择 MAS-BP : 分子标记辅助选择育种流程 TBV: 真实育种值 YPU: 小区产量 3. 杂交种在3个环境下种植, 根据结果选择45个DH2进行后续测试. 第三年: 对于DH2自交, 同时用5个测验种测交, 杂交种在8个环境小种植, 选择10个DH2, 同时测试其与其他以有自交系的特殊配合力.
https://cpb-ap-se2.wpmucdn.com/blogs.auckland.ac.nz/dist/1/411/files/2018/12/1_Talk_AASC_Gezan-1qkphat.pdf 题目和作者 2. 混合线性模型可以做什么? 加性,显性,上位性的遗传分析 基因与环境互作 基因与年份互作 性状的遗传相关,表型相关分析 空间分析 结合系谱的分析 结合分子标记或基因组数据的分析 3. 52 分子矩阵缺失数据怎么处理? 53 A矩阵怎么和G矩阵结合? 一步法! 54 G矩阵中不正定怎么办? 55 GS面临的哪些挑战? 多倍体如何构建G矩阵? LMM提高育种数据的分析效率 分子数据应用范围广泛(动物,植物,人类等等) 现在软件可以非常灵活的,快速的,准确的计算和评估这些数据 57 ASreml???
分子对接—蛋白分子和小分子配体记录下蛋白分子和小分子配体之间的分子对接,以HSP90AA1蛋白和川陈皮素为例1 蛋白结构下载Uniprot数据库中检索HSP90AA1蛋白(物种:人类)。 #HSP90AA1蛋白结构sup/AF-P07900-F1-model_v4.pdb#川陈皮素结构sup/Structure2D_COMPOUND_CID_72344.sdf2 分子对接前准备使用pymol as 为mol2格式,文件名lig.mol2。 将前两步获得的rep.pdb,lig.mol2文件复制到AutoDock的工作目录中pymol中,导入rep.pdb文件,进行加氢操作。 记得保存口袋盒子的坐标,输出为grid.gpf格式sup/rep.pdbsup/lig.mol2sup/rep.pdbqtsup/lig.pdbqtsup/grid.gpf3 分子对接使用AutoDock
「育种值的准确性是什么呢?为何要计算育种值的准确性呢?」育种值的准确性的大小可以反应育种值计算的准确性如何,如果准确性高,就说明计算育种值时依赖的信息多(比如亲子关系、同胞关系等),结果就可靠。 《数量遗传与动物育种》. 东南大学出版社, 2004,P200,第四节:单性状BLUP育种值估计 ❞ dat = data.frame(id=c(4,5,6),sire = c(1,3,3),dam=c(2,2,4),y=c(200,170,180 所以准确性的公式为:r = sqrt(1 - (Cii*Ve)/Va) = sqrt( 1 - se^2/Va),可靠性是准确性的平方,所以可靠性的计算为1 - se**2/Va 注意,上面没有考虑近交系数的影响 ((1+inbreeding)*va)),reli = accur^2) 上面,计算了每个个体的BLUP值、准确性和可靠性,结果和书中结果一致。
动物育种中,由于动物基因型不一样,一般用同一个家系在不同的环境中养殖,虽然进行不一样,但是个体间有亲缘关系,也可以计算基因与环境互作(或者叫做环境遗传相关)。 育种中,数据分析的不同模型,都是为育种服务的,通过模型了解应用场景,然后会更深刻的了解育种的选择。 1. 「基因与环境互作中环境一般是指宏环境,微环境一般视为随机误差效应」 2. 2 0 0 3 3 0 0 4 4 0 0 5 5 0 0 6 6 0 0 > dat = asreml.read.table("phe.csv Dam Fam Changdi Sex phe phe_A phe_B 1 61 1 54 1_54 A M 196.8497 196.8497 NA 2
作者单位:德保罗大学、爱荷华州立大学等 发表年份:2022 文章地址:https://doi.org/10.1093/g3journal/jkac308 亚洲栽培棉是一种原产非洲和亚洲的棉花物种,是2个已驯化的二倍体物种之一 通过比较 Wagad 品种与野生品种基因组和转录组层面的差异,阐明了棉花基因组在驯化过程中的变化,这将为棉花育种提供新的见解。 文献讨论 驯化是一个重要的进化过程,人类介导的表型变化导致无数(通常是匿名的)相应的分子变化。了解改良表型的分子基础是许多现代育种计划的基本目标,这些计划可能结合使用传统和尖端育种技术来加速作物改良。 野生种质和驯化种质的比较可以提高我们对现代作物表型优势的分子基础的理解,并有助于我们理解如何利用野生种质来改良现代栽培品种(例如通过赋予抗病性)。 该序列补充了现有基因组组装和多样性研究,未了解棉花基因组结构和遗传多样性提供了基础,为二倍体棉花育种提供了额外的视角。
接前文:分子对接教程 | (1) 软件安装准备 关于蛋白质结构的PDB文件,做分子对接,估计大家都知道PDB这个蛋白质数据库啦。这里简单的介绍一下。 但是核磁共振法只能用于质量小于 70 千道尔顿的分子,大约对应 200 个氨基酸的长度。 这里的0.9Å,Å是光波长度和分子直径的常用计量单位,值越小,分辨率越高,结构越准确。页面往下拉,可以看见这个值越来越大,我们优先选择值小的。 总之,需要先了解这些所解析的晶体结构是否已经包含了拟对接分子的潜在结合位点,已知的配体和我们要对接的分子结构相似度。 比专业级的PyMOL(https://pymol.org/2/)。这个软件已经被世界上著名的生物医药软件公司“薛定谔公司(Schrödinger)”收购。
这个是星球内问题: 先说两个趋势: 趋势1: 农业的数据分析以后会越来越重要,因为分子数据的落地,包括分子标记辅助、GWAS和GS的应用,特别是基因组选择(GS)的落地,使得育种的效率大大提升,以后使用数据去育种将不再是纸面上冠冕堂皇的话 趋势2: 新兴的机器学习、神经网络等算法将会进入到育种数据分析中来,这一块的应用,还是要育种从业人员自己学习掌握,至少会调包,靠别人不如靠自己,要拥抱新技术,使用新技术。 痛点在哪里? 现有的教育环节中,对这一块涉及极少,我们学习的生物统计都是基于线性模型的,T检验+方差分析+回归分析,甚至连聚类分析和主成分分析都没有包含,而育种中的数据分析框架主要是混合线性模型+贝叶斯+机器学习,这些内容很偏 另外一个就是数量遗传学,如果打开植物的数量遗传学、玉米的数量遗传学,什么F1群体、F2群体、BC1群体,各种方差分解,公式推导,都是老掉牙很繁琐的东西,一学就放弃,一看就头晕。 2,通过R语言学习生物统计,包括传统方差分析、回归分析,也包括聚类、主成分和混合线性模型。
PPT链接 https://cpb-ap-se2.wpmucdn.com/blogs.auckland.ac.nz/dist/1/411/files/2018/12/1_Talk_AASC_Gezan- 2. 混合线性模型可以做什么? 加性,显性,上位性的遗传分析 基因与环境互作 基因与年份互作 性状的遗传相关,表型相关分析 空间分析 结合系谱的分析 结合分子标记或基因组数据的分析 ? 3. 草莓中实施GS的目标 草莓中不同性状如何选择GS模型 使用交叉验证检验预测效果 将GS流程整合到育种流程中 评估GS的效果 ? 30. 草莓常规育种流程 ? 31. 草莓基因型数据清洗 ? 32. LMM提高育种数据的分析效率 分子数据应用范围广泛(动物,植物,人类等等) 现在软件可以非常灵活的,快速的,准确的计算和评估这些数据 ? 57 ASreml??? ? 58 致谢 ? 多性状分析,遗传相关 机器学习基因组选择 阈值性状(分类性状) 综合育种值(选择指数)
个体i的PGS可以计算为每个SNPj=1的等位基因计数A(0、1或2)的总和。 ⋯..M、 乘以重量w, (类似GS中的间接法,比如rrBLUP、Bayes系列方法,根据SNP效应值进行累加得到育种值) 3,分子标记辅助选择(MAS) 利用与目标性状紧密连锁的分子标记 (如 SNP 通过标记,将多个优良基因聚合,在种质早期进行筛选,这种分子育种方法在动植物育种中被广泛使用。 优势2:预测模型的利器。 总结: 1,之前有个误区,分子标记辅助只对主效基因有帮助,科研文章中定位的很多基因和位点应用价值有限,真正有应用价值的是对应的主效基因,可以做回交育种、可以做转基因、可以做基因编辑。
该项工作追溯现代小麦品种中丢失了的遗传多样性宝库,综合运用基因组学、遗传学、生物信息学和分子生物学,量化并验证了当前小麦育种中未被利用的大量的优异变异,包括发现控制小麦高产且抗倒伏新基因、氮高效利用新基因 厉兵秣马打造小麦全基因组设计育种的利器:构建小麦资源数据库、开发基因组和生物信息新技术、构建分子标记辅助技术平台助力全基因组设计育种。 由于遗传效应的计算得到了系统量化并在田间进行单片段替换导入系的表型效应的检测,研究者有机会验证目标遗传位点的分子功能和育种价值。 团队还利用这些资源和工具开发了小麦基因型数据、单倍型数据和表型组数据和各种育种整合工具平台(https://wwwg2b.com),为全球小麦研究者提供了一个共享的数据资源。 ,为真正实现小麦从基因组研究到育种(G2B,Genome to breeding)的全链条贯通提供了系统解决方案和工具,标志着我国小麦育种研究进入到了基因组设计时代。
我国科学家在传统作物杂交育种和新分子育种提高作物产量方面作出巨大贡献,但依然迫切需要新技术应对未来的粮食挑战、森林草原修复和提供足够的植物原材料等问题。 北京大学化学与分子工程学院贾桂芳研究员课题组致力于研究RNA甲基化修饰N6-甲基腺嘌呤(m6A)调控植物生长发育及刺激响应的分子机制,绘制了植物拟南芥和玉米的m6A全转录图谱(Nature Communications 2014;Plant Physiology 2020),鉴定和解析了植物拟南芥中m6A去修饰酶ALKBH10B和m6A结合蛋白ECT2、CPSF30-L的生物功能(Plant Cell 2017, 2018 深入研究其分子机理发现,FTO介导的m6A去甲基化可以促进染色质的开放,激活转录,尤其是表型相关基因的转录。 该研究开发了一种革新的、具有普适性的表观遗传编辑育种技术,用于培育高产高生物量的优良品种,实现粮食增产。
所有这些田间试验结果显示,zmm28基因的过度表达可以将玉米的产量提高约2%。 成千上万个基因会间接影响作物产量。 审稿人更可能是分子生物学家或遗传学家,他们更多地关注论文的主要贡献,通常是由基因改良引起的分子生物学变化。 如果植物育种者已经与某个基因打交道了几十年,那么它极不可能突然带来重大的产量增益。 未来之路 在商业植物育种计划中,研究人员使用明确的测试阶段可靠地将发现转化为产品。 与药物开发中使用的一致标准以及临床试验和分子检测报告中使用的标准一样,植物科学家应制定标准,以定义每个阶段的最低产量测试标准。 当评估基因修饰对产量的影响时,分子生物学家、植物育种者、农学家和数量遗传学家之间的更多合作肯定会有所帮助。
这个数据库不仅为科研人员提供了宝贵的研究资源,也让我们得以从分子层面深入认识这种常见的蔬菜。 因此,构建整合多维数据的LettuceGDB数据库对促进生菜科学研究和育种具有重要意义。 测序流程 在数据处理过程中,研究团队使用Sentieon变异检测流程进行变异位点的鉴定。 此外,数据库还配备了浏览器、搜索引擎、过滤器等辅助功能,并建立了促进用户交流的社区平台,为生菜基因组学研究和分子育种提供了强有力的支持。 Sentieon 软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案 总之,LettuceGDB旨在成为一个重要的莴苣育种数据中心,为研究人员和育种者提供丰富的数据和便捷的访问,从而加速莴苣育种实践,推动莴苣研究和育种的进步。
关键词:小麦;分子育种;生信分析; 引言 普通小麦(AABBDD)源于7000-8000年前中东地区四倍体小麦与粗山羊草的自然杂交。约3500-4000年前传入中国,逐渐成为华北主要农作物。 系统发育分析使用MAFFT和FastTree构建VRN-A1基因的进化树,细胞遗传学验证则通过FISH/GISH技术,使用特异性探针在ZEISS Imager Z2显微镜下进行观察。 野生种质渗入的应用潜力 在粗山羊草渗入方面,研究以CM42为例,发现其与中国春相比在3D和4D染色体上存在两个大的渗入片段,以及在1D、2D和7D染色体上的几个中等大小渗入片段。 Sentieon 软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案 研究为优化育种策略提供了理论依据,有助于提高育种效率。还搭建了系统的基因组研究平台,为小麦分子育种提供重要的技术支持和资源保障。
正常的系谱 这里使用asreml包中的harvey.ped数据: > head(ped) Calf Sire Dam 1 101 Sire_1 0 2 102 Sire_1 0 3 Sire_2 <NA> <NA> 1 male 2 0 0 3: Sire_3 <NA> <NA> 1 male 3 0 0 4 Sire_2 <NA> <NA> 1 male 2 0 0 3: Sire_3 <NA> <NA> 1 male 3 0 0 4 2 A2 B2 3 3 A3 B3 4 4 A4 B4 5 5 A5 B5 6 6 A6 B6 7 7 A7 B7 8 8 A8 B8 Only the first 2 records are shown. 2: In checkped(ped_inter, addgen) : 5, A5, B5 3: In checkped(ped_inter