第一种多性状选择: 分别计算出单性状的育种值,然后根据权重进行选择。这种方法有一定效果,但是模型中没有考虑到性状间的协方差,误差较大。 第二种多性状选择: 在计算时,用多性状模型,直接得到性状的育种值,然后再根据权重进行计算综合育种值进行选择。准确性高。 肯定推荐第二种多性状模型,因为准确性高,一步到位。 1. 多性状模型为何更优 在育种过程中,经常对多个性状进行选择,这些性状可能有遗传相关。 多性状模型可以充分利用性状的表型相关和遗传相关等信息,针对两性状或多性状对个体进行评估。 遗传相关的原因 遗传相关的分子原因,可以分为两类: 第一大类是基因的一因多效和基因间的连锁造成的性状间的遗传相关。 不同环境下的遗传相关,为解决育种工作中的一个重要实际问题提供了理论依据,即在条件优良的种畜场选育的优良品种,推广到条件较差的其它条件生产厂是否能保持其优良特性。
很多软件可以分析PCA,这里介绍一下使用plink软件和R语言,进行PCA分析,并且使用ggplot2绘制2D和3D的PCA图。
2023年9月7日,中国科学院分子植物科学卓越创新中心韩斌团队在Nature Genetics在线发表了题为Structure and function of rice hybrid genomes 、 2023年9月7日,中国科学院分子植物科学卓越创新中心韩斌团队在Nature Genetics在线发表了题为Structure and function of rice hybrid genomes 基于这些材料的基因型和表型数据,该研究从时间维度上评价了过去半个世纪的杂交育种成就,鉴定改良育种的分子印迹,量化改良育种关键位点的显性度和表型贡献率,总结育种遗传规律,深入解析亚种间杂种优势遗传基础,并构建了基因组选择模型 杂交稻育种极大提高了水稻的产量,继半矮秆育种后实现了产量的第二次跃升,被誉为“第二次绿色革命”。 中国科学院分子植物科学卓越创新中心韩斌院士和中国水稻研究所杨仕华研究员为论文共同通讯作者,中国科学院分子植物科学卓越创新中心博士后顾周琳、中国水稻研究所龚俊义副研究员、中国科学院分子植物科学卓越创新中心博士研究生朱舟和李真为论文共同第一作者
动物育种中,由于动物基因型不一样,一般用同一个家系在不同的环境中养殖,虽然进行不一样,但是个体间有亲缘关系,也可以计算基因与环境互作(或者叫做环境遗传相关)。 育种中,数据分析的不同模型,都是为育种服务的,通过模型了解应用场景,然后会更深刻的了解育种的选择。 1.
文章的亮点是基因组选择在植物育种中的优势分析, 从时间成本, 金钱成本, 效益成本进行分析, 今天看来还是有很强的参考性. 1. 这里比较了MAS和GS两种方法, 在一定预算下玉米和冬小麦上进行育种测试, 结果表明GS相对于MAS可以提高遗传增益, 缩短育种周期. 3. 关键词 DH: 双单倍体 GCA: 一般配合力 SCA:特殊配合力 GEBV: 基因组估计育种值 GS: 基因组选择 GS-BP: 基因组选择育种流程 LD: 连锁不平衡 MAS: 分子标记辅助选择 MAS-BP : 分子标记辅助选择育种流程 TBV: 真实育种值 YPU: 小区产量 3. 常规育种, MAS和GS遗传增益 常规的育种的遗传增益, 小于MAS的育种遗传增益, 小于GS的遗传增益, 因此, GS育种的遗传增益要显著高于常规育种.
本来,植物育种的数据分析都是随机区组、增广试验、空间分析之类的,当碰到动物育种的领域,系谱信息、个体动物模型就出来了,更别提多性状模型、基因组选择、基因与环境互作,这些都是进阶的内容。 加性,显性,上位性的遗传分析 基因与环境互作 基因与年份互作 性状的遗传相关,表型相关分析 空间分析 结合系谱的分析 结合分子标记或基因组数据的分析 3. 52 分子矩阵缺失数据怎么处理? 53 A矩阵怎么和G矩阵结合? 一步法! 54 G矩阵中不正定怎么办? 55 GS面临的哪些挑战? 多倍体如何构建G矩阵? 如何将QTL和GS结合 分子数据如何整合 大型矩阵如何处理 56 结论 混合线性模型(LMM),分析RCBD,增广,空间分析,系谱数据,基因组数据,很有帮助,很好很强大。 LMM提高育种数据的分析效率 分子数据应用范围广泛(动物,植物,人类等等) 现在软件可以非常灵活的,快速的,准确的计算和评估这些数据 57 ASreml???
分子对接—蛋白分子和小分子配体记录下蛋白分子和小分子配体之间的分子对接,以HSP90AA1蛋白和川陈皮素为例1 蛋白结构下载Uniprot数据库中检索HSP90AA1蛋白(物种:人类)。 挑选最佳构象AF-P07900-F1(AlphaFold预测),下载其PDB格式文件;pubchem数据库中搜索川陈皮素(Nobiletin),获得其小分子结构的sdf格式文件。 pymol对 HSP90AA1蛋白结构进行删除水分子、删除无关配体或小分子等操作,重新输出文件为rep.pdbqt(一般下载的是AlphaFold预测的结构的话,不需要这个步骤,这里也做下);使用pymol 记得保存口袋盒子的坐标,输出为grid.gpf格式sup/rep.pdbsup/lig.mol2sup/rep.pdbqtsup/lig.pdbqtsup/grid.gpf3 分子对接使用AutoDock Vina对上述文件进行分子对接。
「育种值的准确性是什么呢?为何要计算育种值的准确性呢?」育种值的准确性的大小可以反应育种值计算的准确性如何,如果准确性高,就说明计算育种值时依赖的信息多(比如亲子关系、同胞关系等),结果就可靠。 ❝育种值也可以计算可靠性,它是准确性的平方 ❞ 另外,对于不同性状或者不同试验的BLUP值的准确性进行比较时,因为方差组分、标准误、BLUP值都不一样,没有一个标准,可以用准确性(accuracy)这个指标进行比较 《数量遗传与动物育种》. 东南大学出版社, 2004,P200,第四节:单性状BLUP育种值估计 ❞ dat = data.frame(id=c(4,5,6),sire = c(1,3,3),dam=c(2,2,4),y=c(200,170,180
通过比较 Wagad 品种与野生品种基因组和转录组层面的差异,阐明了棉花基因组在驯化过程中的变化,这将为棉花育种提供新的见解。 Sentieon软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案 文献讨论 驯化是一个重要的进化过程,人类介导的表型变化导致无数(通常是匿名的)相应的分子变化。了解改良表型的分子基础是许多现代育种计划的基本目标,这些计划可能结合使用传统和尖端育种技术来加速作物改良。 野生种质和驯化种质的比较可以提高我们对现代作物表型优势的分子基础的理解,并有助于我们理解如何利用野生种质来改良现代栽培品种(例如通过赋予抗病性)。 该序列补充了现有基因组组装和多样性研究,未了解棉花基因组结构和遗传多样性提供了基础,为二倍体棉花育种提供了额外的视角。
这个数据库不仅为科研人员提供了宝贵的研究资源,也让我们得以从分子层面深入认识这种常见的蔬菜。 因此,构建整合多维数据的LettuceGDB数据库对促进生菜科学研究和育种具有重要意义。 测序流程 在数据处理过程中,研究团队使用Sentieon变异检测流程进行变异位点的鉴定。 此外,数据库还配备了浏览器、搜索引擎、过滤器等辅助功能,并建立了促进用户交流的社区平台,为生菜基因组学研究和分子育种提供了强有力的支持。 Sentieon 软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案 总之,LettuceGDB旨在成为一个重要的莴苣育种数据中心,为研究人员和育种者提供丰富的数据和便捷的访问,从而加速莴苣育种实践,推动莴苣研究和育种的进步。
加性,显性,上位性的遗传分析 基因与环境互作 基因与年份互作 性状的遗传相关,表型相关分析 空间分析 结合系谱的分析 结合分子标记或基因组数据的分析 ? 3. 大纲 ? 4. 草莓中实施GS的目标 草莓中不同性状如何选择GS模型 使用交叉验证检验预测效果 将GS流程整合到育种流程中 评估GS的效果 ? 30. 草莓常规育种流程 ? 31. 草莓基因型数据清洗 ? 32. 如何将QTL和GS结合 分子数据如何整合 大型矩阵如何处理 ? 56 结论 混合线性模型(LMM),分析RCBD,增广,空间分析,系谱数据,基因组数据,很有帮助,很好很强大。 LMM提高育种数据的分析效率 分子数据应用范围广泛(动物,植物,人类等等) 现在软件可以非常灵活的,快速的,准确的计算和评估这些数据 ? 57 ASreml??? ? 58 致谢 ? 多性状分析,遗传相关 机器学习基因组选择 阈值性状(分类性状) 综合育种值(选择指数)
然而,在过去几十年中使用的更加传统的植物育种方法展现了关于基因修改在未来几十年内可能实现的作物产量的完全不同的画面。育种家和数量遗传学家认为,在单个世代中,作物产量真正的突破意味着产量增加约1-5%。 审稿人更可能是分子生物学家或遗传学家,他们更多地关注论文的主要贡献,通常是由基因改良引起的分子生物学变化。 如果植物育种者已经与某个基因打交道了几十年,那么它极不可能突然带来重大的产量增益。 未来之路 在商业植物育种计划中,研究人员使用明确的测试阶段可靠地将发现转化为产品。 与药物开发中使用的一致标准以及临床试验和分子检测报告中使用的标准一样,植物科学家应制定标准,以定义每个阶段的最低产量测试标准。 当评估基因修饰对产量的影响时,分子生物学家、植物育种者、农学家和数量遗传学家之间的更多合作肯定会有所帮助。
该项工作追溯现代小麦品种中丢失了的遗传多样性宝库,综合运用基因组学、遗传学、生物信息学和分子生物学,量化并验证了当前小麦育种中未被利用的大量的优异变异,包括发现控制小麦高产且抗倒伏新基因、氮高效利用新基因 团队分析了各大性状相互之间的相关性,量化什么样的品系携带了什么样的有利性状和优异遗传变异,并致力于打破性状之间的拮抗连锁关系(trade-off),开发了高密度基因芯片以及一系列特定目标性状的遗传位点定位、聚合和分子标记辅助检测工具 厉兵秣马打造小麦全基因组设计育种的利器:构建小麦资源数据库、开发基因组和生物信息新技术、构建分子标记辅助技术平台助力全基因组设计育种。 由于遗传效应的计算得到了系统量化并在田间进行单片段替换导入系的表型效应的检测,研究者有机会验证目标遗传位点的分子功能和育种价值。 “麦豆的碳氮”问题,以Plant Trait-based Phylogenomics、Crop Quantitative Genetics 为工具,长期从事植物系统发育进化基因组学、关键性状起源和演化分子机制
我国科学家在传统作物杂交育种和新分子育种提高作物产量方面作出巨大贡献,但依然迫切需要新技术应对未来的粮食挑战、森林草原修复和提供足够的植物原材料等问题。 北京大学化学与分子工程学院贾桂芳研究员课题组致力于研究RNA甲基化修饰N6-甲基腺嘌呤(m6A)调控植物生长发育及刺激响应的分子机制,绘制了植物拟南芥和玉米的m6A全转录图谱(Nature Communications 该研究发现,通过调节RNA表观遗传修饰m6A水平可促进植物生长,提高作物产量和生物量,作为首个粮食增产的表观遗传育种新技术,未来有望推进我国农业技术发展。 深入研究其分子机理发现,FTO介导的m6A去甲基化可以促进染色质的开放,激活转录,尤其是表型相关基因的转录。 该研究开发了一种革新的、具有普适性的表观遗传编辑育种技术,用于培育高产高生物量的优良品种,实现粮食增产。
这里推荐我写的R包learnasreml中的check_pedigree函数,简单好用,结果友好。能够检查:
这个是星球内问题: 先说两个趋势: 趋势1: 农业的数据分析以后会越来越重要,因为分子数据的落地,包括分子标记辅助、GWAS和GS的应用,特别是基因组选择(GS)的落地,使得育种的效率大大提升,以后使用数据去育种将不再是纸面上冠冕堂皇的话 趋势2: 新兴的机器学习、神经网络等算法将会进入到育种数据分析中来,这一块的应用,还是要育种从业人员自己学习掌握,至少会调包,靠别人不如靠自己,要拥抱新技术,使用新技术。 痛点在哪里? 现有的教育环节中,对这一块涉及极少,我们学习的生物统计都是基于线性模型的,T检验+方差分析+回归分析,甚至连聚类分析和主成分分析都没有包含,而育种中的数据分析框架主要是混合线性模型+贝叶斯+机器学习,这些内容很偏
⋯..M、 乘以重量w, (类似GS中的间接法,比如rrBLUP、Bayes系列方法,根据SNP效应值进行累加得到育种值) 3,分子标记辅助选择(MAS) 利用与目标性状紧密连锁的分子标记 (如 SNP 分子标记来源于主效QTL或者GWAS得到的大效应位点或者已知基因的信息,特点是效应比较大或者是质量性状(孟德尔性状)。 通过标记,将多个优良基因聚合,在种质早期进行筛选,这种分子育种方法在动植物育种中被广泛使用。 动植物育种中,可以充分借鉴已有的研究成果,将相关的基因、结果、引物搜集起来,现在很多物种都有现成的数据库,再结合自己的群体,收集基因型和表型数据作为验证群体,用于挖掘可靠的位点数据(建模),后面进行应用 总结: 1,之前有个误区,分子标记辅助只对主效基因有帮助,科研文章中定位的很多基因和位点应用价值有限,真正有应用价值的是对应的主效基因,可以做回交育种、可以做转基因、可以做基因编辑。
最近有老师问如何计算多个育种值的综合育种值,因为选择育种时,需要考虑多个性状,而这些性状单位不一样,怎么合并计算? 这里面其实就是包括两部分内容: 1,多个性状的育种值进行标准化 2,多个性状的育种值赋予权重 为何要进行标准化? 所谓标准化,就是将数据变为平均数为0,方差为1的数据集。 然后可以对不同的性质设置不同的权重,才可以进行综合育种值的计算。 标准化就是将育种值减去平均育种值,然后除以标准差。公式如下: 为何要对不同性状赋予权重? 最后将权重对应的性状相乘,相加变为综合育种值。 3,权重的设置,来源于育种的经验数值,科学的确定权重的大小,需要考虑经济效益。
有两个主要原因说明植物育种中对输入平均值的遗传力感兴趣(Schmidt等人,2019a): 1,计算这个参数,可以帮育种家预测选择相应 2,这是一种用于评估品种评估试验结果的有用性和准确性的描述性度量。 2,One stage和Two stage Two stage,两阶段方法,就是先计算单个地点的育种值,然后再计算一年多点或者多年多点的数据,这里多个年份或者多个地点,都看做是不同的环境。
关键词:小麦;分子育种;生信分析; 引言 普通小麦(AABBDD)源于7000-8000年前中东地区四倍体小麦与粗山羊草的自然杂交。约3500-4000年前传入中国,逐渐成为华北主要农作物。 解读文章,给做进化育种的老师学生们一些参考。 CM42不仅作为主要品种被广泛种植,还在中国西南地区育种中被用作新的创始基因型,表明渗入片段未对育种造成不利影响,同时证实了粗山羊草在小麦育种中的重要潜力。 Sentieon 软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案 研究为优化育种策略提供了理论依据,有助于提高育种效率。还搭建了系统的基因组研究平台,为小麦分子育种提供重要的技术支持和资源保障。