首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生物信息学、python、R、linux

    MHC区域

    MHC,就是主要组织相容性复合体 (major histocompatibility complex),是存在于大部分脊椎动物基因组中的一个基因家族,与免疫系统密切相关,其中人类的MHC糖蛋白,又称为人类白血球抗原 MHC区域位于位于6号染色体上(6p21.31),hg38基因组中29Mb 到 33Mb的位置。这个地方具有高基因密度、高多态性、高度的连锁不平衡等遗传特性。 这个区域中如上所述多态性高,SNPs有很多,以往09年一个研究(https://genome.cshlp.org/content/19/1/1.full.pdf+html)找到了一些等位基因不平衡位点,发现有很多分布在MHC MHC区域与许多自身免疫疾病有关。并且由于高度多态性,在无血缘关系的人群中,MHC表现型完全相同者是极其罕见的。所以可以用于亲子鉴定和寻找罪犯。

    2.2K10发布于 2020-06-02
  • Deepseek mHC 架构理解

    省流:mHC是传统Transformer架构的升级,增加【大并发】【灵活并发】两点能力1、技术溯源:DeepNeuralNetwork->Residuals->HC->mHC架构名称提出时间主要贡献者是否中国人所属机构 Residuals(残差网络)2015年何恺明、孙剑、任少卿、张祥雨是微软亚洲研究院HC(超连接)2024年9月字节跳动团队部分字节跳动mHC(流形约束超连接)2026年1月DeepSeek团队(梁文锋署名 mHC(流形约束超连接):由DeepSeek团队提出,通过将残差连接矩阵投影到双随机矩阵流形上,解决了HC的训练不稳定性问题,在保持性能的同时确保训练稳定。 架构mHC在传统单流残差连接基础上,引入了多流并行管道设计:1.管道宽度扩展传统Transformer:单一残差管道(C维)mHC架构:n个并行残差管道(n×C维),形成“管道束”2.过滤器升级新增预映射过滤器 架构优势mHC代表了管道-过滤器架构在LLM中的第三阶段演进:第一阶段:基础Transformer(单管道线性过滤)第二阶段:MoE架构(条件分支管道)第三阶段:mHC多流管道(并行连接拓扑)这种演进体现了从

    54840编辑于 2026-01-05
  • mHC 深度解读:当流形几何遇上残差网络

    本文将从论文技术细节出发,理解 mHC 背后的设计哲学。 mHC 将信号增益控制在了理论值 1 附近,实现了三个数量级的改进! baseline 这表明 mHC 不是小规模的 trick,而是可以真正 scale 的架构改进。 复现的现实考量 目前论文未开源代码,这意味着想要复现 mHC 的团队需要从零实现上述所有优化。 因此,6.7% 这个数字更多是 DeepSeek 工程能力的体现,而非 mHC 方法本身的固有开销。

    30310编辑于 2026-01-20
  • DeepSeek mHC 深度解读:当流形几何遇上残差网络

    扩展思考流形约束的一般模式mHC 体现了一个通用的设计模式:当无约束优化导致不稳定时,将参数约束到一个”良性”流形上。 :CV 的门控通常只在特定位置做一次,而 mHC 的矩阵要连乘几十次。 复现的现实考量目前论文未开源代码,这意味着想要复现 mHC 的团队需要从零实现上述所有优化。 因此,6.7% 这个数字更多是 DeepSeek 工程能力的体现,而非 mHC 方法本身的固有开销。 mHC的探索为基础模型的架构演进打开了一扇新的窗户,当 scaling law 的边际收益递减时,或许正是重新审视架构本身的好时机。

    57530编辑于 2026-01-05
  • 来自专栏智能生信

    Bioinfomatics | 深度神经网络实现多肽与MHC I类结合预测

    然而,在大多数情况下多肽需要与IC(50)<500 nM的高效MHC分子结合才能有效地引起免疫反应。因此,多肽与MHC结合是抗原呈递过程中的关键。 识别能与MHC分子结合的多肽是开发癌症疫苗的重要步骤之一。 过去二十年里,有两种常用的计算方法:(i)等位基因特异性预测方法通常为每个MHC等位基因(MHC alleles)训练一个模型。 在编码MHC序列时,作者只考虑那些与肽紧密结合的残基。这些残基形成一个短序列,称为MHC伪序列(MHC Pseudo sequence)。 与不同MHC等位基因结合的肽序列基序 四、总结 作者在这个工作中提出了一种新的深度学习框架ACME,用于多肽-MHC I类结合预测。 此外,ACME还可用于精确生成不同MHC等位基因的结合基序,可进一步用于研究肽MHCⅠ类结合的模式。

    1.5K30发布于 2021-02-04
  • 来自专栏智能生信

    CELL SYST|结合抗原加工改进MHC I类呈递多肽预测

    通过质谱法鉴定的自然存在的MHC配体,不仅阐明了结合基序,而且可以反映MHC结合之前发生的抗原加工步骤。因此,作者开发了一个MHCⅠ类表达的综合预测因子,它结合了MHCⅠ类结合和抗原加工的新模型。 一、研究背景 MHC I类呈递多肽的预测是疫苗设计和传染病、自身免疫和癌症研究的关键工具。目前使用的大多数预测工具仅关注MHC I类结合特性(BA)预测。 作者首先使用两层全连接神经网络通过偏好度量和MS数据集训练了一个新的泛等位基因预测因子称为MHC-flurry 2.0-BA以获得MHC I类配体信息。 二、实验结果 作者首先测试了新的MHC flurry2.0 BA预测因子(如图1A),并从其训练数据中得出质谱识别的MHC配体。该预测因子对大多数等位基因表现良好。 BA预测因子MONOALLELIC基准上实验结果 另外作者开发了一个MHC I类等位基因独立模型称为MHC FLURRY 2.0 AP,用于区分hits和decoys。

    81410发布于 2021-02-04
  • 来自专栏LLM

    从ResNet到mHC:DeepSeek重构残差连接,额外开销仅6.7%,附复现代码

    mHC的诞生面对HC的问题,DeepSeek提出了mHC,即Manifold-ConstrainedHyper-Connections(流形约束超连接),其核心思路为:将不可控的HresH^{res}Hres 下面为大家解释mHC几个重要概念。 关于mHC的更多知识,可参考https://www.k-a.in/mHC-math.htmlhttps://arxiv.org/pdf/2512.24880系统级实现与工程优化虽然Sinkhorn-Knopp 对于整体训练流程来说,mHC的计算几乎是免费的。选择性重计算(SelectiveRecomputation)由于mHC引入了n=4n=4n=4的扩展流,中间激活值的显存占用会增加。 相比于基线模型,mHC实现了全面的性能提升,并在大多数任务上超过了HC。

    10010编辑于 2026-02-24
  • 来自专栏DeepHub IMBA

    DeepSeek 开年王炸:mHC 架构用流形约束重构 ResNet 残差连接

    这篇 mHC 就是来填这个坑的,咱们顺着逻辑拆解一下。 这就引出了 mHC 的核心:流形约束(Manifold Constraint)。 别被这数学名词吓着:之前的 HC 是想让连接权重随便长,结果就长歪了;现在的 mHC 就是给这些权重矩阵加了个限制。 这就从理论上解释了为什么 mHC 可以堆叠到成百上千层而不崩塌,这部分其实是对现有架构理论的一个重要补充。 以前我们只知道“加个残差就好使”,现在 mHC 告诉我们:“只要你在流形上走路,哪怕姿势复杂点,也不会摔倒”。 但 mHC 提示了一个新的方向:层与层之间的拓扑结构(Topology)本身,还有巨大的挖掘空间。

    28510编辑于 2026-01-12
  • 来自专栏算法一只狗

    当残差不再是直线:DeepSeek 的 mHC 如何把 Hyper-Connections 拉回稳定区

    那DeepSeek最新的这篇论文:《mHC:Manifold-ConstrainedHyper-Connections》到底讲了什么呢? :把()投影到一个“守恒”的流形上,让它重新具备identity的稳定性mHC的改进的核心点在于:把每层的residualmixing矩阵(H^{res}_l)约束为“双随机矩阵(doublystochastic mHC又是“怎么把它稳住的”呢?从实验上看,在前期训练过程中,HCloss波动巨大,甚至有负值,说明训练初期residualmixing还没“学稳”。 而mHC作为reference,整体的loss基本单调、平滑,而且没有长期偏移在前向和后向传播上,多层连乘后,梯度链路被放大成“指数塔”。 写在最后如果用一句话来概括mHC这篇论文的价值,那就是:它不是在“发明一个更强的残差”,而是在回答,当我们开始动残差这个trick的时候,什么是绝对不能被破坏的底层约束。

    38220编辑于 2026-01-07
  • 来自专栏机器之心

    租了8张H100,他成功复现了DeepSeek的mHC,结果比官方报告更炸裂

    机器之心编译 元旦期间,DeepSeek 发布的 mHC 震撼了整个 AI 社区。 博客 1:https://taylorkolasinski.com/notes/mhc-reproduction/ 博客 2:https://taylorkolasinski.com/notes/mhc-reproduction-part2 HC 的损失在不同种子间的变化是 mHC 的 3 倍(±0.033 vs ±0.012)。至于 Amax?HC 根据种子的不同在 6.1 到 7.6 之间摆动。mHC 是 1.00。每一个种子。 mHC 通过强制守恒解决了第二个问题。 每一个残差连接都是一种守恒定律。mHC 强制执行了它。 不是黑客手段,不是技巧。这是一个原则性的约束,使架构能在规模化下工作。 mHC 找到了一个中间地带:比标准残差表达能力更强,且带有稳定性保证。 博客 2:10,924 倍:17 亿规模下的不稳定炸弹 下面是 mHC 复现系列的第 2 部分。

    18210编辑于 2026-01-22
  • 数据分析:完整的成体系的生存分析的结果汇总

    _noBatch", "MHC2_noBatch", "heterogeneity", "ploidy", "purity", "MHC1_zyg", "MHC2 MHC-I neoAgB", "abs. MHC-II neoAgB", "abs. diff. neoAgB", "norm. MHC-I neoAgB", "norm. _z <- (mean(ICB_data$MHC2, na.rm = T) - ICB_data$MHC2) / sd(ICB_data$MHC2, na.rm = T) # Z-score normalizationmodel MHC-I NeoAgB"), p_ls$p_neoAgB2 + ggtitle("MHC-II NeoAgB"), p_ls$p_pMHC2 + ggtitle("norm.

    48210编辑于 2024-11-18
  • 文献分享--血管STING激活促进自然杀伤细胞在小细胞肺癌中的抗肿瘤免疫

    结果1、神经内分泌MHC-I低表达/阴性小细胞肺癌在体外对NK细胞介导的细胞毒性敏感NE MHC-I低表达/阴性SCLC细胞系对NK细胞介导的细胞毒性高度敏感,而非NE MHC-I高表达SCLC细胞系则相对抵抗 与二维培养结果一致,NE MHC-I低表达/阴性SCLC细胞在直接混合时对NK细胞杀伤高度敏感,而非NE MHC-I高表达SCLC细胞系则相对抵抗。 在具有局灶性MHC-I表达的肿瘤中,免疫细胞(NK和T细胞)在空间上更倾向于靠近那些高表达MHC-I的肿瘤细胞,而远离MHC-I低表达的肿瘤细胞。 临床数据验证:通过独立临床队列的转录组数据验证,发现高MHC基因表达的SCLC患者具有更高的NK细胞特征评分。在MHC-I低表达组中,NK细胞评分最低的患者总生存期(OS)更差。 结果3、神经内分泌MHC-I阴性/弱阳性小细胞肺癌表现出免疫惰性表型趋化因子表达缺陷:通过患者标本的bulk RNAseq数据分析证实,与非NE MHC-I高表达SCLC相比,NE MHC-I低表达/阴性

    12320编辑于 2026-03-09
  • 来自专栏生信宝典

    综述:变温动物的适应性免疫

    然而,与MHC相关的NKR基因已在所有脊椎动物中发现,显示出MHC Ⅰ和NKRs早期相关性。 11 Evolution of the MHC MHC包括第一类、第二类和第三类区域,首次在软骨鱼中发现。在大多数物种中,经典的mhcⅠ类分子和mhcⅡ类分子的多态性水平很高。 与MHCⅠ类亚型相比,哺乳动物MHCⅡ类亚型的进化较慢,在变温动物可检测到MHCⅡ类亚型。DO分子在哺乳动物中是II类蛋白质,其通过DM分子调节肽与MHC II类分子的结合,在任何变温动物中均未发现。 有人推测,鳕鱼中大量的非经典MHCⅠ类分子可能以某种方式弥补了MHCⅡ类分子的缺失(Box1),但其他含有MHCⅡ类分子的物种也扩增了MHCⅠ类基因。 哪一类先出现:MHCⅠ类还是MHCⅡ类?对于MHCⅠ类,经典分子还是非经典分子先出现?MHCⅠ类分子的可塑性表明它们是原始分子,而MHCⅡ类分子的热力学稳定性是它们早出现的证据。

    2.8K30发布于 2018-12-19
  • 来自专栏DrugAI

    Nat. Mach. Intell. | ImmunoStruct: 赋能免疫原性预测的多模态深度学习框架

    研究人员提出 ImmunoStruct,一种融合序列、结构与生化性质的多模态深度学习模型,用于预测多等位基因 I 类肽–MHC 的免疫原性。 然而,免疫原性受多因素共同影响,包括肽–MHC 结合构象、肽在 MHC 表面的空间暴露以及与 TCR 的相互作用,仅依赖序列信息往往难以刻画这些关键决定因素。 尽管近年来出现了一些深度学习模型用于肽–MHC 预测,但多数方法未系统整合结构信息和生化特征,限制了预测精度和生物学解释能力。 方法 ImmunoStruct 通过三条并行分支分别建模肽–MHC 序列、三维结构和生化性质信息。 尽管如此,模型仍受限于公共肽–MHC 数据在等位基因和实验条件上的偏倚,以及缺乏 TCR 序列信息等问题。

    22220编辑于 2026-01-06
  • Nat. Commun. | 融合免疫原性筛选与克隆性新抗原图谱的免疫治疗响应精准预测框架

    该框架同时考虑 MHC-I 与 MHC-II 通路,并引入可解释的 T 细胞识别模型,揭示 MHC 分子不仅负责抗原呈递,还深度影响 TCR 识别过程。 同时,传统新抗原研究主要聚焦 MHC-I 通路,而越来越多证据显示 MHC-II 介导的 CD4⁺ T 细胞反应在抗肿瘤免疫中同样关键。 方法 研究人员开发 NeoPrecis 框架,包含两个核心模块: NeoPrecis-Immuno:基于深度学习的新抗原免疫原性预测模型,融合 MHC 结合模式与 TCR 识别特征,同时覆盖 MHC-I 与 MHC-II 通路。 核心创新包括: 将 MHC 结合模式引入 TCR 识别建模; 同时整合 MHC-I 与 MHC-II 通路; 构建克隆性感知的新抗原免疫景观。

    10810编辑于 2026-01-27
  • 来自专栏生信修炼手册

    使用NetMHCpan进行肿瘤新抗原预测分析

    NetMHCpan软件用于预测肽段与MHC I型分子的亲和性,最新版本为v4.0, 基于人工神经网络算法,以180000多个定量结合数据和MS衍生的MHC洗脱配体的组合为训练集构建模型。 结合亲和力数据来自人,小鼠,猪等多个物种的MHC分子,MS洗脱的配体数据来自55个人和小鼠的HLA等位基因。 第二步选择切割肽段的方式,抗原通过抗原表位与MHC分子结合,MHC I型分子可以结合的抗原表位长度为8到11个氨基酸,对应这里的8-11mer,先将蛋白质序列切分成短的肽段之后在进行MHC分子亲和性的预测 列数很多,其中的Peptide就是从原始的输入序列中提取出的长度为8-11个氨基酸的肽段,Pos对应肽段的在原始序列上的起始位置,第一个位置从0开始计数;Core对应与MHC结合的肽段序列,和blast 通过该软件可以从突变之后的氨基酸序列中预测到与MHC I型分子亲和力较强的肽段,作为候选的肿瘤新抗原。

    9.7K30发布于 2019-12-19
  • 来自专栏HaC的技术专栏

    git常用操作,merge、pull、push等

    关于merge 如果我是mhc分支,我提交的代码每次只能提交到push到mhc分支,每一次pull只能把mhc分支的东西pull下来。 所以存在一种情况,当develop主分支更新的时候,你需要更新mhc分支的代码,为什么develop分支会更新(因为别人也会提交代码到develop分支的),所以每天,或者你切换到develop分支查看右箭头 这样本地mhc分支就和develop分支版本一样了,然后你改了东西,提交到远程(即git的)仓库,然后到git 上面 发起merge request,请求合并到develop(或者你需要合并的分支)。 然后切到develop分支下,再merge一下mhc分支,然后pull一下代码,就能把刚刚mhc更新的代码pull下来了。

    92510发布于 2020-12-30
  • 来自专栏DrugAI

    Sci. Adv. | T-SCAPE: 融合跨领域信息的 T 细胞免疫原性预测框架

    T 细胞免疫原性指短肽片段在特定 MHC 分子呈递下诱导 T 细胞激活的能力,是适应性免疫反应的关键决定因素。 现有计算方法多集中于免疫级联反应中的单一环节,例如 MHC 结合或 TCR 识别,忽略了免疫过程的系统性和非线性特征,导致预测泛化能力受限。 MHC II 免疫原性预测的稳健性提升 针对 MHC II 免疫原性长期缺乏独立测试集的问题,研究人员构建了严格去同源的评测数据。 图 4|MHC I 免疫原性预测性能对比。 图 6|MHC II 免疫原性预测结果。 治疗性抗体免疫原性(ADA)预测 在不显式使用 MHC 信息的情况下,T-SCAPE 成功用于预测治疗性抗体诱导抗药抗体(ADA)的风险。

    13420编辑于 2026-01-06
  • 来自专栏科技记者

    PGG.MHC--人类主要组织相容性复合体基因数据库和分析平台

    )基因数据库和计算分析平台PGG.MHC(https://www.pggmhc.org/pggmhc或https://pog.fudan.edu.cn/pggmhc),论文题为“PGG.MHC: toward PGG.MHC收录了来自世界多个族群的53,254个个体的全基因组测序数据(WGS)/全外显子组测序数据(WES)/芯片数据,整合了其MHC基因型和单倍型频率信息,并在此基础上提供了一体化的查询、可视化 image 图1 HLA命名原理图 image 图2 PGG.MHC查询界面示意图 image 图3 PGG.MHC功能模块 简要地讲,PGG.MHC提供了高质量的HLA基因型和单倍型多样性数据信息 关于HAN.MHC参考的使用附如下: 一段时间以来,一直困惑于这个HLA填充参考怎么使用,直到看到了这篇论文课题组的博士论文《中国汉族人白癜风 MHC 区域精细定位研究》。 mv ped.txt ped.ped mv map.txt ped.map plink --file ped --make-bed --out HAN.MHC plink --bfile HAN.MHC

    1.1K60编辑于 2023-01-11
  • 来自专栏亨利笔记

    DeepSeek mHC 重构神经网络底层逻辑,V4R2 渐行渐近

    mHC 开启神经网络架构新篇章! 2025年12月31日,当全球都沉浸在跨年的热闹氛围里时,DeepSeek 依旧是“每逢佳节倍出新”的节奏,悄悄放了个大招:mHC(流形约束超连接)架构的技术论文。 而mHC,正是破解“极深层网络难稳定和难高效”这个核心难题的关键钥匙。 如果说 V3 和 R1 是在现有架构上把“算法”和“数据”玩到了极致,那么 mHC 就是在为未来的超大规模架构换地基。 三、mHC给超连接戴上“精准的数学镣铐” mHC的全称是“流形约束超连接”(英文:Manifold-Constrained Hyper-Connections),它的核心思路特别巧妙:不抛弃超连接“多车道 更关键的是,mHC没有为了稳定性牺牲性能,反而实现了“稳中有升”。 五、为什么说 mHC 是 V4 和 R2 的关键基石? DeepSeek选在2025年底发布mHC,绝非偶然。这是在为下一代双旗舰模型V4和R2铺路,mHC就是这两个模型的“核心骨架方案”。

    77610编辑于 2026-01-07
领券