首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >ChenRT:基于变长编码与稀疏离群点补偿的大模型微观残差量化架构

ChenRT:基于变长编码与稀疏离群点补偿的大模型微观残差量化架构

作者头像
陈恩华
发布2026-04-16 14:33:57
发布2026-04-16 14:33:57
940
举报
概述
ChenRT架构,针对大模型端侧量化中离群点导致的精度坍塌问题,创新采用“宏观分组+微观稀疏残差补偿”双轨设计,结合VarByte差分索引压缩,在Apple Silicon上仅增6.8%存储即实现2.38% MAE精度回升,兼顾高精度与低开销。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 摘要 (Abstract)
  • 1. 引言 (Introduction)
  • 2. ChenRT 架构设计 (Methodology)
    • 2.1 基于激活值感知的离群点筛选 (Input-Aware Outlier Selection)
    • 2.2 双轨 SIMD 延迟闭合计算 (Dual-Track SIMD Deferred Closure)
    • 2.3 VarByte 差分索引压缩 (VarByte Delta Index Compression)
  • 3. 实验与性能评估 (Experiments & Results)
    • 3.1 实验环境设定
    • 3.2 综合性能评估 (Evaluation)
    • 3.3 结果分析
  • 4. 结论 (Conclusion)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档