首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏让技术飞起来

    量化方式实现灰度发布落地

    由于本次调研的范围和时间有限,所以我认为较好用的轻量化灰度发布方案就暂时罗列这两类,当然方案有千千万,选择自己合适的就好。

    1.1K40编辑于 2022-09-15
  • 来自专栏集智书童

    大模型落地的必经之路 | GPTQ加速LLM落地,让Transformer量化落地不再困难

    此外,作者目前的结果不包括激活量化,因为在作者的目标情境中,它们不是一个重要的瓶颈;然而,可以使用其他技术来支持它。 2、相关工作 量化方法大致可以分为两类:训练期间的量化和后期量化方法。 2.1 PTQ量化 大多数后期量化方法主要关注视觉模型。通常,准确的方法通过对个别层或连续层的小块进行量化。 3、 背景方法 3.1 逐层量化 从高层次来看,作者的方法遵循了最先进的后期量化方法的结构,通过逐层进行量化,为每一层解决相应的重构问题。 然后,OBQ独立处理每一行w,逐个量化一个权重,同时始终更新所有尚未量化的权重,以弥补量化单个权重所带来的误差。 很可能是因为具有大个体误差的量化权重数量稍微较低,但这些权重在过程的末尾被量化时,只有很少的其他未量化权重可以用来进行补偿调整。

    1.7K40编辑于 2023-11-15
  • 来自专栏arXiv每日学术速递

    大模型落地的必经之路 | GPTQ加速LLM落地,让Transformer量化落地不再困难

    此外,作者目前的结果不包括激活量化,因为在作者的目标情境中,它们不是一个重要的瓶颈;然而,可以使用其他技术来支持它。 2、相关工作 量化方法大致可以分为两类:训练期间的量化和后期量化方法。 2.1 PTQ量化 大多数后期量化方法主要关注视觉模型。通常,准确的方法通过对个别层或连续层的小块进行量化。 3、 背景方法 3.1 逐层量化 从高层次来看,作者的方法遵循了最先进的后期量化方法的结构,通过逐层进行量化,为每一层解决相应的重构问题。 然后,OBQ独立处理每一行w,逐个量化一个权重,同时始终更新所有尚未量化的权重,以弥补量化单个权重所带来的误差。 很可能是因为具有大个体误差的量化权重数量稍微较低,但这些权重在过程的末尾被量化时,只有很少的其他未量化权重可以用来进行补偿调整。

    2K30编辑于 2023-11-15
  • 《工业CAD数据数字孪生落地量化导入指南》

    、运维、仿真等场景的核心诉求,这才是突破工业数字孪生落地卡点的核心关键,也是后续所有技术操作的底层逻辑,更是从根本上解决精度与实时性矛盾的唯一路径。 精度校验与轻量化程度的动态调优体系,是保障工业CAD数据轻量化导入与实时可视化工业价值的关键,这一体系并非单一的精度检测,而是基于工业场景需求的多维度、动态化的迭代优化过程,确保轻量化后的模型始终在精度保留与实时性之间达到最优平衡 在此基础上,建立轻量化程度的量化评估模型,将数据体量缩减率、渲染帧率、核心特征精度保留率作为三大核心评估维度,针对不同的工业场景调整各维度的权重,比如静态展示类的数字孪生场景,可适当提升数据体量缩减率的权重 通过这种循环迭代的方式,形成针对不同工业场景的定制化调优方案,让轻量化与可视化技术能精准适配各类工业应用的实际需求,避免出现“为了轻量化而牺牲精度”或“为了精度而放弃实时性”的极端情况。 比如在航空航天零部件装配的数字孪生场景中,需要轻量化后的CAD数据能直接支撑零部件的虚拟装配仿真,保留高精度的配合面特征与装配公差信息,实现装配间隙的实时检测与干涉预警,此时轻量化处理需重点强化装配关系的精度保留

    18210编辑于 2026-02-05
  • 《Python生态事件溯源与CQRS轻量化落地指南》

    真正的轻量化落地,从来不是对复杂架构的生搬硬套,而是基于Python的语言特性,对事件溯源与CQRS的核心思想进行深度解构与重塑—剥离那些冗余的概念包装,聚焦“状态源于事件”“读写职责分离”的核心逻辑, CQRS读写职责的清晰剥离,需要依托Python生态的轻量化特性,拒绝过度分层的架构设计,回归职责分离的本质。 事件存储的极简实现,是Python生态落地事件溯源的核心痛点,也是保持架构简洁性的关键环节,其核心是聚焦事件存储的本质需求,拒绝过度设计。 事件重放与状态重建的轻量化策略,需要充分利用Python的语言特性,避免复杂的状态机设计,回归状态重建的本质逻辑。 这种轻量化的重放策略,既满足了业务需求,又保持了架构的简洁性,充分发挥了Python的语言优势。

    11600编辑于 2026-01-10
  • 来自专栏陈哥聊测试

    当DevOps落地实施撞上技术债务,如何量化债务突破困局

    想必不少朋友在推进DevOps落地时,都或多或少遇到过技术债的问题。我们该如何有效解决这个问题呢?今天,我邀请了禅道专栏作者李斌,和我们分享一下DevOps实践中量化技术债的方法。 但在实际落地过程中,技术债务却成为其顺利实施的阻碍。本文将从DevOps实施的前、中、后三个阶段,结合我的个人经验,阐述如何通过量化债务实现破局。一、什么是技术债务? 对于管理层而言,只有通过量化数据指导业务目标的达成与改善,才能更有力地推动DevOps落地及技术债务的解决。 综上,结合技术债类型、DevOps工具体系,可落地量化维度和方法,形成具有实操价值的研发治理框架:3.守城:可视化债务&行动清单&债务文化债务量化&治理体系的搭建非一朝一夕,可以一边破局,一边守城。 三、需要注意哪些问题1.量化治理需集中攻坚技术债的累积会直接降低DevOps的「反馈循环效率」,量化是治理的前提。虽说看似简单,但量化与治理实则如同“先有鸡还是先有蛋”的关系。

    42010编辑于 2025-08-26
  • 腾讯OpenClaw:重构企业AI智能体体系与量化ROI落地

    然而,企业在实际部署与应用AI Agent时,面临着显著的“木桶效应”与业务落地鸿沟: 单兵作战与记忆缺失: 传统Chatbot无记忆、被动触发且单兵作战,无法处理跨周期的复杂业务流,导致经验无法随流程固化 锁定多维业务场景的量化效能提升 通过引入多模态策略与自动化工作流,OpenClaw在实际业务中实现了从执行效率到研发成本的显著优化: 部署效率跃升: 企业云端专属Agent平台实现零门槛开通,配置完成到全员投入生产仅需 拆解多智能体协同与自动化落地案例 在实际业务流中,OpenClaw通过“拆解任务、多维并行”展现了极高的可执行价值: AI编辑部:7人协作新闻生产流水线 基于WorkBuddy原生多Agent团队能力, 构筑底层自研与权威认证的技术护城河 腾讯凭借在AI原生应用领域的深度积累,为大模型落地提供了具备高合规性与技术确定性的基础设施保障: 首批通过国家级安全测评: 腾讯全系“龙虾”产品(WorkBuddy、

    32410编辑于 2026-04-16
  • 无代码开发轻量化实践:企业高效落地的核心路径

    1.3 轻量化适配,保障灵活扩展适配企业轻量化需求,支持快速部署与灵活调整。开发完成的应用可一键发布至多终端,自动兼容电脑、手机等设备,无需单独进行多端适配开发。 二、无代码开发的高效落地实践路径2.1 需求聚焦:锁定核心场景,规避功能冗余落地前需精准梳理业务痛点,聚焦核心需求场景,避免盲目追求“大而全”。 2.3 分步落地:小范围试点,迭代优化推广采用“试点-优化-推广”的分步策略降低落地风险。 三、AI+无代码:轻量化开发的智能化进阶AI技术与无代码的轻量化融合,进一步放大了工具的“简单好用”优势。 企业通过聚焦核心需求、科学选型工具、分步落地推广,再结合AI技术的轻量化赋能,可高效发挥无代码工具的优势,以低成本、高效率完成数字化起步,让技术真正服务于业务增长。

    13710编辑于 2026-01-14
  • 腾讯云数字安全免疫力体系与量化落地实践

    当前行业面临的量化威胁与管理瓶颈主要集中在以下维度(数据来源:《2023上半年云安全态势报告手册》、国家信息安全漏洞库、Chainalysis): 高频实战攻击加剧: 2024年上半年,新增漏洞数超过 量化业务效能:千行百业的云上安全落地指标 依托4+N体系,腾讯安全在零售、物流、工业、金融等核心行业实现了具备高确定性的业务价值落地,显著降低运维成本并提升系统稳定性: 无感升级与成本削减(百果园):

    2400编辑于 2026-04-26
  • 来自专栏计算机视觉战队

    深度学习框架落地 | 量化网络的重要性(附源码地址下载)

    但是如果能在训练过程中去模拟量化的过程,让网络学习去修正量化带来的误差,那么得到的量化参数应该是更准确的,而且在实际量化推断中模型的性能损失应该能更小。 训练模拟量化 方法介绍 首先来看下量化的具体定义,对于量化激活值到有符号8bit整数,论文中给出的定义如下: ? 而训练量化说白了就是在forward阶段去模拟量化这个过程,本质就是把权值和激活值量化到8bit再反量化回有误差的32bit,所以训练还是浮点,backward阶段是对模拟量化之后权值的求梯度,然后用这个梯度去更新量化前的权值 对称量化在最大或最小值间选择最大的绝对值作为量化范围,不设置零点,量化的浮点范围关于原点对称。 ? 当使用非对称量化时,量化范围被充分利用,浮点数的min、max直接映射到量化范围的min、max;当使用对称量化时,如果浮点数分布偏向零点一侧,会造成量化范围利用率降低(如ReLU,相当于有效位减少了1bit

    1.2K10发布于 2021-01-14
  • 无代码:数字化转型的轻量化落地路径与实践逻辑

    本文将从无代码的崛起逻辑、应用场景、技术融合及落地要点出发,探讨其在数字化转型中的实践价值。 3.2 轻量化融合的实践边界AI+无代码的应用需坚守“业务导向”原则,避免过度追求技术噱头。 落地前需明确核心场景,聚焦“最痛、最频繁”的业务需求,例如先解决审批流程自动化,再逐步扩展到客户管理、数据报表等场景,小步快跑验证价值后再迭代升级。 它并非替代传统代码开发,而是形成互补——复杂核心系统仍需专业开发,而高频变动、个性化的业务场景则可通过无代码快速落地。 随着AI等技术的轻量化融合,无代码将进一步降低数字化门槛,成为中小企业数字化转型的“普惠工具”。

    23010编辑于 2025-12-15
  • 中小企业轻量化数字化转型:低代码高效落地指南

    二、中小企业低代码落地的关键实施策略2.1 前期:精准梳理需求,聚焦核心场景中小企业数字化转型需避免“大而全”的误区,应优先梳理核心业务痛点。 建议通过业务部门访谈、流程拆解等方式,明确亟待解决的场景需求,如客户管理、库存统计、审批流程自动化等,优先搭建覆盖核心场景的轻量化应用。 2.2 中期:分阶段落地,强化内部赋能低代码落地可分为“试点-推广-深化”三个阶段。 通过精准需求梳理、分阶段落地、科学运维,中小企业可充分发挥低代码的优势,实现数字化转型的“从0到1”突破。而AI与无代码的融合,更将进一步放大技术普惠价值,助力中小企业在数字经济浪潮中实现高质量发展。

    29910编辑于 2026-01-14
  • 来自专栏计算机视觉战队

    首个全量化Vision Transformer的方法FQ-ViT,AI大模型落地不远了!

    然而,大多数现有的量化方法主要是针对卷积神经网络开发的,并且在完全量化的vision Transformer上应用时会出现严重的掉点。今天我们就分享一个新技术,实现高精度量化的Vit部署。 AI大模型落地使用离我们还远吗? 结合这些方法,本文首次实现了全量化Vision Transformer的训练后量化。 02 新框架 下面的这两张图表明,与CNN相比,视觉转换器中存在严重的通道间变化,这导致了分层量化的不可接受的量化误差。 首先解释网络量化符号。 其量化器Q(X|b)可定义为: 为了实现完全量化的视觉变换器,研究者对所有模块进行量化,包括Conv、Linear、MatMul、LayerNorm、Softmax等。

    55510编辑于 2024-12-30
  • 来自专栏计算机视觉战队

    首个全量化Vision Transformer的方法FQ-ViT,AI大模型落地不远了!

    然而,大多数现有的量化方法主要是针对卷积神经网络开发的,并且在完全量化的vision Transformer上应用时会出现严重的掉点。今天我们就分享一个新技术,实现高精度量化的Vit部署。 AI大模型落地使用离我们还远吗? 结合这些方法,本文首次实现了全量化Vision Transformer的训练后量化。 02 新框架 下面的这两张图表明,与CNN相比,视觉转换器中存在严重的通道间变化,这导致了分层量化的不可接受的量化误差。 首先解释网络量化符号。 其量化器Q(X|b)可定义为: 为了实现完全量化的视觉变换器,研究者对所有模块进行量化,包括Conv、Linear、MatMul、LayerNorm、Softmax等。

    56510编辑于 2023-08-24
  • ADP智能体平台驱动多行业AI落地:从痛点破解到量化增效

    破解多行业AI落地共性瓶颈 当前企业AI落地面临多重战略困境:知识管理体系庞大且更新频繁(如医药行业制度体系更新快、执行标准不一),导致检索低效;合规要求严苛(如医药、能源行业)与内部数据分散(器械行业 ),且依赖外部模型存在Token成本高、政策约束、请求异常致系统瘫痪风险(器械行业案例);系统对接壁垒(零售行业IT Service Desk缺乏API打通机制)与缺乏ROI评估机制(器械行业),难以量化成本节约与业务提升成效 undefined配套AI Agent落地端到端能力,涵盖部署实施(统一身份认证、私有化部署、容量评估、高可用方案)、系统集成(IAM/业务系统/MCP协议集成)、场景落地(数据预处理/清洗、知识库构建 、工作流编排)、运维运营(平台/Agent排障、培训、推广)(数据来源:客户落地关键要点)。 量化业务指标验证客户价值 安畅ADP方案通过系统稳定性、运维成本(Ops Cost)、开发效率核心指标驱动ROI: 服务规模:帮助500+大型客户迁移上云,助力200+客户完成云原生改造,为100+

    17010编辑于 2026-04-09
  • 来自专栏韩曙亮的移动开发专栏

    【Cubase】Cubase 量化设置 ( 量化预置 | 长度量化 | 快捷键设置 | 量化开头 | 量化 MIDI 事件结尾 | 量化 MIDI 事件长度 )

    文章目录 一、要解决的问题 二、量化预置 三、长度量化 四、快捷键及设置 1、快捷键及设置 2、量化开头 3、量化 MIDI 事件结尾 4、量化 MIDI 事件长度 五、对 MIDI 进行量化操作 本博客中的所有设置都是在 ; 三、长度量化 ---- 长度量化 参数设置 : 在下图 处设置长度量化 , 如果设置成 " 1/16 " , 那么使用鼠标拖动时 , 音符的长度只能是 16 分音符的整数倍 ; 上述的 量化预置 ; 2、量化开头 量化开头 : 默认按键 " Q " 是量化开头 ; 将所有音符的开始位置对齐到 " 量化预制 " 对应的格子中 ; 该设置是系统自带的 , 不建议修改 ; 3、量化 MIDI 事件结尾 量化 MIDI 事件结尾 : 首先选中左侧的 " 量化类别 / 量化 MIDI 事件结尾 " , 点击右侧的 " 输入快捷键 " 下方的输入框 ; 输入快捷键后 , 点击 " 指定 " " 快捷键 , 量化音符长度 , 此时音符都排列整齐了 , 音符开头和音符长度进行了量化 , 音符结尾自然也进行了量化 ;

    4.6K00编辑于 2023-03-28
  • 来自专栏集智书童

    南京大学提出量化特征蒸馏方法QFD | 完美结合量化与蒸馏,让AI落地更进一步!!!

    本文提出了一种新颖而高效的QAT方法,即量化特征蒸馏(QFD)。QFD首先将量化(或二值化)表示作为教师进行训练,然后使用知识蒸馏(KD)对网络进行量化。 2、相关工作 神经网络量化可以分为两种范式: 量化感知训练(QAT) 后训练量化(PTQ) 在本文中,作者采用了QAT。 2.2、量化中的知识蒸馏 知识蒸馏(KD)在各种计算机视觉任务中很受欢迎,并逐渐在量化感知训练中出现。量化知识蒸馏的核心思想是:利用全精度教师来恢复量化学生网络的准确性。 3.1、准备工作 作者采用了Lee,Kim和Ham的方法作为基准方法,该方法是由归一化、量化和反量化步骤组成的均匀量化器。 3.2、量化特征蒸馏 作者首先定义量化感知训练中的基本符号表示,然后介绍作者的量化特征蒸馏方法,如图3所示。

    1.8K31编辑于 2023-09-04
  • 腾讯云AI原生云:加速Agent落地的Infra解决方案与量化成效

    具体瓶颈包括对AI Infra的三重要求:更快模型推理(模型推理速度、服务启动速度)、更灵活工具集成(工具链适配)、更可靠系统守护(主动发现、故障自愈),传统Infra难以支撑Agent规模化落地量化Agent Infra应用的业务成效 方案落地后实现关键指标优化(数据来源:腾讯全球数字生态大会): 模型推理效率:TACO-DIT推理效率提升122%;TKE&qGPU使GPU使用率提升80%

    25830编辑于 2026-04-19
  • 来自专栏算法之名

    量化交易

    针对可交易的投资商品,理性地运用逻辑分析和回归统计判断市场趋势称为量化交易。 量化策略 量化策略就是赚钱"因子",可以分为基本面和技术面。

    48610编辑于 2024-08-21
  • 来自专栏机器之心

    WAIC 开发者日Workshop预告:旷视天元 MegEngine 推动低比特量化技术的落地

    人工智能创新技术持续涌现,推动新一代技术浪潮向前发展,解决一个个技术难题,其中如何在资源有限的终端场景实现 AI 模型的有效部署,是加速 AI 落地的重要问题。 AI 工程师们研发了各种试图缩小模型大小并保持性能的办法,例如量化和蒸馏。 目前相对成熟的模型量化方案是 INT8 量化。 而为了推动低比特量化技术的发展,旷视天元 MegEngine 团队对 int4 进行了深入研究。 2018 年加入旷视,任职期间完成了 MegEngine 基于 MLIR 的即时编译技术等多项技术突破,并落地 MegEngine CUDA  推理解决方案以及多个端上优化项目。 MegEngine 是一个快速、可拓展、易于使用的深度学习框架,拥有以下三大关键特点: 训练推理一体:训练推理同一内核,模型结构、量化、前后处理、动态 shape 甚至求导均可 放入模型 进行推理,训练推理轻松对齐精度

    57800编辑于 2022-08-25
领券