首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器之心

    推理表象下,大模型精细表征张冠李戴的本质

    一旦有了严谨的解释性理论工具,当我们可以清晰地解构出大模型的内在决策逻辑时,我们惊讶地发现,哪怕大模型在特定任务上展现出再高的准确率,其内在的决策逻辑表征可谓是一塌糊涂,甚至一半以上都是混乱的、完全与正常推理逻辑不沾边的 比如,在新的研究 [3] 中,我们以法律大模型为例,目前几乎所有的法律大模型应用仅仅关注判案结果的正确性,而忽视了法律推理过程中可能潜在的不公平和伦理风险。 与或交互的无限拟合性 需要注意的是,与或交互解释显示,不同于惊艳的应用性能所展示的对大模型推理能力的想象,大模型的大部分决策逻辑并不是严密的、清晰的、层次化的逻辑链条,大部分交互概念仅仅表示词汇之间的统计关联性 固然这些单词与判决结果有统计意义的强相关性,但是大模型的决策依据并没有试图建模这些单词与犯罪嫌疑人之间的切实关系,并没有理解哪些犯罪嫌疑人做了什么事儿,也就导致了大模型可能产生一些看似正确的结果,但是其推理过程中可能潜在巨大的伦理风险 大模型没有建模「推理」逻辑,而使用大量「张冠李戴」的局部信息来生成判决结果,引起了不容忽视的伦理问 图 4 展示了 BAI-Law-13B 模型在中文案例上的解释,判案所依据的大部分交互概念都是与目标犯罪嫌疑人无关的张冠李戴的交互概念

    21000编辑于 2025-03-13
  • 来自专栏机器之心

    突破视觉推理瓶颈

    尽管人们为改进语言模型的推理做出了种种努力,但在多模态视觉语言任务中,高质量的推理数据以及优化的训练流程仍未得到充分的探索。 为了解决以上挑战,本文提出了一个视觉推理的多模态系统 Insight-V,能够实现结构化的视觉推理。 为了解决这一问题,我们介绍了提出的数据生成流程,该流程旨在通过渐进式生成过程和多粒度评估来生成高质量的推理数据。 如图 2 所示,这种可扩展的方法使我们能够生成高质量的数据,从而有效地提升模型的推理能力。 渐进式推理数据生成。我们通过调用能力强大的多模态综合模型,来收集单步推理结果。 总结 在本文中,我们介绍了 Insight-V,这是一种新颖的系统,它将用于、高质量推理数据的可扩展数据生成系统与有效的多智能体训练系统相结合,以增强多模态语言模型(MLLMs)的推理能力。

    42410编辑于 2025-02-14
  • 来自专栏自然语言处理

    推理大模型的后训练增强技术-如何系统地理解和提升思维推理能力

    这项综述旨在填补这一空白,提供一个统一的视角来理解思维。 首先,区分了思维与短思维,并提出了一个新的分类法来对当前的推理范式进行归类。 下面是一些关键的研究方向和发现,大家可以参考一下: 推理与短推理的对比 短推理(Short CoT):早期的研究主要集中在短推理,关注的是快速和高效的推理过程,通常适用于解决简单问题。 例如,有些研究探讨了如何通过浅层逻辑推理迅速得出结论。 推理(Long CoT):近年来,研究的重点逐渐转向推理,这种推理方式更注重通过深入的逻辑分析和多步骤的推理来解决复杂问题。 推理的关键特性 深度推理(Deep Reasoning):深度推理涉及更复杂的逻辑处理,需要模型处理更多的逻辑节点。 推理的关键现象 推理的出现:一些研究探讨了推理在预训练模型中的出现机制,如何通过上下文提示和解码方法激活推理

    1.1K10编辑于 2025-03-19
  • 来自专栏PM吃瓜(公众号)

    追踪

    1、追踪介绍 在大型系统的微服务化构建中,一个系统被拆分成了许多模块。这些模块负责不同的功能,组合成系统,最终可以提供丰富的功能。在这种架构中,一次请求往往需要涉及到多个服务。 2、为什么需要追踪? 微服务架构是通过业务来划分服务的,使用 REST 调用。 sleuth :追踪器 zipkin:分析器(可视化) 分布式追踪(Distributed Tracing),就是将一次分布式请求还原成调用,进行日志记录,性能监控并将一次分布式请求的调用情况集中展示 2.2、常见的追踪技术有下面这些: cat 由大众点评开源,基于Java开发的实时应用监控平台,包括实时应用监控,业务监控 。 Sleuth (日志记录每一条路上的所有节点,以及这些节点所在的机器,和耗时。) log4j SpringCloud 提供的分布式系统中追踪解决方案。

    1.8K20编辑于 2023-03-02
  • 来自专栏摸鱼网工

    聚合

    聚合定义 将交换机上的多个物理端口捆绑为一个逻辑端口 聚合功能 > 增加带宽 避免了STP的计算 交换机之间的流量会自动在聚合组内的所有物理端口上负载分担 > 提高可靠性 只要聚合组内还有物理端口存活 ,就不会中断 聚合负载分担 负载分担也叫负载均衡 聚合后的会基于流自动负载分担 聚合的分类[概述] > 动态聚合 双方通过LACP协议进行聚合协商 > 静态聚合 双方不会协商聚合参数 新华三设备聚合命令 display link-aggregation summary #显示链路聚合状态 思科设备聚合命令

    1.2K30编辑于 2022-10-28
  • 来自专栏摸鱼网工

    聚合

    什么是聚合 聚合是局域网中最常见的一种技术 他将多个物理端口通过线缆连接,聚合成一条逻辑 通过聚合提升的可靠性以及带宽 具有以下几个优点: 增加带宽: 把流量分散在各各加入聚合的端口内 ,实现端口间流量负载分担,有效增加带宽 提供可靠性: 聚合组可以实时监测参与聚合的端口的状态,如果某个端口故障,聚合组内的流量会及时切换到其他端口传输 负载分担的概念 负载分担也可以叫负载均衡 通过将流量分散到各端口上进行发送,实现流量分摊 聚合的类型 目前有两种聚合方式: 静态聚合、动态聚合 静态聚合 双方不会协商聚合的参数,不会对聚合组内的成员端口做交互 动态聚合 使用LACP(Link Aggregation Control Protocol 聚合控制协议) 基于IEEE802.3ad的协议来动态协商信息,交互聚合组内成员端口状态 如何配置聚合 /*创建

    1.6K20编辑于 2023-01-10
  • 来自专栏交换机和路由器技术

    什么是聚合,怎么配置聚合?

    聚合一、聚合基本概念1、概述是一个计算机网络术语,指将多个物理端口汇聚在一起,形成一个逻辑端口,以实现出/入流量吞吐量在各成员端口的负荷分担,交换机根据用户配置的端口负荷分担策略决定网络封包从哪个成员端口发送到对端的交换机 当交换机检测到其中一个成员端口的发生故障时,就停止在此端口上发送封包,并根据负荷分担策略在剩下的中重新计算报文的发送端口,故障端口恢复后再次担任收发端口。 聚合在增加带宽、实现传输弹性和工程冗余等方面是一项很重要的技术。 被动模式)on(以太网通道使用)二、基于IEEE的LACP1、概述基于IEEE802.3ad标准的LACP(汇聚控制协议)是一种实现动态汇聚的协议。 ,并运行一种机制,将多个以太网端口捆绑成一条逻辑

    55432编辑于 2025-11-24
  • 来自专栏全栈程序员必看

    trunk的配置命令_聚合配置

    acc vlan 10 8.输入ex 9.输入int f1/1 10.输入sw mo acc 11.输入sw acc vlan 20 12.输入do show vlan-sw b 6、配置中继 输入ex 输入end进入特权模式 输入show int f1/0 switchport,查看端口,此时端口在access状态 7、接下来把SW1和SW2设置为中继。 此时我们可以用WireShark来抓互相通讯的数据分析 1、右击选择一条接入 2、会从SW1 的f1/1的端口抓取数据,输入ping 192.168.10.40,抓包会获取数据。 ---- 4、接下来我们抓取中继查看vlan。 5、再用PC2ping 192.168.10.40,从WireShark中抓取一个数据。 8、这样不同才实现了互通。 版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。

    4K20编辑于 2022-11-17
  • | 当推理遇上分子结构,字节跳动从零合成 CoT 思维

    该研究是 Science4AI 范式的典型案例,首次将思维推理过程类比为分子的形成与折叠过程,提出了一个全新的“思想的分子结构”理论框架。 然而,当模型需要处理包含数十甚至上百步的复杂问题时,即所谓的思维,挑战也随之而来。 研究表明,通过简单的监督微调或从强模型进行知识蒸馏,并不能稳定地让一个较弱的模型学会长推理。 从弱指令模型蒸馏与从强推理模型蒸馏的性能对比 人类标注推理轨迹与 R1 蒸馏推理轨迹的性能对比 这种现象引出了一个核心问题:LLM 学习有效推理的内在机制究竟是什么? 方法 为了解开推理的黑盒,研究者提出了一个极具启发性的核心假设:一个稳定、有效的思维,其内部存在着类似于分子的拓扑结构。这个思想分子的稳定性并非凭空而来,而是由三种不同类型的化学键共同维系的。 这证明了思想分子理论的正确性和实用价值:只要掌握了正确的合成蓝图,就能以极低的成本,高效地为模型注入强大的推理能力。

    31910编辑于 2026-01-22
  • 来自专栏用户7627119的专栏

    非编码RNA

    非编码RNA (long non-coding RNA, lncRNA)是一类真核生物中长度大于200nt的非编码RNA分子。

    50420发布于 2020-09-24
  • 来自专栏运维监控日志分析

    Zabbix MTR 质量检测 主备监控

    触发器 思路 主备通常存在两个不同的下一跳地址,触发器表达式将匹配备下一跳地址触发告警消息,提示主备发生切换。 ? 告警事件 ?

    3K30发布于 2020-08-06
  • 来自专栏老张的求知思考世界

    压测(7):核心四问

    前言 前面的文章介绍了全压测的落地实施全流程,其中有个环节我特别提到了它的重要性,同时这也是本篇文章的主题:核心梳理。那什么是核心?为什么要确定核心?如何进行核心梳理? 梳理核心的目的又是什么?这篇文章,我会给你答案。 什么是核心? 之前在一些线下沙龙分享或者线上直播时候,很多同学都会问我一个问题:什么是核心?好像这个词有种魔法,很难让人去理解。 这么说比较拗口,再直白一些就是:哪些接口会影响用户下单支付,哪些就是核心。 下面附一个常见的电商企业核心流程图,供大家参考。 为什么要确定核心? 如何进行核心梳理? 上图是以电商企业订单应用为例子的一个业务调用的梳理,这里做一个拆解性的讲解。 文末回顾 这篇文章主要聊了全压测在备战阶段最重要的一件事,核心梳理。其中提到了流量模型相关的内容,下篇文章,我会以全压测过程中需要梳理的三大模型为主题,为大家介绍它们。

    1.9K21编辑于 2022-04-01
  • 来自专栏JavaEdge

    核心方案

    什么是核心? 系统中最重要的业务流程,比如酒店系统的预订流程;核心往往业务逻辑复杂,代码难度也较高。 核心的设计方案 传统模式 完全解耦,每新增加一种服务,就新写一套代码,工作量要大,但每个服务之间没有耦合关系,独立的变动更灵活 模板模式 抽象出公共的逻辑,每新增加一种服务,就继承自模板,代码量小, 大中台服务 需要寻找更好的框架帮助编码,将核心中台化 有限状态机框架,例如Spring-StateMachine 使用Disruptor

    87320发布于 2021-02-22
  • 来自专栏Web前后端、全栈出发

    服务追踪

    服务追踪 为什么需要服务追踪 在微服务架构下,由于进行了服务拆分,一次请求往往需要涉及多个服务, 每个服务可能是由不同的团队开发,使用了不同的编程语言,还有可能部署在不同的机器上,分布在不同的数据中心 随着服务的越来越多,对调用的分析会越来越复杂。它们之间的调用关系也许如下: 好壮观的 :冠状病毒呀!! Sleuth追踪入门 虽然,理论比较难弄, 但代码实现到不是很困难! 追踪, 主要是因为: 微服务架构,不同模块完成不同的事情… 一个功能由多个模块构成… 模块之间相互依赖… 而为了更方便的浏览业务. 所以一般来说:每个模块都要进行 追踪配置! 依赖: 因为,每个模块都要进行 追踪! 就直接定义在父工程模块下了! pom.xml <! 因为Sleuth是在所以模块下进行追踪的, 所以模块下都要进行配置哦!* 客户端添加依赖 同样父工程下添加:pom.xml <!

    98810编辑于 2024-08-06
  • 来自专栏桃子小白

    【PPP】点对点

    83220编辑于 2023-06-10
  • 来自专栏Java架构师必看

    Skywalking 追踪

    提供分布式追踪、服务网格(Service Mesh)遥测分析、度量(Metric)聚合和可视化一体化解决方案。 ** 二、分布式追踪 ---- 随着分布式系统和微服务架构的出现,一次用户的请求会经过多个系统,不同服务之间的调用关系十分复杂,任何一个系统出错都可能影响整个请求的处理结果。 **【2】梳理:**需求迭代很快,系统之间调用关系变化频繁,靠人工很难梳理清楚系统拓扑(系统之间的调用关系)。 为了解决这些问题。 Google推出了一个分布式追踪系统 Dapper,之后各个互联网公司都参照 Dapper的思想推出了自己的分布式追踪系统,而这些系统就是分布式系统下的 APM系统。 五、Skywalking优势 ---- Skywalking相比较其他的分布式监控工具,具有以下特点: 【1】社区相当活跃。

    2.9K10发布于 2021-04-25
  • 来自专栏开源部署

    linux 聚合

    聚合 聚合是将多块网卡逻辑地连接到一起从而允许故障转移或者提高吞吐率的方法。提高服务器网络可用性。 team是另一种用来实现连聚合和方法,类似于bond,team和bond的区别在于,支持hash加密,支持负载均衡,支持8块网卡,更好地支持IPV6 实现方式 bond team bond聚合 bond – 负载均衡—所有处于负载均衡状态,轮询方式往每条发送报文这模式的特点增加了带宽,同时支持容错能力,当有出问题,会把流量切换到正常的路上。 容错能力—这模式的特点增加了带宽,同时支持容错能力,当有出问题,会把流量切换到正常的路上。 – 性能问题—该模式将限定流量,以保证到达特定对端的流量总是从同一个接口上发出。 – 容错能力—这模式的特点增加了带宽,同时支持容错能力,当有出问题,会把流量切换到正常的路上。对比blance-xor,这种模式定期发送LACPDU报文维护聚合状态,保证质量。

    2K21编辑于 2022-09-15
  • 来自专栏Lvshen的技术小屋

    用Redis实现转短

    问题引出 在生活中有很多场景需要把链接转化为短连接,比如微博限制字数为140字一条,那么如果我们需要发一些链接上去,但是这个链接非常的,以至于将近要占用我们内容的一半篇幅,这肯定是不能被允许的,所以短链接应运而生了 实际是链接 代码实现 这里我们采用Redis存储短链接。 LOCALHOST是短的前缀。 " + shortUrl); } 我们将www.google.com转化为短链接 转成的短链接如图所示 短:http://t.cn/4 SHORT_URL_KEY的值为4,代表短末尾的值为4。 而对应存储在这里。 这样同一每次生成的短是一样的。 再运行一次,显示的短还是一样。 采用Redis原子自增生成短,即使是在分布式环境下也不会重复。

    1K20编辑于 2022-05-05
  • 来自专栏k8s/k3s云原生

    追踪(一)

    后续完成应用服务通过jaeger导出器直接上报给jaeger架构、也要考虑通过collector作为中转的架构

    45760编辑于 2023-11-06
  • 来自专栏网络技术联盟站

    聚合实验

    对应拓扑中设备名称末尾数字为 1 的设备, R2 或 SW2 对应拓扑中设备名称末尾数字为 2 的设备,以此类推 实验需求 按照图示配置 PC3 和 PC4 的 IP 地址 在 SW1 和 SW2 的两条直连路上配置聚合 ,实现冗余,并可以增加传输带宽 SW1 和 SW2 之间的直连要配置为 Trunk 类型,允许所有 vlan 通过 中断 SW1 和 SW2 之间的一条直连,测试 PC3 和 PC4 是否仍然能够继续访问 实验解法 1 、PC 配置 IP 地址部分略 地址部分略 2、 在 在 SW1 和 和 SW2 的直连路上配置聚合 分析:SW1 和 SW2 之间通过 g1/0/1 和 g1/0/2 接口直连 ,需要在两台交换机上分别创建 聚合接口,并把 g1/0/1 和 g1/0/2 接口加入到聚合接口,形成聚合。 是否仍然能够继续访问 分析:聚合会自动把 SW1 和 SW2 之间的流量进行负载均衡,某一条中断连接 后,也仍然还有另外一条可以继续通讯,所以 PC3 和 PC4 可以继续访问 步骤 1

    1.9K31发布于 2020-08-11
领券