首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器之心

    思维思维树?华为诺亚:现在到了思维森林时刻!

    近日,华为诺亚方舟实验室的研究人员提出了一个名为思维森林 “Forest-of-Thought”(FoT)的全新大模型高阶推理框架,它通过在推理时扩展计算规模,显著提升了 LLM 的高阶推理能力。 图 1 思维森林 FoT 稀疏激活策略 在 FoT 的推理过程中,并不是所有的推理树或树中的每个节点都会被计算,而是只选择最相关的推理树或节点进行计算。 实验结果 研究人员在多个 LLM 推理基准测试中评估了 FoT 方法,包括 24 点游戏、GSM8K 和 MATH 数据集,使用了多个开源 LLM 模型,包括 Llama3-8B,Mistral-7B 图 3 中的实验结果表明,基于不同的大语言模型 Llama3-8B,Mistral-7B 和 GLM-4-9B,都存在类似的 scaling law:FoT 中的树数量越多,带来的准确率提升越显著。 结语 思维森林 Forest-of-Thought 框架的提出,为 LLM 的推理能力提升提供了一条新的路径。

    22100编辑于 2025-02-03
  • 来自专栏自然语言处理

    检索增强生成 和思维 结合: 如何创建检索增强思维 (RAT)?

    检索增强思维 (RAT) 是一种创新性的方法,它结合了两种关键技术:检索增强生成 (RAG) 和思维 (CoT) 提示。大型语言模型 (LLM) 因其模仿人类写作和流畅回答问题的能力而变得流行。 思维 (CoT):让思考变得可见 思路提示:帮助大型语言模型展示其工作成果 大型语言模型 (LLM) 擅长生成文本,但它们在解决需要逐步推理的复杂问题(如解决文字问题)时会遇到困难。 思路提示使大型语言模型能够解决复杂的算术、常识和符号推理任务。图中突出显示了思路推理过程。 少量提示会给出一些示例来帮助语言模型理解它应该做什么,而思维提示则会从头到尾展示逐步推理。 它最适合较大的模型,而较小的模型可能会产生奇怪的思维并且不太精确。在某些情况下,您可以使用零次思维提示而不显示中间步骤。 RAT:知识与思维的结合 检索增强思维 (RAT) 是一种简单但有效的提示方法,它将思路 (CoT) 提示与检索增强生成 (RAG) 相结合,以处理长窗口推理和生成问题。

    79910编辑于 2025-01-05
  • 来自专栏自然语言处理

    怎么构造思维数据?思维提示工程的五大原则

    我来为您翻译这篇关于思维提示工程的文章,采用通俗易懂的中文表达: 思维(CoT)提示工程是生成式AI(GenAI)中一种强大的方法,它能让模型通过逐步推理来解决复杂任务。 通过构建引导模型思考过程的提示,思维能提高输出的准确性、连贯性和可靠性。本白皮书探讨了思维提示工程的核心设计原则,提供实用案例,并概述了在各种应用中有效实施思维的策略。 思维提示工程通过让AI系统模拟逐步推理来解决这一问题,从而产生更有结构性和可靠性的输出。 思维提示工程在制造业、教育、金融和医疗保健等多个领域都有应用。 思维提示工程的应用 1. 制造业和自动化 场景:优化生产流程。 例子:一家制造厂由于装配线上的设备瓶颈而经常出现生产延迟。使用思维提示工程,AI的引导如下: 第1步:识别瓶颈。 实施:使用思维提示AI逐步解释解决方案,如推导公式或解方程。 成果:通过详细和逻辑的解释增强学习体验。

    1.1K20编辑于 2025-04-11
  • 来自专栏石云升

    提示词的高阶用法:思维

    我今天要给大家分享一个高阶使用技巧,这也是很多优秀的GPTs里可以看到的一种提示技巧,那就是思维。 什么是思维思维就是逻辑思考过程,就是一步一步把一个大问题拆解成各个小问题的过程。 而这个过程,在学术界的专业名词就叫思维(Chain of Thought)。 在谷歌和OpenAI的一系列论文中已经验证,当你把一个问题,按照思维的方式,一步步Prompt大型语言模型时,往往能够得到正确的答案。 而用思维的话,我们可以发现,其实翻译也可以多个角色共同合作。我给大家看个实例,是网上很有名的宝玉老师做的翻译提示词,如下: 现在你要帮忙解释一篇专业的技术文章成简体中文给大学生阅读。

    1K10编辑于 2024-04-12
  • 来自专栏自然语言处理(NLP)论文速递

    思维(CoT),到思维树(ToT),再到思维图(GoT):用LLMs解决复杂问题!

    引言  为进一步提升大型语言模型(LLM)解决复杂问题的能力,今天给大家分享的这篇文章,作者提出了思维图(GoT),其性能超过了思维(CoT)、思维树(ToT)。 思维图(GoT)的关键思想是能够将LLM生成的信息建模为任意图,其中信息单位是顶点,边代表顶点之间的依赖关系。这种方法优点能够将任意LLM的思维组合在一起,提炼出整个思维图内容。 思想(CoT)是一种提示方法,除了任务输入/输出之外,还包括提示中推理的中间步骤(中间“想法”)。CoT 被证明可以显着提高法LLMs解决问题的能力,而无需任何模型参数的更新。 例如,人们可以探索某个推理,回溯并开始一个新的推理,然后意识到前一个推理中的某个想法可以与当前探索的想法相结合,并将它们合并成一个新的解决方案,利用优点并消除缺点。 例如,聚合可以将多个不同思想的结果合并在一起,而细化可以递归地更新思想,直到得出最终答案。此类功能严格扩展了 CoT 和 ToT 提示 — 它可以完成这些技术可以做的所有事情,甚至更多!

    4.6K40编辑于 2023-09-14
  • 动态剪枝思维构建高效推理系统

    在本教程中,我们实现了一个智能思维剪枝框架,该框架并行生成多个推理路径,并使用共识信号和早停机制动态缩减路径。 sklearn.feature_extraction.text import TfidfVectorizerfrom sklearn.metrics.pairwise import cosine_similaritySEED = 7random.seed You eat 7. How many remain?"

    8710编辑于 2026-02-17
  • 向DeepSeek学习深度思考-CoT思维

    而且它的整个CoT思维完全是公开的,是可以给你参考和学习的。 所以说每一次和DeepSeek的沟通和交互,我都会去详细的看它实际提供的CoT思维详细的思考过程和内容,包括我也会问他,就是你个人的思维思考方式和模式究竟是怎么样的? 所以说大家再去用的时候,不要简单的只是去看它输出给你的答案,更加重要的是你应该去学习他公开的思维,从这个地方找到相关的思维方法可以学习的地方。 所以说经过我最近对的使用,我越发的感觉到和我原来用GPT最大最大的一个差异反而是它提供的公开的CoT思维的价值,这个思维实际反而是值得我们每个人去学习的。 包括很多时候你不清楚怎么样学习,你不清楚怎么样思考的时候,你仍然可以优先问AI我究竟应该怎么样思考,它其实是可以给出详细的思维过程的。 好了,今天关于思维简单的思考就跟大家分享到这里。

    31600编辑于 2025-06-24
  • 来自专栏deepseek

    推理强化模型中思维的本质

    这一切都要感谢推理强化的 CoT(思维)。CoT 为什么这么有效,这么神奇,文理通吃,在强化中最大化了其赋能作用呢? DeepSeek的训练如此有效: 不是教会模型更"聪明"的推理,这在文科类任务中根本就无法定义 而是优化了它构建这种低熵通道的能力 本质上是优化了信息流的路径规划 这个观点为理解CoT提供了一个新的视角,把表面上的思维

    890100编辑于 2025-02-08
  • 来自专栏程序员分享

    Prompt工程进阶:少样本与思维

    本篇文章将通过一个动态权限菜单的实战案例,带领我们掌握两个强大的Prompt技巧:少样本与思维:少样本提示(Few-shot Prompting) :给AI举例子,让它学会模仿思维(Chain of 适用场景需要特定输出格式的任务有明确模式匹配的逻辑希望AI模仿某种风格或规范思维:让AI“说出解题思路”什么是思维思维的核心思想是:引导AI展示中间推理步骤,而不是直接给出答案。 第一步:请参考以下示例理解需求(少样本):示例1:输入A -> 输出X示例2:输入B -> 输出Y第二步:请按照以下步骤思考(思维):1. 分析...2. 设计...3. 实现...4. 处理边界...第三步:生成完整的代码如何写出高质量的思维Prompt技巧1:引导AI分步思考text 体验AI代码助手 代码解读复制代码请按以下步骤思考:1. 先分析数据结构设计2. 技巧4:要求对比不同方案text 体验AI代码助手 代码解读复制代码请对比两种权限合并策略(并集vs交集)的优缺点,然后选择最优方案结语你在实际工作中遇到过哪些适合用思维解决的复杂问题?

    19610编辑于 2026-03-18
  • 来自专栏机器之心

    思维监督和强化的图表推理,7B模型媲美闭源大尺寸模型

    DocTron团队提出的Chart-R1模型在这一背景下应运而生,针对图表这一信息密集型多模态数据类型,开发出一套思维监督和强化的图表推理方法,通过逐步骤的思维监督和数值敏感的强化学习微调实现复杂图表推理能力 程序化数据合成技术: 研究团队开发了一种新颖的程序化数据合成技术,利用 LLM 生成图表绘制代码,并基于这些代码构建复杂问题、多步骤思维推理过程和最终答案。 两阶段训练策略: Chart-COT 阶段:通过思维监督,训练模型将复杂图表推理任务分解为细粒度、可理解的子任务; Chart-RFT 阶段:采用数值敏感的强化学习微调,使用群组相对策略优化 (GRPO

    35210编辑于 2025-08-06
  • 来自专栏CSDN社区搬运

    思维为线索推理隐含情感

    在思想(CoT)思想的启发,本文引入了一个三跳推理(THOR)CoT框架来模拟ISA的模拟人类推理的过程。THOR设计了一个三步提示原则,逐步诱导隐含的方面、观点,最后是情绪的极性。 Three-hop Reasoning with CoT Prompting,则是本文提出基于大模型思维(CoT)的方法,提出的三段式提问框架。 总结 这篇文章使用大模型思维的思路优化了隐式情感分析中,隐含观点等难以挖掘的难题,使得ISA任务能够有较大性能的提升。

    29310编辑于 2024-12-02
  • 来自专栏deepseek

    思维是大模型的符号神助攻

    然而,2024年春节,DeepSeek发布的推理大模型R1揭示了一个令人惊叹的技术突破——思维(Chain of Thought, CoT)的自主生成,其展现出的语言序列仿佛在模拟人类的符号逻辑。 符号逻辑的回归DeepSeek推理模型的发布引发全球关注,其强化学习框架下自主生成的思维展现出惊人的问题解决能力与创作能力。 尽管其核心机制仍是GPT风格的自回归下一词元预测 (next token prediction, NTP),但模型生成的中间结果——思维,却呈现出令人惊讶的符号逻辑特征,有效模拟了人类的推理过程。 下一词元预测的GPT生成方式,使得内部的“思维过程”可以在输出端外化为符号CoT,从而利用符号推理的形态,一步步模拟人类思维过程。 然而,目前思维生成采用自然语言,而不是形式语言。偶然也夹杂了一些数学符号,但思维整体还是压倒性的使用英语或中文。R1论文中还提到他们的CoT连计算机代码都排斥在外。

    58210编辑于 2025-03-05
  • 来自专栏机器之心

    思维CoT进化成思维图GoT,比思维树更优秀的提示工程技术诞生了

    思维(CoT)便是一种用于设计 prompt 的方法,即 prompt 中除了有任务的输入和输出外,还包含推理的中间步骤(中间思维)。 在进行思考时,人类不会像 CoT 那样仅遵循一条思维,也不是像 ToT 那样尝试多种不同途径,而是会形成一个更加复杂的思维网。 举个例子,一个人可能会先探索一条思维,然后回溯再探索另一条,然后可能会意识到之前那条的某个想法可以和当前链结合起来,取长补短,得到一个新的解决方案。 使用图模型,可以轻松实现聚合变换:通过添加来自建模了几条中最后思维的顶点 v_1, ..., v_k 的传出边,使之指向组合这些的单个思维 v^+。 图 5(排序)、6(集合交集)、7(关键词计数)、8(文档合并)展示了实验结果。 总体而言,在实验评估过的所有基准上,GoT 的输出质量都优于 ToT,并且还实现了更低的推理成本。

    99730编辑于 2023-09-08
  • 论文解读 - 潜在思维推理的全面综述

    二、研究背景大型语言模型(LLMs)通过思维(CoT)推理方法在复杂推理任务中展现了卓越的能力,该方法鼓励模型以自然语言形式逐步进行推理。 首先,它导致了计算效率低下,因为并非所有表达思维过程的词语都包含有价值的信息。其次,人类思维往往超越语言的界限。认知的其他方面,如抽象见解、直觉跳跃或高度组合性的思维,难以完全或精确地用语言表达。 自然语言和显式推理的固有限制直接推动了向潜在思维推理的转变。如图1所示,模型不再通过语言符号进行推理,而是在潜在空间中进行推理,提供了一种更为抽象和高效的思维过程媒介。 在本研究中,论文首次全面调查了潜在的链式思维推理。论文的主要贡献有三个方面:(1)系统分类法:论文引入了一种潜在链式思维研究的结构化分类法,将现有研究分为四个不同的类别。 在训练过程中,通过中间监督来指导推理过程,生成的推理用于微调自回归模型,从而在超出训练序列长度的任务中提升性能。

    31710编辑于 2025-12-19
  • 来自专栏Python项目实战

    从漏洞到攻击:一次看懂黑客的思维

    从漏洞到攻击:一次看懂黑客的思维路——ByEcho_Wish,一个喜欢拆技术“心脏”的人很多同学学安全,总感觉知识太分散:SQL注入一块、RCE一块、提权一块、横向移动又是一块。 所以今天我们换个方式:不讲漏洞本身,而讲黑客的“串联思维”,也就是攻击AttackChain。看懂这个,你就能从“漏洞学习者”升级到“体系化安全思维拥有者”。一、攻击是什么? 攻击者最怕的是“丢失入口”,所以持久化是攻击里非常关键的一步。八、最终目的:窃取、加密勒索、破坏、植入后门到这一步,攻击才真正进入“业务损害阶段”。 但攻击给了我们一个角度:我们不需要堵住所有门,只需要让攻击在某一步“成本过高”,黑客就会放弃。 从今天开始,把漏洞放进攻击的上下文里看。你会发现:你不只是学安全,而是在学黑客思维的全路逻辑。懂这个,你就能在任何场景里快速判断攻击意图,并提前布防。

    28610编辑于 2025-12-02
  • 来自专栏瓴犀学院

    思维领先,打通产业,SAAS助力供应新突破!

    现代企业间的竞争,实际上主要的是供应与供应的竞争。企业要在竞争中赢得胜利,需要整套供应的顺利运作。 比如说:企业A为了改善供应管理效率,降低无效成本,选择牵头搭建融合上下游企业的供应管理平台。这种主式的平台整合方式对于上下游的中小企业来说确实有点“搭便车”的感觉。 供应的平等权对他们来说是一种“奢求”,业务往来永远受制于主企业。另外,对于企业的其他供应需求,这一平台如何满足?是否每一个龙头企业都有动力及实力来搭建这种整合平台? SaaS版的供应在软件供给上采用向多个用户同时租赁使用的模式;在运营方式上则由第三方运营,提供给多条供应同时使用,形成并支持供应链群和供应网。 SaaS实现供应系统的升级和组合,将传统供应系统部件更换为功能全面、灵活敏捷、伸缩自如,是可与其它系统兼容的的供应系统。

    68430编辑于 2022-03-17
  • 来自专栏findyi

    让你变厉害的7个底层思维

    职场&认知洞察 丨 作者 / findyi 这是findyi公众号分享的第89篇原创文章 如果把你的思维比做操作系统,那思维模型就是一个个App。 顶级的思维模型能提高你成功的可能性,并帮你避免失败。 华尔街大VFarnam Street曾这样描述思维模型:“思维模型是你大脑中用于做决策的工具箱。 我发现,正是因为正确使用了一些思维模型,才让我事半功倍。 很多时候,正确的思维方式比努力重要100倍。 今天和大家分享,能让你变得越来越厉害的7思维模型。 ---- — 7 — 系统思维 花半秒钟就看透事物本质的人和花一辈子都看不清事物本质的人注定是截然不同的命运。 我们如何快速看透事物本质? ---- 写在最后 以上7个能让你变得更厉害,甚至脱胎换骨的思维模型,就说完了。 这个世界哪有什么天才,哪有什么天赋异禀的人。 有的只不过是学会深度思考,不断迭代自身思维模型的人。

    87320发布于 2020-11-03
  • 来自专栏新智元

    142页长文揭秘DeepSeek-R1「思维大脑」!开启全新「思维学」研究

    R1的出现带火了推理模型外,也催生了一个新的研究领域:思维学(Thoughtology)。 魁北克人工智能研究所联合麦吉尔大学和哥本哈根大学最近发布了这一研究领域的详细研究,这份长达142页的报告深入探讨了R1的思维。 DeepSeek-R1「思维学」(Thoughtology) 一个人所取得的成就,或未能达成的目标,都是其思想的直接结果。 研究团队称「DeepSeek-R1思维的透明访问权」是一种独特的研究机会! 研究人员借此可以系统性地分析其推理行为,最终形成「思维学」(Thoughtology)。 思维长度的影响和可控性 LLM推理能力的进步带来了范式上的重大转变:推理时扩展思维的长度,即在模型推理阶段生成更长的推理过程,从而提升性能。

    37710编辑于 2025-04-23
  • 来自专栏java学习java

    JDK 7 HashMap 并发死

    测试代码 注意 要在 JDK 7 下运行,JDK7以后否则扩容机制和 hash 的计算方法都变了 public static void main(String[] args) { // 测试 java 7 中哪些数字的 hash 结果相等 System.out.println("长度为16时,桶下标为1的key"); for (int i = 0 null); map.put(4, null); map.put(5, null); map.put(6, null); map.put(7, } h ^= k.hashCode(); h ^= (h >>> 20) ^ (h >>> 12); return h ^ (h >>> 7) e = next; // 虽然 next 是 null, 会进入下一个链表的复制, 但死已经形成了 源码分析 HashMap 的并发死发生在扩容时 void transfer(Entry

    33730编辑于 2023-10-15
  • 来自专栏ConsT27的笔记

    7u21浅析

    简介 jdk7u21 ,是一个不需要借助第三方库就能实现的。 影响版本<=7u21 分析 from ysonerial 我们先来看看ysonerial里的payload是怎么写的,然后沿着其思路进行分析 public Object getObject(String _tfactory); \\here ········ } OK.我们找到了触发7u21的一个核心点了。 memberValueEquals(var7, var8)) { return false; } } return Runtime.exec() 总结 这个是目前调过最长的了…. 能想出这种的绝壁是天才吧

    51620编辑于 2022-02-14
领券