自主这个词在AI圈子越来越火,有变成玄学的趋势,但到底什么是自主,跟自动化、智能有啥关系,我们一起来看看。 先问大家一个问题,自主性是越高越好吗? 什么是自主性 自主性的英文是autonomy,英文上的解释为“the quality orstate of being self-governing;self-directingfreedom and 中文上的词条解读,自主性是行为主体按自己意愿行事的动机、能力或特性。 所以比较好理解的是,自主就是自己当家作主。 ,或者独立完成,都应该算作自主性,而且,如果是与人协作沟通完成的方式反而是更加复杂一些的。 回到一开始说的问题,自主性是越高越好吗?
工程实践正在被重写:不再有黄金路径在技术持续变革的时代,工程领导者如何确保团队的对齐性、自主性和生产力? 关键讨论要点AI对工作流的全局影响Superhuman通过AI技术全面提升组织工作流程改进新员工入职培训体系帮助员工优化工作流程使团队能够重启先前搁置的项目工程效能度量策略定性指标与定量指标的结合运用通过数据驱动方法衡量团队效能持续改进工程团队绩效的实践方案对齐自主性概念在快速变化的行业中领导力的重要性通过赋予团队自主权提升组织运转速度平衡团队自治与组织目标的对齐机制资源链接通过 LinkedIn联系Loïc Houssier了解Superhuman:专为高效团队设计的AI原生邮件应用通过LinkedIn或Bluesky联系Ben Matthews本文节选自Stack Overflow 播客《代码领导者》系列,关注工程领导力与生成式AI在技术组织中的实践应用。
摘要:2026年AI简单作为“问答机器”的存在,却见证了其向“智能体(Agent)”的形态跃迁。从0到1,这不仅是功能的高度,更是“自主性”的觉醒。 在AI进化的坐标系中,大模型(LLM)完成了从-1到0的知识压缩,而Agent(智能体)则正在完成从0到1的行动闭环。 它的核心跃迁在于“非凡的动感”的获得:0.0阶段(传统AI):听懂指令-生成文本。角色是“护照工具”。1.0阶段(Agent):设定目标-主动拆解-调用工具-闭环交付。角色是“积极参与者”。 02.核心能力拆解:具有“自主性”的三重架构技术架构Agent协调能实现“从0到1”(Exception)、决策(推理)与执行(行动)三位一体构成。 (本文章由AI辅助生成)
在传统 IT 时代,数据是被动记录的资产;而在 AI 时代,数据是训练大模型和驱动智能体决策的燃料。缺乏高质量、AI 就绪的数据,任何宏大的 AI 愿景都将成为空中楼阁。 这种自主性在供应链领域体现得尤为明显。预测指出,相当比例的日常供应链决策将由 AI 智能体独立完成。 攻击者正在利用 AI 智能体进行更高效的凭证窃取和欺诈,这使得防御方必须同样采用 AI 技术来进行对抗。网络安全正在演变为一场“AI 对抗 AI”的军备竞赛。数据安全特别是隐私保护面临着严峻挑战。 在这里,你不仅能获取AI相关的各类市场分析报告、技术论文书籍、应用实践指南等等,涵盖生成式AI、大模型、AIGC、AI芯片和机器人等技术、应用和市场,还能与同侪一起探讨如何使用人工智能大模型和智能体来为工作增效 企业和个人都需要从根本上改变对技术的认知,从将 AI 视为一种单纯的效率工具,转变为将其视为具有一定自主性的合作伙伴。
摘要:在2026年的AI技术浪潮中,Agent(智能体)已不再是实验室里的概念,而是从“能说会道”的Chatbot进化为“能承载事”的数字定义生命体。 .模型等级标准定义:解构“数字生命体”在人工智能领域,Agent的定义已经被行业广泛接受,其核心不仅仅在于它执行指令的软件,而且具备以下三大特征的自主系统:1.经典三要素完全覆盖(TheLoop)符合AI 代理就像“打车时的导航AI”:你只给它目的地,它会实时规划路线、避开拥堵、在封路时自动重算,甚至主动问你“检测到前方加油站,是否需要补充能源?” (灵活)05.2026年展望:从“能说会道”到“能扛事”站在2026年的时间节点,Agent正在成为AI技术落地的“操作系统”。从工具到伙伴:以前我们把AI代理工具(工具),你需要知道怎么用它。 让AI从“辅助人类”走向“美好创造”。写给开发者与创作者的建议写作贴士:不要只写“这个Agent可以生成PPT”,这太浅了。要强调它的“自主性”和“决策链”。
还不是把人类对AI的想象力再次打开了。 使唤AI不用再一句句引导,更不用去研究提示工程了。 人人像钢铁侠那样拥有超级AI贾维斯不是梦。 生产有记忆会自学习的AI Copilot 如上看到的AI Copilot来自名为MindOS的AGI应用助手平台。 AI Copilot:嗨,你的订单已经由DHL快递发出了,预计在今天下午7点送到。 人类:椅子和桌子是配套一起送过来的吗? AI Copilt:它们是分开卖的。你有4把椅子会在今天送到。 以此让AI可以完成一个长链条任务,和AutoGPT非常相似。 而且相对于AutoGPT,MindOS背后框架的自主性更高。 AI Copilot串联成网络:应用和服务的AI Copilot和每个个人AI Copilot,连接成一张全新的网络,服务的分发会在这个AI Network上发生。
undefined客户价值:实现从“脚本执行”到“自主推理”跨越,达成动态重规划与证据推理闭环,提升复杂环境攻防自主性(来源:任务图 | Plan-on-Graph动态图规划、因果图设计总结)。 生态与责任:方班-BinX战队以“开源共享”促进行业协同,加速我国“AI+安全”自主创新(来源:About us | 方班 - BinX 使命担当)。
说说计划 不知不觉写到了第七篇,理一下思路: 学会基本的概念,了解什么是什么不是,当前的位置在哪,要去哪。这是第一篇希望做到的。同时第一篇和第二篇的开始部分,非常谨慎的考虑了非IT专业的读者。希望借此沟通技术人员和产品人员,甚至管理和销售人员。我信服“上下同欲者胜”,所以也非常害怕因为大家对概念完全不同的理解而影响到团队的合作。 从最简单的部分入手,由概念到代码,完成技术破冰。这是第二、三篇希望做到的。 逐步迭代,从简单概念到复杂概念,从简单算法到复杂算法,接触到机器学习现实最常用的技术。这是四、五、六篇希
本节重点 学习 AI 智能体的概念和构建方法,掌握如何实现具有自主决策能力的 AI 系统。 按照自主性和规划能力,智能体可以分为几个层次: 1)反应式智能体:仅根据当前输入和固定规则做出反应,类似简单的聊天机器人,没有真正的规划能力。 在某些场景中,限制智能体的自主性反而能提高效率和安全性。 二、智能体实现关键技术 在自主开发智能体前,我们要先了解一下智能体的关键实现技术,也就是方案设计阶段做的事情。 三、使用 AI 智能体 有 3 种方式可以使用 AI 智能体,之前的教程中其实我们已经有接触过,这里再快速复习一遍。 2)Spring AI Alibaba Graph 目前 Spring AI 官方还没有提供工作流编排能力,但是国内的 Spring AI Alibaba 已经提供了工作流编排框架 Spring AI
最近,一款名为 Context7 MCP 的工具备受瞩目。网络上流传着各种说法,比如它解决了大语言模型的痛点、革新了 AI 编码方式,甚至能让 Cursor 效率提升十倍。 18 project with the new createRoot API. use context7 Context7 会自动获取 React 18 的最新文档,AI 便会生成正确的代码: // Context7 网站介绍 除了 MCP 集成,Context7 还提供了一个便捷的网站服务:https://context7.com 网站功能特点 Context7 网站的核心功能是为 LLM 和 AI 时可能遇到的问题: ❌ 训练数据包含过时文档 ❌ 生成不存在的虚假代码示例 ❌ 提供不针对特定版本的通用答案 ❌ 浪费时间验证 AI 生成的响应 ❌ 因与 LLM 反复沟通而感到挫败 使用 Context7 无论你使用 Cursor、Claude 还是其他 LLM 工具,它都能帮助你获得更好的答案,避免 AI 产生幻觉,让 AI 真正理解你的技术栈。
最近,一款名为 Context7 MCP 的工具备受瞩目。网络上流传着各种说法,比如它解决了大语言模型的痛点、革新了 AI 编码方式,甚至能让 Cursor 效率提升十倍。 不使用 Context7 时,AI 可能会提供基于旧版本的代码: // 可能生成的过时代码 import React from 'react'; import ReactDOM from 'react-dom 18 project with the new createRoot API. use context7 Context7 会自动获取 React 18 的最新文档,AI 便会生成正确的代码: // Context7 网站介绍 除了 MCP 集成,Context7 还提供了一个便捷的网站服务:https://context7.com 网站功能特点 Context7 网站的核心功能是为 LLM 和 AI 无论你使用 Cursor、Claude 还是其他 LLM 工具,它都能帮助你获得更好的答案,避免 AI 产生幻觉,让 AI 真正理解你的技术栈。
鲁棒 vs 脆弱的AI开发可靠的AI数据可靠性经验构建鲁棒可靠AI的领先实践本文摘自Beena Ammanath所著的《可信AI:人工智能信任与伦理商业指南》(Wiley出版社,2022年3月)。 她曾在多家公司担任人工智能和数据科学领导职务,也是Humans For AI(一个致力于提升AI领域多样性的组织)的创始人。在AI模型训练中,数据集是现实世界的代理。 企业在扩展其AI应用范围时的任务是:将鲁棒性和可靠性作为AI战略的组成部分加以权衡,并协调能够管理并纠正动态环境中错误的流程、人员和技术。为此,我们从鲁棒可靠AI领域的一些基本概念开始。 鲁棒 vs 脆弱的AI国际标准化组织将AI鲁棒性定义为“AI系统在任何情况下保持其性能水平的能力”。在一个鲁棒的模型中,训练错误率、测试错误率和运行错误率几乎相同。 脆弱性是软件工程中的一个已知概念,也适用于AI。最终,所有AI模型在某种程度上都是脆弱的。我们使用的不同类型的AI工具都特定于其功能和应用。AI只做我们训练它去做的事。这还有另一个组成部分。
Altman计划筹集高达7万亿美元基金,用于建设一系列AI芯片工厂,如果成行,他将掌管全球第三大经济体。但这笔巨资究竟会如何使用投资? 译自 Making Sense of Sam Altman’s $7 Trillion AI Chips Gambit,作者 Agam Shah 已长期报道企业IT领域超过十年。 他试图筹集7万亿美元用于建造AI芯片工厂的尝试让许多人翻了个白眼。 Altman雄心勃勃的7万亿美元基金用于建立一系列AI芯片工厂,将使他成为世界第三大经济体的管理者。 “Sam Altman身上到底有什么,让人们追踪他就像追踪泰勒·斯威夫特? Sam Altman为何要向AI投资7万亿美元 Altman的7万亿美元计划可能是一个雄心勃勃的计划,旨在重构整个半导体行业,该基金规模是电子行业的两到三倍,Hutcheson在解释分析公司发布的芯片内幕通讯时写道
中国AI巨头加速机器人领域布局 ▎ 政策追踪 | 中国宣布增加对AI、科学和技术创新的支持 政策红利推动技术商业化 ▎ 技术趋势 | HEADINFER技术实现消费级GPU长上下文推理 算力成本降低,边缘AI应用加速 ▎ 应用创新 | Runway首帧视频风格转换惊艳亮相 生成式AI在视频领域再突破 一、今日热点 (Hot Topic) 1.1 Anthropic预测AI将超越诺贝尔奖得主 ⚡ 数据支撑:其模型在化学推理、医学诊断等领域的准确率已接近人类专家 行业影响: ▸ 加速AI在基础科学研究中的角色转变,可能重构科研范式 ▸ 伦理争议升温,需建立AI科研成果的评估与认证体系 Hugging Face视频分类器优化数据管理 应用场景:短视频平台内容审核 ● 实施效果: 关键指标 实施前 实施后 提升幅度 审核准确率 89% 96% +7% 处理速度 1200帧/秒 3500 ▸ 验证了LLMs在复杂策略游戏中的规划能力 ▸ 引发关于AI游戏测试伦理的讨论 每日金句 今日思考:*"AI不会取代人类,但会用AI的人将取代不用AI的人"* 出自:Andrew Ng(吴恩达
在企业AI转型这件事上,比"怎么落地AI"更重要的,是先识别哪些场景根本不适合AI。这篇文章会把我在多个行业一线看到的7大反模式逐一拆开讲:典型表现、底层原因、风险后果、替代路线,全都给你说清楚。 文末还附一份企业级AI适配度评估10问清单,可以直接拿去和你的客户、业务方做共识。如果你正在推动企业AI转型,或者正在被老板/客户催着"赶紧上点AI"——这篇文章可能会帮你省下一个季度的预算。 把这三层共识打下来,你再回头看后面7个反模式,会发现它们其实是同一件事的不同切面——AI被用在了它不擅长、不划算、不可控的地方。 反模式D7合规与安全要求是什么?是否允许不确定性?反模式E8成本怎么核算?含标注、训练、推理、运维、失败损失?反模式F9上线后谁负责迭代?监控、漂移、回归谁来做?反模式G10时间窗口多长? 结语:在企业AI转型里,"敢说不"才是真本事写到这里,回到最开始那句话:AI不是越用越值钱,而是用错越烧越快。企业AI转型的真正难点,不在技术,不在算力,而在判断力。
Agentic AI,即“智能代理 AI”,是一种具备自主性和智能行动能力的人工智能系统。与传统的 AIGC 主要用于内容生成不同,Agentic AI 旨在创建能够执行复杂任务的智能代理。 这些代理不仅能分析数据、理解环境,还能制定决策并采取行动,具备一定的自主性和适应能力。 正文 2.1 Agentic AI 的核心特性 Agentic AI 主要具备以下核心特性: 自主性(Autonomy):能够独立完成任务,不需要人类全程干预。 大语言模型(LLM)的出现,使AI代理在自然语言处理和多模态生成方面取得了重大突破。这些代理不仅能生成内容,还能执行复杂任务,如自动化工作流和智能助手功能。 7. Agentic AI 的未来发展 Agentic AI 作为 AI 发展的新方向,未来可能带来以下变革: 更强的自主性:AI 代理将更加智能,能够独立完成复杂任务。
最近,Anthropic 发布了一份重磅研究 —— 基于数百万次真实人机交互,第一次把 AI 智能体在现实中的自主性、风险、人类干预行为彻底摊开。 结论很直白:AI 已经可以在无人干预的情况下,连续自主运行 45 分钟;越熟练的用户,越敢给 AI 放权,但也越会主动监控;高风险场景正在出现,只是还没大规模普及。 以下是该研究的完整中文版解读。 本研究的核心结论是:要实现对智能体的有效监管,需要搭建全新的部署后监控体系,也需要构建新的人机交互模式,助力人类与 AI 共同管控自主性与风险。 补充缺失的技术背景信息或修正错误(32%) 收集诊断信息或测试结果(21%) Claude 运行缓慢、卡死或操作冗余(17%) 澄清模糊或不完整的用户需求(13%) 已获得足够帮助,可独立继续操作(7% ) 申请缺失的密钥、令牌或访问权限(12%) 希望自行执行下一步操作(如手动测试、部署、提交代码等)(7%) 执行操作前寻求批准或确认(11%) 中途修改任务需求(5%) 上述发现表明,智能体主动暂停
他们从专业的角度出发,提出了未来AI系统应该满足的七大原则。 受人类监管 AI不应该践踏人类自治。人类不应该被AI系统操纵或威胁,人类应该能够干预或监督AI的每一项决定。 透明度 用于创建AI系统的数据和算法应该是可访问的,应确保AI决策的可追溯性。换句话说,运营商应该能够解释他们的AI系统是如何做出决策的。 而现在,AI七大原则也由欧盟率先提出,欧委会表示下一步他们还要为以人为本的AI制定国际共识,在G20峰会这样的国际场合探讨此事。 网友们怎么看 AI的迅猛发展到底会不会给人类带来机器人末日,其实一直是许多人心里的隐忧。在追求AI的安全性方面,无论是研究者还是普通人都没有停止过关注。 不过对于欧盟提出的这7大原则,也不是人人都买账的。 比如就有网友提出,凭啥AI话语权一定要不如人类,它要是就比人类强呢? ? 也有人觉得关于透明度的要求不太现实,神经网络本来就是一个黑盒子。
前言 受中电信 AI 科技有限公司的邀请,为他们近期开源的TeleChat-7B大模型做一个评测。 TeleChat-7B是由中电信 AI 科技有限公司发的第一个千亿级别大模型,基于transformer decoder架构和清洗后的1TB高质量数据训练而成,取得了相同参数量级别的SOTA性能,并且将推理代码和清洗后的训练数据都进行了开源 开源地址见:https://github.com/Tele-AI/Telechat 。此外,在开源仓库中也提供了基于DeepSpeed的LoRA微调方案以及国产化适配的训练和推理方案。 环境配置 可以使用官方提供的Docker镜像,也可以自己按照 https://github.com/Tele-AI/Telechat/blob/master/requirements.txt 来配置。 用户: 从思想、工作能力、团队合作三个方面评价员工,300字以内 TeleChat-7B: 作为一名AI语言模型,我没有个人观点和情感。但是,我可以根据一些常见的指标来对员工进行评价: 1.
Chat Reducer:让 AI 对话突破上下文限制 一句话简介 Microsoft.Extensions.AI 的 Chat Reducer 通过智能压缩策略,在保持对话质量的前提下,有效控制上下文长度 SummarizingChatReducer(摘要压缩器) 利用 AI 自动生成摘要压缩历史对话。 核心特性: 超过阈值时自动调用 AI 生成摘要 摘要存储在 AdditionalProperties 中 渐进式压缩(新摘要包含旧摘要) 保留完整语义上下文 适用场景: 医疗咨询(完整病史重要) 使用计数压缩器 using Microsoft.Extensions.AI; // 创建压缩器,保留最近 3 条消息 var countingReducer = new MessageCountingChatReducer baseChatClient.AsBuilder() .UseChatReducer(reducer: summarizingReducer) .Build(); 工作原理: 原始消息(7条