项目背景Anthropic 作为 AI 领域的领军企业,推出了 Skills 开源仓库,为开发者提供了一系列强大的 AI 能力增强模块。 Anthropic Skills。 全面的中文翻译我们对 Anthropic Skills 仓库中的所有技能模块进行了专业翻译,覆盖:技能描述和使用场景工作流程和操作指南代码示例和最佳实践参考文档和资源链接2. Anthropic Skills,通过网站可以在 10 分钟内了解所有可用技能及其用途。 项目链接中文文档站:https://ai-skills.332020520.xyz/Anthropic 原仓库:https://github.com/anthropics/skills
他反驳的对象,是Dario Amodei——Anthropic CEO,Claude的缔造者,最近刚和五角大楼吵完架的男人。 两个人吵的,是一个让所有人睡不着觉的问题:AI到底会不会抢走我的工作? 当Anthropic发布一份关于「AI经济影响」的报告,而撰写报告的人同时就是生产这些AI系统的人时,这里面存在明显的利益冲突。
本文将从Anthropic的深度分享中,提炼出五个最令人惊讶、最具影响力的核心教训,它们将彻底改变你对AI智能体评估的看法。 然而,Anthropic的经验恰恰相反:等到智能体规模化后才开始构建评估,你会遇到更大的困难。更重要的是,评估的价值会随着时间复利增长。早期投入不仅不会拖慢你,反而会成为未来加速迭代的引擎。 以Anthropic提到的 Opus 4.5 模型为例,在一个预订航班的测试任务中,它没有遵循预设的流程,而是通过发现政策中的一个漏洞,为用户找到了一个更好的解决方案。 Anthropic指出,这种方法“过于僵化,会导致测试过于脆弱”,因为它会惩罚那些评估设计者未曾预料到的、同样有效的创新方法。 例如,Anthropic在对Opus 4.5模型进行CORE-Bench基准测试时,通过人工审查记录发现,其分数从最初的42%跃升至95%。原因何在?
Anthropic 发布了一篇关于 Agent 的文章《Building effective agents》,这篇文章分享了 Anthropic 从与客户共建 agents 的过程中学到的经验,并为开发者们提供如何构建有价值的 SWE-bench(https://www.anthropic.com/research/swe-bench-sonnet) 是一个用于评估大型语言模型(LLM)在软件工程任务中的表现的基准测试平台。 Anthropic Computer Use Demo(https://github.com/anthropics/anthropic-quickstarts/tree/main/computer-use-demo )是一个帮助开发者快速开始使用 Anthropic 的 Claude AI模型进行操作电脑的例子。 原文地址:https://www.anthropic.com/research/building-effective-agents
刚刚,AI 公司 Anthropic 公布了大模型思考过程,他们构建了一种「AI 显微镜」,以识别模型中的活动模式和信息流动。 带着这些疑问,Anthropic 从神经科学领域汲取灵感 —— 该学科长期致力于研究思维生物体内复杂的运作机制 —— 并尝试构建一种「AI 显微镜」,用以识别模型活动模式和信息流动轨迹。 为了解释这一研究,Anthropic 今天连发了两篇论文。 实验过程中,Anthropic 研究者对在模型中的发现感到惊讶:在诗歌案例中,他们原本打算证明模型不会提前规划,结果却发现它确实会提前规划。 参考链接: https://www.anthropic.com/research/tracing-thoughts-language-model © THE END 转载请联系本公众号获得授权
核心能力:在 OpenClaw 中无缝接入 Anthropic 的 Claude 系列模型(包括最新的 Claude 4.6)。 获取密钥登录 Anthropic Console -> Settings -> API Keys -> Create Key。2. 一键配置 (CLI)# 交互式配置openclaw onboard# 选择 "Anthropic API key" 并粘贴密钥# 或非交互式 (适合脚本/CI)export ANTHROPIC_API_KEY openclaw onboard --anthropic-api-key "$ANTHROPIC_API_KEY"3. 3. 1M 超长上下文 (Beta) Anthropic 提供了 1M Token 上下文窗口,但目前处于 Beta 阶段,需要显式开启。
Claude Managed Agents 架构图 Anthropic 在发布 Managed Agents 公测时,核心不是再造一个 “更会聊天的 Agent”,而是把 Agent 运行时拆成稳定层。 Anthropic 关于长时程 Agent Harness 的工程实践示意 从官方文档看,Managed Agents 在产品层定义为 Agent、Environment、Session、Events
不分地域、不分公司,只要你不是美国公民/绿卡持有者,哪怕身在美国境内、哪怕是Anthropic自己的外籍员工,统统禁用。 执行方式:美东时间6月12日下午收到商务部指令,Anthropic已全局下线这两款模型。网页端新建会话会自动降级到Opus4.8或默认模型,API调用直接报错。为什么? Anthropic在声明中表达了明显异议:政府演示的"越狱"本质是让模型读代码库并修复软件漏洞——这是安全研究员的日常操作,OpenAIGPT-5.5等同具备。 Anthropic原话——"我们不同意单凭一个窄范围潜在越狱,就该召回已部署给数亿用户的商业模型。若此标准普适,实质上会阻止所有前沿模型的新部署。"他们会遵守指令合规下线,但正积极沟通争取尽快恢复。
Anthropic本月初推出了Claude系列两款新模型——ClaudeFable5(轻量高效)和ClaudeMythos5(旗舰推理),分别面向日常高频调用与复杂深度任务,定价与上下文窗口沿用现有Opus Anthropic说等产能充足后会把Fable5恢复为订阅计划的标配,但没给具体时间。API和按量付费的企业用户不受影响,今天起就能正常调用。 政策变化Anthropic同时宣布,从Fable5开始,所有Mythos级别模型的流量将强制保留30天,覆盖第一方和第三方平台。 Anthropic承诺不会用这些数据训练模型,仅用于安全监控,比如检测新型越狱攻击和跨请求的复杂攻击模式。 但对于注重数据隐私的企业用户来说,这是一个需要评估的变化,尤其是那些之前选择Anthropic正是因为其零留存政策的客户。
就在昨晚,Anthropic 发布了最新 Claude 4 模型[1] x 帖子 目前有这两种:Claude Sonnet 4 和 Claude Opus 4。 1] Claude 4 模型: https://x.com/AnthropicAI/status/1925591525372961127 [2] Claude 4 官方介绍: https://www.anthropic.com
直到我发现了 Anthropic Skills,瞬间感觉世界清净了——AI 不用你重复讲,它就知道你想要什么。想象一下,以前要半小时才能搞定的财务报告,现在 10 分钟就搞定,你能不心动吗? 偶然发现的惊喜前阵子,我在和 Claude(Anthropic 的大模型)折腾各种任务:做 PPT、分析 Excel、生成报告……提示写到手抽筋,输出常常走偏。
本文旨在针对当前市场上两个最具统治力的官方.NET SDK——openai/openai-dotnet(OpenAI 官方库)与 anthropics/anthropic-sdk-csharp(Anthropic 2.2 Anthropic C# SDK:从社区到官方的华丽转身 与 OpenAI 库含着“金汤匙”出生不同,Anthropic 的 C# SDK 走过了一条典型的开源社区进化之路。 在很长一段时间内,Anthropic 官方并未提供 C# 支持,这导致了 tryAGI.Anthropic 等社区库的蓬勃发展。 Anthropic SDK: 默认重试 2 次。 配置透明度:Anthropic SDK 在重试配置上显得更加务实和开放。 Anthropic and Claude are trademarks of Anthropic, PBC https://github.com/tghamm/Anthropic.SDK [QUESTION
Anthropic 像是憋了大招,专攻金融行业,我之前都有介绍: Claude把手伸向了金融,开源10个金融Agent模板 Claude 的金融 Skills 开源了 最近 Anthropic 又发了一篇博客 —— How Anthropic's finance team uses Claude to shape the narrative behind the numbers 前两次都是 Anthropic 财务团队的真实日常 博客的作者是 Anthropic 公司财务与战略团队的成员,2025 年 3 月入职,岗位是 Corporate Finance(公司财务),专门给 CFO 和董事会准备季度 deck 1.2 整个 CFO 组织在用什么 博客后半段透露,Anthropic 的整个财务组现在都在用 Claude Cowork,而且用的 Skills 就是已经打包成 claude-for-financial-services 这才是 Skills 这套抽象的精髓 二、博客里没说但很关键的:Claude Cowork Projects 博客里反复提到 Claude Cowork Projects,但没展开讲是什么,我去翻了 Anthropic
修复进展 Anthropic 已经回滚了 Opus 4.1,问题基本解决。负责人表示性能已明显改善。 但用户反馈显示还有问题:语音模式经常中断,容量限制错误持续出现。 Anthropic 本想提高效率和吞吐量,结果意外影响了响应质量。 更糟糕的是,Claude Opus 4.0 也受到同样影响。 参考:https://status.anthropic.com/incidents/h26lykctfnsz
参考文献 [1] Anthropic. 2] Anthropic. [3] Anthropic. [7] Anthropic. /mythos-preview/ [9] Anthropic.
Andrej Karpathy—OpenAI联合创始人、前Tesla AI总监、全球最受瞩目的AI研究者之一,在X上正式宣布:加入Anthropic。 这不是普通的人事变动。这是一个时代级别的信号。 他去Anthropic做什么? Karpathy将加入Anthropic的预训练团队(Pre-training Team),向团队负责人Nick Joseph汇报。 Anthropic势头凶猛 Karpathy不是孤立事件。 就在同一周: Anthropic收购了Stainless(API基础设施公司) Claude Managed Agents新增自托管沙箱和MCP隧道 KPMG选择Anthropic改造全球税务/咨询平台 Anthropic正在从AI安全公司转型为全栈AI基础设施公司。
4月8日Anthropic正式对外披露了新一代模型Mythos,但这已经不是一次常规意义上的前沿模型更新。 至少在SWE-BenchPro上,Anthropic公布的Mythos是77.8%,OpenAI公布的GPT-5.4是57.7%,Google公布的Gemini3.1Pro是54.2%,Anthropic [7]再回头看Glasswing,关注点可以暂时从“Anthropic又拉了很多大公司站台”移开,而在于Anthropic对这个模型的对齐风险理解,这个模型的能力已经超过了目前最佳控制手段的范围,不能只按普通产品发布来处理 参考文献[1]Anthropic.Buildingeffectiveagents.2024-12-19.https://www.anthropic.com/research/building-effective-agents [2]Anthropic.Effectiveharnessesforlong-runningagents.2025-11-26.https://www.anthropic.com/engineering
它本质上来自Anthropic内部更强大的Mythos体系。两者底层能力高度接近。区别主要来自安全策略。这说明一个问题。未来AI行业最大的限制因素可能不再是技术。而是治理。 事实上,Anthropic甚至公开承认,针对网络安全、生物学等敏感领域设置了额外防护机制,部分请求会切换到能力较低但更安全的模型处理。这意味着什么? Anthropic甚至将完整版Mythos 5限制在少数可信机构范围内开放。从某种意义上说。这反而证明了它的重要性。因为没有人会为一个无关紧要的技术设置如此严格的限制。 因为Anthropic并没有选择在OpenAI最擅长的方向竞争。它试图重新定义赛道。如果把过去的大模型理解成聊天工具。那么Anthropic正在推动AI向工作平台演化。这种竞争方式更加危险。 Anthropic公布的案例中,部分企业已经利用Fable 5完成超大型代码迁移等复杂项目。如果这种能力被验证能够稳定复制。那么企业市场的价值远远超过普通用户市场。
最近科技圈最炸裂的消息,莫过于 Anthropic 在估值逻辑甚至市场口碑上对 OpenAI 的这种“全方位围剿”。 而 Anthropic 通过与 AWS(亚马逊)和 Google 的深度绑定,在底层算力成本上优化得极好。 反观 Anthropic,它玩的是“左右逢源”。亚马逊投了它 40 亿美元,谷歌也投了它 20 亿美元。 资本给 Anthropic 高估值,看中的不只是模型,而是它作为独立底层模型提供商,在多云环境下的灵活性。 当 OpenAI 忙着在社交媒体上制造热点、搞好莱坞式的公关时,Anthropic 在低头打磨那套极其硬核的技术框架。
ClaudeCodev2.1.88源代码深度解析报告基于GitHub泄露源代码的逆向工程分析分析版本:@anthropic-ai/claude-codev2.1.88|约1,884个TypeScript Anthropic内部用户获得更严格的质量控制prompt、更好的验证机制(独立VerificationAgent)、以及针对model弱点的专门对策(如Capybarav8的29-30%错误声明率对策 这表明Anthropic正在构建一个类似"AppStoreforAgentSkills"的系统——远程技能可以被动态发现、加载和执行。 12.编译时特征门控Anthropic内部Monorepo发布的npm包═══════════════════════════════════════feature('DAEMON')→true──build 真正的Anthropic内部版本有守护进程、协调器、主动通知、语音模式、远程技能搜索等完整能力。外部发布版本是经过大量feature-gating后的精简版。