首页
学习
活动
专区
圈层
工具
发布

#LLM

2026-04-25: 从 RAG 到 Agentic Search + Tech Graph 的落地复盘

用户12403993

进度:把“AI 辅助开发”从「单点 RAG」升级为「Agentic Search + Tech Graph(静态约束)」的可持续工程范式,并对齐后端项目的 _t...

4910

图谱驱动开发---告别大段文档,上下文省 70%,让 AI 按你的流程写代码

用户12403993

Mermaid 拓扑协议双轨制在后端(5 图)与前端(5 图)全部落地:.md 人类版 + .ai.md AI 协议版 + validate_mermaid.p...

7210

打破幻觉与成本魔咒:DeepSeek-V4 如何用双轴稀疏架构重塑大模型未来?

jack.yang

在人工智能大模型竞赛进入白热化的2026年,算力军备竞赛已触及物理和经济的双重天花板。传统稠密模型和单一维度的稀疏化(如MoE)正面临“规模魔咒”(训练不稳定)...

21420

政企AI落地,从“知识检索”到“智能体行动”的跨越——江苏省属企业AI场景发布会参后感

吴同

4月17日下午,由江苏省国资委、省数据局等多部门主办的“江苏省属企业人工智能应用场景发布会”在南京举行。会上一个明确信号是:政企不缺AI热情,缺的是可落地的连接...

7210

CHI 2026 归来:AI/LLM 正在重写人机交互的底层语法

mixlab

巴塞罗那,4月的CHI 2026刚结束。1705篇论文,6730份投稿,25.3%的录用率 —— 这个数字本身不算惊人,惊人的是这1705篇里有相当比例在讨论同...

16810

【开源项目】基于一款多智能体LLM的中文金融交易框架 - TradingAgents

子晓聊技术

TradingAgents 是一个基于多智能体大语言模型(LLM)的金融交易框架,由 Tauric Research 开发并开源。而这里推荐的专为中国用户提供完...

25820

AI Coding Agent 到底是怎么跟 LLM “谈恋爱”的?一文看懂闭环交互全过程

不吃草的牛德

今天我们不堆框架名词,直接掰开揉碎讲清楚——一个合格的Coding Agent,是如何跟LLM反复“拉扯”、最终把活干完的。

9110

Karpathy LLM Wiki 实践:用"知识编译"替代 RAG,构建个人知识库

tunsuy

这里的设计亮点是 「LLM 回调机制」:所有 LLM 相关功能(摘要、提取、问答)都通过回调函数注入,不提供回调时退化为简单实现(如截取前 500 字符做摘要)...

80410

追番进度管理新姿势——实战通过 QClaw 从零新建 anime-tracker 技能

远哥制造

Cisco | 后端开发工程师 (已认证)

最近看到云 + 社区出了 QClaw 的征文,其中脑洞名场面包含用来管理追剧/追番进度的场景

14200

如何给有状态的LLM系统写一套量化评测

陆业聪

真正的问题是:当你的系统在 LLM 外面挂了一堆东西——记忆层、路由层、人格注入、工具调用——怎么用可复现的数字证明每一块的价值?而不是靠 cherry-pic...

10810

大模型也有"幻觉"?手把手教你构建针对LLM输出的功能验证体系

AI智享空间

当你的技术团队第一次将大模型接入生产环境,产品演示往往令人惊艳:它能写代码、能总结文档、能回答复杂问题。但真正上线第一天,客服主管就会冲进你的办公室:“AI告诉...

17710

从LLM到Agent OS:AI智能体的完整进化线复盘(需求驱动视角)

烟雨平生

2022年底,ChatGPT横空出世。那一刻,所有人都以为AI的终极形态就是"超级聊天机器人"——你问什么,它答什么,知识渊博,对话流畅。

34920

LLM成本控制:预算即产品功能

用户11764306

大语言模型是大多数产品团队首次遇到的、每个请求都有可见边际成本的依赖项。这改变了规则:一个功能可能“工作正常”,但在生产环境中却因悄悄烧钱、重试导致费用激增,或...

8700

知识图谱轻量化构建方案

用户9048088

文档版本:V1.1适用场景:医药领域海量文本 RAG 知识库构建、专业知识问答系统核心创新:上下文 - 联系轻量化图谱 + 上下文级 Embedding + 评...

13510
领券