deephub

文章/答案/技术大牛

发布

LV1

全部文章

Claude Opus 4.7 系统 Prompt 泄露：其中的10 个核心设计决策解读
Claude 4.7刚发布不久他的Prompt就已经被Hack出来了，仔细看 Claude 的系统设计会发现一件有意思的事：它不只追求聪明，还在试图约束自身的行...
deephub 5天前2026-04-21 20:27:31
安全、prompt、模型、设计、系统
无 Embedding、无向量数据库的 RAG 方法：PageIndex 技术解析
PageIndex 是一种无向量、基于推理的检索增强生成（RAG）方法，无需 Embedding、分块或向量数据库即可从长文档中检索答案。
deephub 5天前2026-04-21 20:26:54
搜索、系统、向量数据库、embedding、事件
从检索到回答：RAG 流水线中三个被忽视的故障点
RAG 流水线部署完毕、检索正常运行、LLM 按部就班地生成回答、用户也在持续收到响应，这一切看上去运转良好。但有一个问题大多数工程师从来不问：这些回答真的对吗...
deephub 11天前2026-04-15 08:28:56
异常、response、trace、监控、系统
Karpathy的LLM Wiki：一种将RAG从解释器模式升级为编译器模式的架构
Andrej Karpathy在GitHub上发布了一份名为LLM Wiki的文档引起了巨大的关注，一派认为"这不就是多绕了几步的RAG"，另一派已经打开编辑器...
deephub 11天前2026-04-15 08:28:29
解释器、LLM、wiki、编译器、架构
向量相似性搜索详解：Flat Index、IVF 与 HNSW
要理解向量搜索先要弄清楚为什么需要向量数据库，关系型数据库处理结构化数据得心应手。所谓结构化数据就是那些具有固定列的表格数据，比如说：姓名、年龄、薪资、日期。这...
deephub 11天前2026-04-15 08:28:03
索引、遍历、链表、数据、搜索
拆解推荐系统：候选生成、过滤、排序、多样性的分层设计
推荐系统不是单一算法而是一条流水线，每个阶段在不同约束下解决不同的问题。多数入门实现把所有事情塞进一步：算相似度。但生产级系统需要做关注点分离，分别管控质量、速...
deephub 11天前2026-04-15 08:27:32
推荐系统、排序、设计、数据、系统
Prompt、Context、Harness：AI Agent 工程的三层架构解析
2023 年"Prompt Engineering"无处不在；到 2025 年中"Context Engineering"成为了主流；而 2026 年 4月反复...
deephub 11天前2026-04-15 08:26:51
架构、模型、agent、prompt、工具
向量数据库对比：Pinecone、Chroma、Weaviate 的架构与适用场景
向量数据库存储 Embedding，也就是文本、图像或音频的数值表示，并在查询时检索语义上最接近的结果。RAG 系统正是基于这一机制运作。本文对比三个主流方案，...
deephub 11天前2026-04-15 08:26:15
架构、搜索、系统、向量数据库、存储
instinct：一个基于置信度的 AI Agent 自学习记忆系统
Claude Code、Cursor、GitHub Copilot 这类 AI 编码 Agent 在单次会话中表现出色，但每次新会话都从零开始。没有连续性，也没...
deephub 11天前2026-04-15 08:25:47
agent、服务器、工具、系统、存储
机器学习特征工程：缩放、编码、聚合、嵌入与自动化
多数机器学习算法对尺度敏感。一个取值范围在0到1,000,000的列，会在训练中压制一个取值范围仅0到1的列。
deephub 11天前2026-04-15 08:25:17
数据、机器学习、自动化、特征工程、编码
ADK 多智能体编排：SequentialAgent、ParallelAgent 与 LoopAgent 解析
单个智能体的专业化程度有上限，真正的工作需要团队：一个角色接收订单，一个检查库存，一个安排生产，一个验证质量。ADK 的编排模式：SequentialAgent...
deephub 11天前2026-04-15 08:22:39
工作流、数据、agent、key、output
从零构建 Mini-vLLM：KV-Cache、动态批处理与分布式推理全流程
HuggingFace 的 .generate() 是个黑盒，而且这个黑盒藏了一个代价很高的问题，每一个解码步骤它都从头开始对整个 prompt 做一次完整的注...
deephub 11天前2026-04-15 08:21:41
模型、分布式、缓存、self、路由器
多 Aspect Embedding：将上下文信号编入向量相似性计算的检索架构
向量数据库的核心任务是对文本或其他非结构化数据生成的 Embedding 做相似性搜索。时间戳、文档类型、所有权一类的上下文约束，一般以外部过滤器的形式在向量搜...
deephub 11天前2026-04-15 08:21:01
架构、排序、搜索、系统、embedding
投机解码原理详解：小模型打草稿，大模型一次验证
生产环境中真正烧钱、拖慢体验的环节不是训练、是推理。自回归的方式一次只产出一个 token，每个 token 都要完整走一遍模型所有层的前向传播。70B 参数的...
deephub 11天前2026-04-15 08:20:14
原理、token、模型、内存、数据
10个内置在 Pandas 中却常被忽略的向量化操作
Pandas 代码写得越多，越容易陷入一种惯性：用 apply() 逐行处理，用循环拼接结果，用 groupby 加 merge 绕一大圈完成本可以一行解决的操...
deephub 11天前2026-04-15 08:19:41
字符串、pandas、量化、设计、数据
不依赖对话日志检测Prompt注入，一套隐私优先的实现方案
检测 Prompt 注入和越狱攻击的方法，大多建立在系统可以访问对话日志这个前提上。但是如果设计一个系统，每段对话只处理一次以提取特征，不保留原始文本可以吗？：
deephub 11天前2026-04-15 08:18:59
日志、数据、系统、隐私、prompt
多 Agent 验证架构实战：从输出评分到过程验证
多 Agent 流水线在每一次演示中都表现正常。但是到了生产环境，它可能在第四步之前就悄悄积累了三个错误决策，最终输出自信、流畅但是完全错误。并且最后没有人发现...
deephub 26天前2026-03-31 19:57:36
模型、agent、state、工作流、架构
RouteRAG：用特殊 Token 和强化学习构建可学习的 RAG 检索策略
它不依赖固定的手工检索流水线或静态指令，而是学到一套策略：推理过程中的特殊 Token 可以触发检索动作。每一步，模型生成一个动作 Token——继续内部推理、...
deephub 26天前2026-03-31 19:57:10
模型、设计、效率、强化学习、token
多智能体系统的核心设计：从任务分解到依赖图驱动的编排循环
ChatGPT 能写代码，但要它研究问题、编写实现、审查自身代码中的 bug、编写测试、修复失败的用例并撰写文档，并且在一次交互内做完全部环节，可靠性远远不够。...
deephub 26天前2026-03-31 19:55:48
架构、设计、系统、编码、工作
AI Agent 架构详解：Chain-of-Thought、ReAct 与工具调用的协作机制
"做一个 I Agent"——这个需求大概已经躺在不少人的待办列表里了。但翻遍现有资料会发现一个尴尬的断层：学术论文只写给机器学习工程师看，营销文案只负责把 A...
deephub 26天前2026-03-31 19:55:14
架构、模型、react、agent、工具

12 3 4 5 6 7 8...90 下一页

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2020-04-20

个人成就

获得 3.6K 次赞同
文章被阅读 2.8M 次
文章获得 1 次首页推荐

关注了：1关注者：249

deephub

全部文章

Claude Opus 4.7 系统 Prompt 泄露：其中的10 个核心设计决策解读

无 Embedding、无向量数据库的 RAG 方法：PageIndex 技术解析

从检索到回答：RAG 流水线中三个被忽视的故障点

Karpathy的LLM Wiki：一种将RAG从解释器模式升级为编译器模式的架构

向量相似性搜索详解：Flat Index、IVF 与 HNSW

拆解推荐系统：候选生成、过滤、排序、多样性的分层设计

Prompt、Context、Harness：AI Agent 工程的三层架构解析

向量数据库对比：Pinecone、Chroma、Weaviate 的架构与适用场景

instinct：一个基于置信度的 AI Agent 自学习记忆系统

机器学习特征工程：缩放、编码、聚合、嵌入与自动化

ADK 多智能体编排：SequentialAgent、ParallelAgent 与 LoopAgent 解析

从零构建 Mini-vLLM：KV-Cache、动态批处理与分布式推理全流程

多 Aspect Embedding：将上下文信号编入向量相似性计算的检索架构

投机解码原理详解：小模型打草稿，大模型一次验证

10个内置在 Pandas 中却常被忽略的向量化操作

不依赖对话日志检测Prompt注入，一套隐私优先的实现方案

多 Agent 验证架构实战：从输出评分到过程验证

RouteRAG：用特殊 Token 和强化学习构建可学习的 RAG 检索策略

多智能体系统的核心设计：从任务分解到依赖图驱动的编排循环

AI Agent 架构详解：Chain-of-Thought、ReAct 与工具调用的协作机制

个人简介

个人成就

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐