首页
学习
活动
专区
圈层
工具
发布

#缓存

缓存就是数据交换的缓冲区(称作Cache),当某一硬件要读取数据时,会首先从缓存中查找需要的数据,如果找到了则直接执行,找不到的话则从内存中找。缓存的作用是帮助硬件更快地运行。

DeepSeek V4 Pro 1个亿Token,到底要花多少钱?

Hello工控

平均下来,每百万 Token 的成本不到 0.08 元人民币。这说明目前咱们使用的这两个 v4 模型的定价极其良心,或者大量使用了 DeepSeek 特有的上下...

7700

VS Code开始加速了!全面支持TypeScript7

GoLang学习记

这让我想起自己第一次给项目加缓存的经历:用户感知不到技术细节,但他们能感受到"变快了"。有时候,最好的用户体验,恰恰是用户"感觉不到"的体验。

14810

DeepSeek-V4 实战——我用国产大模型重写了3个项目

烟雨平生

DeepSeek-V4 的上下文缓存机制,把重复的系统提示和数据结构缓存起来,后续请求直接命中缓存。

16210

Agent设计模式(5):Planning模式——如何拆解复杂任务

烟雨平生

你有没有遇到过这种场景:让Agent做一件复杂的事,它做到一半就卡住了,或者做得乱七八糟?

12510

深度解读:智能体测试实战案例

顾翔

结果:首轮测试暴露4类高危缺陷,其中1例‘在合规拦截后仍缓存违规话术至后续对话’,属典型状态污染问题——这在传统无状态API测试中完全不可见。

9210

提示词测试:AI应用的性能优化新维度

顾翔

在AI原生应用爆发式增长的今天,越来越多团队发现:模型能力已非瓶颈,真正制约系统响应速度、成本效率与用户体验的,是那短短几十到几百字符的提示词(Prompt)。...

9410

腾讯云 GooseFS+Lance:面向 AI 时代定义向量存储加速

云存储

腾讯云 | 云存储 (已认证)

- 告别整块缓存:传统的缓存系统(如 HDFS Cache)通常以固定的大数据块(Block)为单位进行缓存。这意味着即使一次点查只涉及几 KB 数据,也可能需...

13210

日均处理百万张图片的审核账单太贵了?4种套餐组合方案帮你省下60%成本

gavin1024

摘要: 大型平台按量付费图片审核成本高昂,但通过合理的套餐组合可节省60%费用。本文提供4种适配不同规模的套餐方案和5个省钱技巧,帮你大幅降低图片审核成本。 📌...

11710

Workbox v6 (CLI + `workbox-config.js`) 实用指南

除除

本文介绍 Workbox v6 在 CLI 环境中的使用方法,涵盖 generateSW 与 injectManifest 两种模式,说明缓存策略、运行时缓存与...

9710

AI驱动需求梳理与Spec编写:让PRD自动变成技术方案

陆业聪

P0 标签数据源未定义 — PRD提到"展示用户标签"但未说明数据来自本地缓存、远端接口还是两者混合。建议:采用远端优先+本地缓存降级策略,缓存有效期建议15分...

22710

你调的每一个接口背后,到底发生了什么?

陆业聪

这个模式叫 Cache-Aside,是最常用的缓存策略。但它有个经典问题:缓存与数据库的一致性。用户改了昵称,数据库更新了,但缓存里还是旧的——你在客户端刷新发...

15510

首帧渲染优化:从白屏到内容可见的最后一公里

陆业聪

其中效果最大的两项是缓存策略和 Baseline Profile。缓存策略让首帧直接有数据可渲染,省掉了网络等待;Baseline Profile 让 Comp...

12310

为生产级 AI Agent 构建持久化记忆:五阶段流水线与四种设计模式

deephub

单次向量数据库查询本身就要 50–300ms——那是全部预算。生产架构会再压上一层语义缓存(亚毫秒)和预测性预取,才把整体拉回线以下。

25410

从Prompt到Spec——为什么AI编程需要一种新方法论

烟雨平生

你回去改Prompt,加了一堆约束:"必须用QueryWrapper"、"排序下沉到SQL"、"缓存命中率要超80%"。AI又出了一版。这次好多了。但还有问题:...

17910

AI工具链效率提升——以ClaudeCode为例,从Demo代码到工程化落地

烟雨平生

Demo代码谁都会写。但要写出能进生产环境的代码,得懂架构、懂约束、懂边界。AI也是一样,给它一个"帮我写个排序",它能给你一个快速排序。但你让它"基于现有Sp...

28710

Android应用架构

franket

破茧成蝶:Android应用架构的演进与MVP/RxJava实战探索原始译文参考:小鄧子的简书(译者:小鄧子)本文是对IvánCarballo所撰写的关于Rib...

7910

构建我的Presentation层

franket

构建我的Presentation层原文链接:Modelingmypresentationlayer原文作者:panavtec译文出自:开发技术前线www.dev...

8910

腾讯云对象存储(COS)核心能力与场景化应用概要

IT资讯研究所

腾讯科技 | 研究员 (已认证)

腾讯云对象存储(COS)是安全、可靠、高性价比的云端海量存储服务,定位为集成缓存加速与数据处理功能的全球化存储基础设施,核心技术属性为作为CDN请求的二级源站以...

15810

月之暗面(Moonshot AI)和清华大学最新研究:推理吞吐量暴涨54%

Ai学习的老章

PrfaaS 把这两类 KVCache 分组管理,但共享底层的内存池。缓存块分为两类:前缀缓存块(可跨请求复用)和传输缓存块(传完即丢)。全局 KVCache ...

29610

AI 成为主流负载后,数据基础设施将如何演进?|Apache Doris 2026 Roadmap

SelectDB技术团队

但进入 2026 年,这个问题正在被重新定义。随着 AI 应用的爆发式增长,数据系统不再只是分析工具,而逐渐成为 智能系统的一部分。数据不再只是被查询,而是被 ...

15410
领券