首页
学习
活动
专区
圈层
工具
发布

#token

VFP AI 插件:超长上下文的识别(一)

firstxinjie

对于 DeepSeek 而言,其大小为 128K(=128000 token)。尽管大多数情况下,对于单轮对话它是足够的,但是对于一些类/类库,甚至对于整个 V...

6510

AAAI 2026 | 基于 LLM 对齐的地理实体token化:快手LGSID框架优化本地生活服务推荐

时空探索之旅

论文标题:LLM-Aligned Geographic Item Tokenization for Local-Life Recommendation

7010

一次对话,百万 tokens 解析《三体》

用户1278550

2026年2月11日,DeepSeek宣布推出全新版本模型,支持100万token超长上下文处理能力,知识库更新至2025年5月,用户可通过官网直接免费体验。

12810

统一网关的登录流程总结

SmileNicky

面试金句:“网关统一认证实现了认证边界的内移,在架构入口处建立单一可信边界,符合零信任架构的’永不信任,始终验证’原则”

16020

给OpenClaw装上“外挂大脑”MemMachine后,记性翻倍,Token砍半

Henry Zhang

作为一名长期关注 AI 领域的从业者,我有幸见证了 OpenClaw 的崛起。该项目由 Peter Steinberger 从个人项目起步,短短数月内在 Git...

76440

Sa-Token 的极简设计哲学

JanYork_简昀

在 Java 领域的权限认证框架赛道上,长期以来我们面对的往往是庞大而复杂的“全能选手”。

14110

成本暴砍50%!鹅厂高工深度拆解AI编程模型Token节省技巧

腾讯云AI

在AI编程工具全面渗透产品开发流程的今天,Token已成为衡量开发成本的核心“货币”。 开发者们逐渐意识到:Token的消耗不仅是技术问题,更是一门需要精细化...

84010

Token太贵,中国开源模型一夜之间霸榜了

小腾资讯君

《智能体·新世界》系列第五期,Agentic AI时代,智能的“性价比”权重变得更高。中国开源模型抓住了这个范式切换的时间窗口。

1.5K10

客户端动态Token验证:新一代BOT防护方案的核心利器

gavin1024

在数字化时代,恶意机器人流量已成为企业网站和应用面临的主要安全威胁之一。据统计,恶意BOT流量占比可达30%,它们不仅消耗服务器资源、导致信息泄露,还会引发无效...

14010

用 PyTorch 实现 LLM-JEPA:不预测 token,预测嵌入

deephub

然后识别特殊 token 位置,CLS 和 SEP 不能遮蔽,否则模型容易出问题。调用 sample_span_mask 采样遮蔽位置,把这些位置替换成 mas...

6800

大模型如何训练百万 Token 上下文:上下文并行与 Ring Attention

deephub

只用了几年时间,上下文窗口就从 4k 膨胀到 1000 万。Meta 发布的 Llama 4 Scout 的时候说这个模型支持 1000 万 Token,是 ...

17810

12:【GitHub PAT】Personal Access Token过期/2FA后HTTPS推送失败(2026仍高频)

安全风信子

作者: HOS(安全风信子) 日期: 2026-02-13 主要来源平台: GitHub 摘要: 2026年,GitHub的Personal Access...

12110

OpenClaw 2.6 调教实录:从崩溃 4671 次到省 50% token

孟健

腾讯 | 前端开发工程师 (已认证)

这篇文章记录我怎么排查这个事故,以及趁机把 OpenClaw 2.6 做了一次全面体检——最终 token 费用降了 30-50%,记忆不再丢失。

3.4K11

Nature | 智源 Emu3 登顶:终结扩散模型霸权?下一代多模态大模型只需 预测下一个 Token

MindDance

参考文献: Wang, X., Cui, Y., Wang, J. et al. Multimodal learning with next-token pre...

17410

《万级 Token 消耗之谜:为什么修改几行代码会触发 AI 的“全文重写”?》

沈宥

AI 编程助手(如 GitHub Copilot, Cursor)的出现,极大地提升了开发者的编码效率。然而,随着使用频率的增加和模型能力的增强(尤其是支持超长...

66910

Nature | 智源 Emu3 登顶:终结扩散模型霸权?下一代多模态大模型只需 预测下一个 Token

DrugOne

参考文献: Wang, X., Cui, Y., Wang, J. et al. Multimodal learning with next-token pre...

26120

【教程】零成本白嫖 ClawdBot :Gemini CLI + 本地中转方案

Mirza Zhao

OpenClaw最近很火,但是却是一个十足的token吞金兽,如果你不想消耗昂贵的 token,只想部署玩玩,利用 Google 每天提供给开发者的免费请求额度...

7.1K114

50. Harmony Format 解析:vLLM的统一 token 化方案

安全风信子

Harmony Format是vLLM提出的一种统一tokenization方案,旨在解决不同模型间tokenization碎片化的问题。它通过设计一种通用的t...

11510

关于多模态大模型Token压缩技术进展,看这一篇就够了

机器之心

近年来多模态大模型在视觉感知,长视频问答等方面涌现出了强劲的性能,但是这种跨模态融合也带来了巨大的计算成本。高分辨率图像和长视频会产生成千上万个视觉 token...

31910

估值35亿美元,LeCun创业公司官宣核心方向,掀起对Next-token范式的「叛变」

机器之心

一直以来,LeCun 都对现有大语言模型的发展持怀疑态度,认为仅靠预测下一个 token 的生成式模型无法真正做到理解现实世界。他提出了世界模型这一不同路径,一...

17310
领券