作者信息美团 LongCat 团队 (Meituan LongCat Team)研究背景当前,下一代令牌预测(NTP)范式通过离散自回归建模推动了大型语言模型的成功。 统一模型中的卓越表现:LongCat-Next克服了离散视觉建模的长期瓶颈,在保持强任意分辨率生成质量的同时,实现了与专用视觉理解模型相媲美的竞争力。 研究方法研究方法基于离散自回归基础,采用模态特定的分词器-去分词器对和模态无关的混合专家(MoE)骨干网络(LongCat-Flash-Lite A3B)。 在音频任务中,LongCat-Next在自动语音识别(ASR)、文本转语音(TTS)和音频理解方面均达到最先进水平,超越了Gemini 3.1 Flash-Lite preview和MiMo-Audio 总结与展望本研究通过LongCat-Next探索了语言风格离散自回归建模自然扩展到视觉和音频的可能性。结果表明,通过精心设计的分词器和训练策略,连续感知信号可以被有效离散化,同时保持强大的能力。
美团自研LongCat大模型开放平台提供每日免费Token额度,支持兼容OpenAI标准接入,可搭配绿联NAS AI Plugins、Python脚本、n8n等工具使用,适合个人开发者与学生群体低成本体验大模型能力 一、LongCat核心福利与模型速览 ●1.1 免费额度明细 LongCat‑Flash‑Lite:每日独享5000万Token LongCat‑Flash‑Chat / Flash‑Thinking 轻量化通用 日常对话、批量文本处理 速度快、消耗低 LongCat‑Flash‑Chat 通用对话 多轮聊天、内容创作 流畅度友好 LongCat‑Flash‑Thinking 深度推理 逻辑题、代码 API Key 浏览器访问LongCat API开放平台:https://longcat.chat/platform/ 手机号注册登录,进入API Keys页面 点击创建,生成并复制API Key(妥善保管 #AI算力白嫖 #美团LongCat #绿联NAS #AIPlugins #大模型API #免费Token #开发者干货
体验链接:https://longcat.ai 模型地址:https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking-2601 GitHub :https://github.com/meituan-longcat/LongCat-Flash-Thinking-2601 不仅如此,该模型的智能体能力还获得了重大提升:在智能体工具调用、智能体搜索和工具集成推理等基准测试中达到顶尖性能 整体而言,LongCat 在处理工具依赖关系的响应节奏上展现出了更强的稳定性。 LongCat ZigZag Attention:实现超长上下文 LongCat ZigZag Attention,顾名思义,是一种注意力机制,根据其官方推文描述,其一大核心亮点是能「实现 100 万 据悉,LongCat ZigZag Attention 已被成功用于训练当前 LongCat-Flash-Thinking 模型的一个分支,我们也将很快见证这个分支版本面世。
这个模型来自美团的 LongCat-Flash 系列,官网可以直接使用(https://longcat.ai)。 技术报告:LongCat-Flash Technical Report 报告链接:https://github.com/meituan-longcat/LongCat-Flash-Chat/blob/main 跑起来又快又便宜 LongCat-Flash 是怎么做到的? 我们刚提出要求,刚点开录屏,LongCat-Flash 就把答案写出来了,录屏都没来得及第一时间关。 细细观察你会发现,LongCat-Flash 的首个 token 输出速度特别快。 接下来,我们打开「联网搜索」,看看 LongCat-Flash 这项能力够不够快。我们让 LongCat-Flash 推荐望京附近好吃的餐厅。
美团 LongCat 团队正式发布当前高度贴近真实生活场景、面向复杂问题的大模型智能体评测基准——VitaBench(Versatile Interactive Tasks Benchmark)。 美团 LongCat 团队首次基于深度推理、工具使用与用户交互三大维度对智能体任务进行了量化拆解,以可控地构建复杂问题。 美团 LongCat 团队发现,即便是当前先进的推理模型,在主榜(复杂跨场景任务)中的成功率也仅有 30%,揭示了现有智能体与复杂真实生活场景应用需求之间的显著差距。 数据统计结果如下表所示:针对长轨迹评估的复杂性,美团 LongCat 团队还提出了基于 Rubric 的滑动窗口评估器。 04.实验结果与分析美团 LongCat 团队在 VitaBench 上评测了包括 GPT-5、Claude-4.1-Opus、Gemini-2.5-Pro、Kimi-K2、GLM-4.5、LongCat-Flash
作者: HOS(安全风信子) 日期: 2026-02-03 主要来源平台: ModelScope 摘要: 本文深入解析美团LongCat团队开源的LongCat-Flash-Lite无思考MoE大语言模型 LongCat-Flash-Lite的出现为解决这一问题提供了新的思路,通过MoE(混合专家)架构实现了参数量与计算效率的最佳平衡。 技术深度拆解与实现分析 3.1 核心架构设计 LongCat-Flash-Lite采用了模块化的MoE架构,主要包括以下组件 3.2 MoE架构实现 LongCat-Flash-Lite的MoE架构是其核心创新之一 参考链接: 主要来源:LongCat-Flash-Lite模型页 - LongCat-Flash-Lite模型详情 主要来源:美团LongCat团队官网 - 团队技术介绍 辅助:MoE模型研究综述 - = pipeline( Tasks.text_generation, model='meituan-longcat/LongCat-Flash-Lite' ) # 处理函数 def
居然,发布并直接开源了560B参数的MoE模型LongCat-Flash-Chat。 好家伙,WAIMAI里有两个AI,这次成真的了,美团真发大模型了。 开源地址:https://github.com/meituan-longcat/LongCat-Flash-Chat 也有线上体验地址:https://longcat.ai 我自己去体验了一下,整体模型能力 再来看LongCat,这刷新率不用多说了吧。 像机关枪一样哒哒哒的五六秒就输出完了。 这是LongCat和DeepSeek的另一个case,DeepSeek思考的功夫,LongCat答案快写完了。 很多人都在说LongCat快,确实,它的速度极快,但是,他们的Agent能力,也极强。 直接登顶了。 我自己一直在说,AI现在很多时候,离我们普通大众太远了。 LongCat的输出成本5元/百万 token。换句话说,它不希望用户花几百块的成本全网比价,而是只做几块钱的生意。
美团龙猫团队开源上新,这次是原生全模态模型 LongCat-Next。 要聊「全模态」,我想从 Tokeni 聊起。 LongCat-Next 的核心,就是解决这个问题。 LongCat-Next 直接采用了 OpenAI 开源的 Whisper 编码器来进行特征提取。 通过这样一套流程,LongCat-Next 成功地将连续的声波也转化为了离散的、既包含语义又保留了音色细节的。 实测视觉多模态能力 LongCat-Next 搭建了一个线上的 demo 环境,不过暂时不支持音频的输入/输出,所以我们先来测一下视觉能力。
出手即王炸 最近,美团发布了千亿大模型LongCat,总参数量560B,根据上下文需求激活 186 亿至 313 亿个参数(平均约 270 亿)。 LongCat非推理模型,在官网看到“深度思考”按钮显示敬请期待。 相信后面也会上推理。 官网体验:https://longcat.chat/ ModelScope: https://www.modelscope.cn/models/meituan-longcat/LongCat-Flash-Chat
://github.com/meituan-longcat/LARYBench Hugging Face: https://huggingface.co/datasets/meituan-longcat /LARYBench本文将结合美团 LongCat 团队的论文与最新数据,从项目背景、评测流程、实验结果三个维度进行解读。 2.2 数据构建针对多种粒度的动作,美团 Longcat 团队收集了主流常用的第一视角人类数据以多视角、跨本体的机器人数据,并通过自动化数据处理流程构建为动作表征数据集。 3.3 可视化分析为了进一步探讨以上实验结论所表现出的原因,美团 Longcat 团队进行了以下定性的可视化分析实验。 美团 Longcat 团队已将 LARYBench 评测数据集及配套代码开源,并会持续维护和更新。
4️⃣ 美团LongCat大模型App正式上线,支持语音通话与联网搜索时间:2025年11月3日涉及企业:美团事件概述:美团正式发布LongCat大模型官方App,安卓和iOS用户均可下载。 关联问题:LongCat App与其他AI助手相比有何特色?其特色在于支持语音通话且未来将添加视频通话,同时具备联网搜索能力,结合了美团的本地生活服务背景。文件上传功能目前有何限制? LongCat大模型对美团的战略意义是什么?这是美团在AI领域的重要布局,可能为其核心业务(如外卖、本地服务)提供技术支持,提升用户体验。美团在AI领域还有哪些其他布局? 美团还发布了LongCat-Flash-Omni模型,采用Shortcut-connected MoE技术,集成多模态感知模块和语音重建模块。LongCat如何实现“全模态实时交互”? LongCat-Flash-Omni模型基于高效架构设计,采用ScMoE技术,总参数达5600亿,提供低延迟实时音视频交互能力。
美团旗下LongCat(龙猫):token 额度天花板,每天送 5 亿 免费模型LongCat-Flash-Chat、LongCat-Flash-Thinking、LongCat-Flash-Lite( 系列每天 500 万 tokens,Flash-Lite 模型每天 5 亿 tokens,额度完全用不完,支持 OpenClaw 自定义模型配置,复制 API Key 就能用 体验地址:https://longcat.chat 、Kimi 等主流模型 服务器试用 1 个月,大模型额度长期有效 0 元领轻量应用服务器(2 核 2G/4 核 8G 等);混元模型 100 万 tokens 免费额度,有效期 1 年,每日限量领取 LongCat (龙猫) LongCat-Flash-Chat、LongCat-Flash-Thinking、LongCat-Flash-Lite(编程优化) 长期免费,无截止日期 每日刷新额度:Chat/Thinking
在此背景下,美团 LongCat 团队发布了 AMO-Bench,这是一套包含 50 道原创高难度数学问题的评测集。该基准旨在通过更高的难度和严格的数据隔离,重新评估当前模型的推理能力上限。 模型评测AMO-Bench 的评测榜单将保持更新,欢迎持续关注:项目主页:http://amo-bench.github.io/Github地址:https://github.com/meituan-longcat /AMO-BenchHugging Face地址:https://huggingface.co/datasets/meituan-longcat/AMO-Bench本文将结合美团 LongCat 团队的论文与最新数据
钱主要花在两块:自研大模型LongCat,还有挖AI人才。王兴说,除了那些做云计算的公司,美团在中国企业里对AI的投入算多的。三年时间,资产负债表和现金流都受到了影响。 但王兴的态度很明确:还得继续搞LongCat。为什么非要自研?王兴说,只有自研,美团才能用海量数据更精准地理解现实世界。当然,美团也和第三方模型合作。但自研,是根本。 三年砸钱,现在有了小团,有了LongCat大模型。能不能成功,还要看时间。但至少,王兴和美团,已经在路上了。
AICompass前沿速览:Cursor2.0、FireflyImage5、AgentHQ、LongCat-Video、Kimi-k2ThinkingAI-Compass致力于构建最全面、最实用、最前沿的 AI视频生成模型LongCat-Video是美团LongCat团队开源的136亿参数视频生成基础模型。 核心功能LongCat-Video的核心功能包括:文本到视频生成(Text-to-VideoGeneration):根据输入的文字描述生成相应的视频内容。 技术原理LongCat-Video采用136亿参数的Transformer架构作为其基础模型。 项目官网:https://meituan-longcat.github.io/LongCat-Video/Github仓库:https://github.com/meituan-longcat/LongCat-Video3
秒录音克隆,阿里达摩院技术合作)会员包含功能克隆+配音+AI写作+文案提取+爆文标题+脚本模板典型用途个人IP音色、短剧解说、小说推文三、开源方案(自部署)若对数据隐私有强要求且具备GPU资源,可关注美团LongCat-AudioDiT 中文相似度Seed-ZH测试集达0.818模型参数量:1B/3.5B,3.5B版需约14GB显存(RTX4080可跑)推理速度:生成10秒音频约2秒(A100)项目地址:github.com/Meituan/LongCat-AudioDiT 强调数据隐私→评估LongCat-AudioDiT自部署。以上数据均来自公开文档及个人实测。欢迎在评论区交流你的TTS选型经验。
四、技术底层创新:DeepSeek记忆模块、美团LongCat提速 在应用层热闹的同时,AI底层技术也在悄然突破,为行业发展筑牢根基。 美团LongCat LoZA:10倍提速+1M长文本处理 美团LongCat系列发布全新稀疏注意力机制LoZA,通过“筛选+替换”策略,将50%低性能MLA模块替换为流式稀疏注意力SSA,形成ZigZag 更值得关注的是,LongCat-Flash-Exp解锁了1M上下文窗口,能轻松处理百万字长文档,性能超越同类模型Qwen-3,为律师、研究员等需要处理长文本的人群提供了高效工具。
轻重音、停顿完全贴合文案要求,温柔中带坚定,没有一丝机械感,读长句时情绪也能保持连贯 2.LongCat-AudioDiT 个人给到最拉,啥也不是,超过30S的语音,语速自动加快,调节各种参数无解, Fish Speech S2 Pro:一句话操控情感 还是美团的高保真LongCat-AudioDiT 告别付费!阿里 Qwen3-TTS 开源封神!
4月24日,DeepSeek V4 和美团 LongCat-2.0 同日发布,总参数量均突破万亿。 美团 LongCat-2.0 更是全程用国产算力集群完成训练,动用 5-6万张算力卡,创下国产算力训练万亿参数模型的最大规模纪录。 美团5万卡国产算力:里程碑事件 如果说芯片适配是"软件就绪",那美团 LongCat-2.0 就是"实战验证"。 美团这次训练动用了 5-6万张国产算力卡,全程训练和推理都跑在国产算力集群上。 第二层:产业链正在闭环 芯片设计(华为昇腾、寒武纪、摩尔线程)→ 制造(中芯国际)→ 封测(华虹)→ 服务器(宁畅、长江计算)→ 云服务(华为云、腾讯云、天翼云)→ 大模型(DeepSeek、MiMo、LongCat
LongCat-Flash-Thinking-2601 Technical Report [LongCat-Flash-Thinking-2601 技术报告](https://arxiv.org/abs /2601.16725) 我们介绍了 LongCat-Flash-Thinking-2601,这是一个拥有 5600 亿参数的开源混合专家 (Mixture-of-Experts, MoE) 推理模型, 在广泛的智能体基准测试(包括智能体搜索、智能体工具使用和工具集成推理)中,LongCat-Flash-Thinking-2601 在开源模型中实现了最先进的性能。 基于这些见解,我们推出了 LongCat-Flash-Lite 模型,这是一个拥有 685 亿参数、激活参数约 30 亿、从头开始训练的模型。 尽管将超过 300 亿参数分配给了嵌入,LongCat-Flash-Lite 不仅超越了参数等效的 MoE 基线模型,而且在智能体和编码领域,与现有同等规模的模型相比,展现出了卓越的竞争力。