首页
学习
活动
专区
圈层
工具
发布

#模型

异步 IO 改造聚合服务:Go/Python 异步架构性能实测对比

用户12512581

大模型聚合服务核心是多模型接口调度、流式响应处理、高并发请求承载,属于典型 IO 密集型场景。传统同步架构下,单请求阻塞线程、并发依赖线程池扩容,导致资源利用率...

500

腾讯云《企业级智能体效能管理指南》核心摘要

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

•报告标题:企业级智能体效能管理指南 •发布机构:腾讯云 •发布时间:未明确 •行业标签:通用SaaS,技术服务 •产品标签:#WorkBuddy企业版 #Co...

200

腾讯云 AI Agent 治理平台:重构企业智能体基础设施与成本管控体系

IT资讯研究所

腾讯科技 | 研究员 (已认证)

随着AI Agent进入规模化部署阶段,企业面临治理失效、成本失控、安全盲区等挑战。腾讯云AI Agent治理平台通过组织权限映射、分层记忆架构、模型智能路由、...

800

面向WAM时代的无本体人类操作数据采集与训练闭环

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

机器人学习范式迁移加剧高质量数据瓶颈 当前,机器人学习正从以视觉语言动作模型(VLA)为代表的“观察→动作”反应式策略,转向世界动作模型(WAM)。WAM的核心...

500

腾讯云DBClaw:基于自研MoE模型与四级分权架构的数据库智能运维体系

IT资讯研究所

腾讯科技 | 研究员 (已认证)

腾讯云DBClaw针对企业数据库运维经验复用率低、AI落地安全顾虑等痛点,推出基于自研O3 MoE模型的智能运维体系,通过四级操作分权体系、VPC专属部署架构实...

1600

腾讯云Agent Runtime沙箱:解决单机单用户模型下的规模化运维与成本瓶颈

IT资讯研究所

腾讯科技 | 研究员 (已认证)

腾讯云Agent Runtime沙箱针对Agent“1对1”异构有状态架构带来的弹性瓶颈、运维失效、安全隐患等规模化落地痛点,通过自研无状态调度器、资源池化、快...

400

构建Agent与数据库自循环飞轮:从智能运行到企业级智能资产沉淀

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

针对通用大模型在数据库运维中的能力瓶颈与安全顾虑,腾讯云推出了以DBClaw为核心的Agent数据变革体系。该体系通过建立四级安全护栏与Skill封装,实现了对...

000

构筑Agent时代的私有化智算底座:破解算网瓶颈与重塑运维效率

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

针对政企在智算转型中面临的算力瓶颈、研发割裂与数据合规挑战,腾讯专有云(TCE)构建了算存网一体及全链路管控的私有化智算底座。该方案通过云原生AI Infra、...

600

打破大模型生产级 Agent 五大黑盒:腾讯云 CLS 全域可观测与治理体系构建

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

本文介绍了腾讯云CLS针对生产级大模型Agent面临的运行、链路、成本、安全和质量五大“黑盒”痛点,推出的全域可观测与治理体系。该体系通过全场景接入、统一数据建...

1100

CodeGraph vs Understand-Anything:一个给 Agent 查代码地图,一个把项目变成可追问图谱

顾念

过去我们让编程 Agent 改代码,最常见的问题不是模型不会写,而是它不知道该看哪里。

7110

Understand-Anything:不用硬啃源码,把项目变成一张能追问的知识图谱

顾念

热榜给到的数据是:本周新增约 +7.5k Star,总星 15k+。我查 GitHub 页面时,它已经涨到约 36k Star。这个变化说明它不是短暂刷屏,而是...

1600

5 年 10K stars:xformers 如何用「Bias 协议」重定义 Transformer 加速

用户7411420

Meta 开源的 Transformer 加速库 xformers,用一套「AttentionBias 协议 + 多后端调度器」让同一份 kernel 跑 23...

1400

18 个月、35k 行单兵干出 8.5K stars 的本地 AI 笔记:Reor 把 RAG 装进 Markdown 后归档了

用户7411420

Reor 是把「人类写作」和「LLM 检索」做成对等两个生成器、共享同一向量库的本地优先 AI 笔记桌面应用——曾经是 GitHub 上极少数把「AI 原生 +...

1700

4 个月 31K stars:OpenHuman 用可读记忆杀入桌面代理

用户7411420

OpenHuman 是一个本地优先的个人 AI 桌面代理:把 118+ SaaS 工具通过一键 OAuth 拉通,把记忆写成你随时能打开看的 Markdown ...

1210

78K Star 的 Chief Agent Operator:lobehub 重做 AI 员工团队

用户7411420

LobeHub 把 LLM 会话从「人在前、模型在后」重做成「7×24 后台运行的 AI 员工团队」——通过 60+ 内置 tools、332K SKILLs ...

4300

文本、图像、视频、语音统一推理——vLLM-Omni 用 Stage 抽象重新定义全模态引擎

用户7411420

vLLM 官方的全模态推理引擎——在 75K Star 母项目的地基上,通过 Stage 抽象和完全解耦执行,将 LLM 自回归推理、Diffusion 图像/...

2510

日历工具厂商如何成为 MCP 生态龙头:PAL MCP Server 的多模型协作设计

用户7411420

macOS 生产力工具老牌厂商 Beehive Innovations(BusyCal/2Do)的创始人打造的多模型协作 MCP 服务器——通过 Provide...

1210

一个人写了 12 万行代码,造出开源版 Perplexity

用户7411420

孟买独立开发者独力打造的「小而全」开源 AI 搜索引擎(11.5K stars),以 60+ LLM 模型支持、25+ 外部 API 集成、75 步自主研究代理...

1110

一人撑起 42K Star 项目:aider 如何用「编辑格式」重新定义 AI 编程

用户7411420

开源 CLI AI 编程助手的统治级项目——「AI pair programming in your terminal」,通过多种「编辑格式」(whole/di...

1500

28.5 倍压缩 + 1/10 成本:DeepSeek-V3 如何用数学打败暴力堆卡

用户7411420

671B MoE 模型的 1,400 行推理参考实现——通过 MLA(Multi-head Latent Attention)实现 28.5 倍 KV Cach...

900
领券