首页
学习
活动
专区
圈层
工具
发布

#测试

OpenClaw 如何用纯 TypeScript 造了一套 Agent 调度系统

唐国梁Tommy

一个 AI Agent 能自动回答问题、写代码、分析数据,这已经不稀奇了。但如果你想让它每天早上 9 点自动生成工作摘要、每半小时检查一次邮件、出了故障自动告警...

000

深入解读多智能体(Multi-Agent)系统失败的根源

唐国梁Tommy

今天,我们要一起深入探讨一个在AI圈子里越来越火的话题——多智能体系统(Multi-Agent Systems,简称MAS)。

200

Kinetics 伸缩法则:重估LLM测试时推理中的计算与内存访问成本

唐国梁Tommy

最近大语言模型(LLM)的浪潮一波接一波,模型参数越来越大,能力也越来越强。但随之而来的,是推理成本的急剧攀升。我们常常追求大力出奇迹,希望用更大的模型、更多的...

400

放弃ClaudeCode ,平移CodeBuddy

码农戏码

200

AI 测试必学:我开发了一个Agent Skill 一键生成全套接口自动化脚本,全程零编码!

测试开发技术

在接口自动化测试的全流程中,脚本开发曾是最耗时、最考验技术功底的环节。人工编写脚本不仅要至少掌握一门编程语言,而且还要面对版本迭代快、用例量大的压力,还极易出现...

500

别被"AI 赋能"忽悠了!测试中那些 AI 搞不定的场景大盘点

AI智享空间

AI 在回归测试、接口批量验证、Flaky Test 根因排查这些场景里,效率提升是真实可量化的。前几篇文章里讲过,通过 Skill 体系把领域知识结构化注入 ...

700

AI 用例瘦身:5000 条→3200 条

AI智享空间

没有人敢删用例。每个人都怕删掉的那一条,恰好是某次事故复盘后加进去的"保命用例"。结果就是只增不减——新功能上线加用例,没有人会同步审查旧用例是否还有存在的必要...

200

拒绝内卷!测试人如何利用AI工具实现"准点下班"?

AI智享空间

某测试团队上个月集体上线了AI辅助生成用例、自动修复定位器的自动化脚本,本以为终于能早点下班。结果两周后,产品经理在群里甩出一句话:"现在AI都能这么快出用例了...

000

如果有一天AI完全取代手工测试,软件还会有BUG吗?

AI智享空间

有开发者公开分享过这样一段经历:AI在自动补全代码时,把全局状态管理写成了一个闭包陷阱——在某种并发场景下,前一个请求的上下文会泄露到下一个请求里。代码写得行云...

200

"一人公司"与"无人测试":2026年测试行业的冰与火之歌

AI智享空间

深圳一间合租办公室里,一个人对着电脑,左边窗口是写需求的AI Agent,右边窗口是写代码的AI Agent,再切一个窗口让AI跑测试、出报告——三个月,产品从...

200

JMeter可能是下一个被AI重构的工具

AI智享空间

老套路:先跑一次请求,用正则表达式提取 Token,再设置变量传递,处理那个该死的动态签名。正当我被乱码的响应数据搞得头大时,旁边刚来的实习生,打开了一个 AI...

500

测试工程师如何通过"Skill 思维"实现职场跃迁?

AI智享空间

大多数测试工程师的成长路径是:初级工程师 → 高级工程师 → 技术 Lead → 然后在某个地方停下来。停下来的原因几乎千篇一律:

400

为了早下班,我写了个"自动化验收 Skill",结果老板给我涨薪了

AI智享空间

是因为每次迭代上线前,我要花两到三个小时做验收回归——打开浏览器,登录测试环境,按照验收清单逐条点,截图留证,填表,发邮件给 PM 确认。重复,枯燥,而且是在每...

100

Skills 如何实现精准回归测试选择

AI智享空间

这句话在无数团队的每个发布周期里都在上演。全量回归曾经是保障质量的黄金标准,但随着系统规模膨胀、迭代节奏加快,它正在变成一个越来越沉重的负担。

700

SkillHub 上 8 万+ Skills 怎么选?首页四分类推荐使用指南

克劳德2048

摘要 SkillHub 收录了 8 万+ Skills,新用户往往不知道如何选择。本文介绍 SkillHub 首页的四个推荐分类(为你推荐、近期飙升、下载热榜、...

500

为什么Kriging 与高斯过程回归出自同一数学框架,但实际效果却差很远

deephub

做过地质统计学、储层建模或空间机器学习的人,大概都面对过这个选择:Kriging(经典地质统计学的主力工具),还是高斯过程回归(Gaussian Process...

700

2026年5款AI编程终端工具硬核实测:Claude Code碾压全场!

程序视点

我在日常任务里,Codex CLI 和 Gemini CLI 的表现差距,远没有 87.6% vs 80.6% 那么夸张。基准测试是基准测试,你的真实项目,才是...

700

2.198EFlops!时隔8年,中国超算重回全球第一!

芯智讯

同时,它在高性能共轭梯度(HPCG)基准测试排名中以22.00 HPCG-Petaflop/s的成绩位列第一。在HPL-MxP混合精度基准测试中,它取得每秒7....

1400

RAG 从 Demo 到生产,绕不开 Rerank

王中阳AI编程

“那为什么不直接用 Embedding 检索排好?Rerank 和向量检索有什么本质区别?Rerank 会带来什么成本?TopK 和 TopN 怎么设?”

800

Loop Engineer Template 详解

勇哥AI笔记

最近流行 Loop Engineering:Loop Engineering 如何使用AI编程智能体:构建可循环系统,但是这篇只讲了思想,主要构建模块和记忆模块...

600
领券