现在的 AI CTF 出题似乎陷入了一个怪圈:出题人懂 AI 但不懂安全,或者懂 Web 安全但不懂 AI。这就导致了题目往往处于一种割裂状态。团队的师傅说这种...
本文提出了S2SSERVICEBENCH,首个专门评估多模态大语言模型(MLLMs)在"最后一公里"次季节到季节(S2S)气候服务中表现的基准测试。该基准从实际...
如果你是 AI 新手,想用一个免费、强大、本地优先的工具把各种大模型、知识库、绘画、Agent 全部集成起来,这份教程就是为你准备的。Cherry Studio...
全球首个“实物整车-动态交通-气候模拟”三位一体智能驾驶实验室内景。重庆高新区融媒体中心供图
当工程师和规划者设计道路、桥梁和大坝时,他们依赖的水文模型本应能保护基础设施和社区免受50年一遇和百年一遇洪水的冲击。但康奈尔大学的一项新研究发现,随着气候变化...
国家气象信息中心系统发展室副主任、正高级工程师薛蕾,不仅是国家突发事件预警信息发布能力提升工程(一期)项目副总设计师,气象信息化系统工程一级系统总指挥,还担任W...
AI气象竞赛(AI Weather Quest)的参赛者们正运用人工智能技术进行次季节天气预报——这一预报时间尺度恰好填补了长期与短期预报之间的空白,对于帮助各...
大语言模型(LLMs)的快速发展,尤其是在推理能力上的突破,为应对大气科学中的复杂挑战、推动科学发现带来了变革性潜力。然而,要在这一领域有效发挥LLM的作用,需...
作者: Shruti Nath & Tim Palmer 来源: Nature 第651卷,2026年3月19日,第583-584页
Deng, E., Xiang, Q., Ouyang, DH. et al. Tropical cyclone rainfall extends inland...
本文报道了一项里程碑式工作:将 Google DeepMind 的全原子结构预测模型 AlphaFold3(AF3) 首次系统性地应用于共价配体的虚拟筛选(co...
从结果来看,AnewSampling 在内部自建测试集、公开的 JACS and Merck 基准测试集,以及大规模蛋白动态数据集 ATLAS上,均展现出强劲表...
研究人员介绍了 OpenFold3-preview2(OF3p2),这是 OpenFold3 通用生物分子结构预测系统的第二个预发布版本。与上一版本 OF3p ...
蛋白质工程受限于在高维序列空间中低效搜索协同突变组合。传统方法采用逐步叠加突变的方式,而机器学习方法则需要大量数据集或多轮实验,并受到成本高昂、长度受限的基因合...
宏基因组测序在微生物组研究中应用广泛,但样本间交叉污染这个技术问题一直被严重低估。这种污染通常发生在96孔板中相邻样本之间,会导致物种丰度失真、假阳性发现,甚至...
测试用例就是规范。 没有测试,AI不知道正确的行为是什么样子。SQLite正是深谙此道,代码是公开的,但测试是闭源的。你可以用AI复刻SQLite的功能,但你很...
三个月前,你写了一个帮助 Claude 写 Landing Page 的技能。当时模型还不擅长这个,你的详细步骤确实让它表现得更好。
近日,一项名为 SkillsBench 的研究填补了这一空白。作为首个将 Skills 作为一级评估对象的基准测试,它通过 7,308 条轨迹的大规模实证评估,...
对于IT运维人员来说,有时网络问题真的难以解决,传统的 ping 命令只能测试联通性,它无法提供详细的报告。
它通过模拟 TCP 三次握手过程(SYN → SYN-ACK → ACK),直接测试目标端口的开放状态,并提供连接延迟信息,帮助用户快速定位网络或服务故障。