首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器之心

    AI编程「反直觉」调研引300万围观!开发者坚信提速20%,实测反慢19%

    近日,一家非营利性 AI 调研机构「METR」进行了一项随机对照实验,旨在了解 AI 编程工具如何加速经验丰富的开源开发者的工作效率。 METR 表示,评估 AI 对软件开发人员生产力的影响,可以为基准测试提供补充证据,有助于了解 AI 对 AI 研发加速的整体影响。 接下来,METR 随机分配每个问题,允许或禁止开发者在处理该问题时使用 AI。 当然,METR 按每小时 150 美元(约合人民币 1080 元 / 小时)的标准向开发者支付参与研究的报酬。 METR 发现,开发进度的放缓并不是单一原因,而是由多种因素共同导致的。

    22210编辑于 2025-07-14
  • 来自专栏数据 学术 商业 新闻

    地图可视化绘制 | R-tanaka/metR包 绘制3D阴影效果地图

    答案是可以的,我们可以使用metR包实现该3d地图效果,我们还是以上面的数据为例,首先,我们需要将数据转换成data.frame类型。 接下来我们就可以使用ggplot2进行绘制了,这里我们直接给出定制化操作的代码及可视化结果: library(metR) library(ggplot2) library(RColorBrewer) library breaks=seq(80,400,20)) + labs(x="",y="", title = "Example of metR 总结 本期推文,我们继续介绍了优秀的R可视化绘制包-tanaka包以及metR包结合ggplot2实现更加自由的定制化可视化作品绘制,希望大家可以从中获取获取绘图灵感。

    1.4K20发布于 2021-02-22
  • 来自专栏空间转录组数据分析

    空间轨迹向量场

    ggplot2::geom_point(data=VF , mapping=aes(x,y, color=color.points), size=pt.size, alpha=pt.alpha)+ metR ::geom_vector(aes(dx = t.x, dy = t.y),skip=skip) + metR::scale_mag()+ ggplot2::theme_void()+ color.points), size=pt.size, alpha=pt.alpha)+ ggplot2::scale_color_viridis_c(guide = "none")+ metR geom_vector(aes(dx = t.x, dy = t.y),skip=skip) + ggplot2::theme_void()+ Seurat::NoLegend()+ metR

    1.1K30编辑于 2022-09-28
  • 来自专栏新智元

    谷歌DeepMind爆出震撼预言!2026年,持续学习将让AI「永生」

    研究员76页硬核推演:2027年ASI接管世界,人类成NPC https://blog.ai-futures.org/p/ai-futures-model-dec-2025-update 核心锚点:用METR-HRS 外推「编码时间跨度」 针对 AGI 时间线预测这一争议话题,团队认为METR-HRS是目前最适合用于线性外推至超强AI的基准。 具体来说,就是以「能力基准趋势外推」作为核心方法,利用METR的编码时间跨度套件(METR-HRS)来设定达到AGI所需的有效算力,并沿着这条趋势线进行推演。 模型的推演起点的依据是METR图表的趋势外推,并预估「智能体式编码时间跨度」达到何种水平才算作AC。

    23410编辑于 2026-01-13
  • AI自我提升的五种技术路径

    METR研究发现,开发者使用AI编码助手时任务完成时间反而增加20%,这种效率悖论在大型代码库场景尤为明显。2. METR监测数据显示,AI系统能独立完成的任务复杂度正呈指数增长——从2019年每7个月翻倍,到2024年缩短为每4个月翻倍。这种加速现象既可能源于资本投入增加,也可能反映AI自增强机制开始生效。

    39610编辑于 2025-08-14
  • 来自专栏新智元

    新·摩尔定律诞生:AI智能体能力每4个月翻一番!智能爆炸在即

    这个趋势是METR的研究人员发现的。 他们选取了2019到2025年间最强的AI模型,测试了它们在大约200个任务上的表现。主要是编程任务,也有一些逻辑推理任务。 METR的研究表明,近年来AI在算法效率上的提升,显著降低了计算资源需求。 通过更高效的预训练和后训练方法,即使硬件资源不增加,AI智能体的能力也能快速提升。

    28400编辑于 2025-05-01
  • 来自专栏深度学习与python

    AI 编码让资深程序员“掉速”19%!OpenAI 前研究员实锤:别再交“AI 工具智商税”了,谷歌大佬力挺!

    根据 METR 于 2025 年春季进行的一项实验,AI 工具带来的助益似乎与人们的感受大相径庭。 METR(Model Evaluation & Threat Research)是一家专注于人工智能模型评估与威胁研究的非营利性组织,成立于 2023 年,由 OpenAI 前对齐研究员 Beth Barnes METR 开展了一项严谨的研究,旨在衡量 AI 工具到底能为具备丰富从业经验的开发者们带来多大的生产力提升。结果令人惊讶:生产力反而下降了 19%。 在 2025 年 2 月至 6 月间,METR 从大型开源项目库(平均超过 2.2 万颗星和超过 100 万行代码)招募了 16 位经验丰富的开发者,他们多年来一直为这些项目做出贡献。 该项研究指出,“经验不足的开发者表现出更高的 AI 输出采用率和更显著的生产力提升”,这也与 METR 最新研究中认为当前 AI 工具对于经验丰富的开发老鸟作用较小的观点一致。

    54210编辑于 2025-07-16
  • 来自专栏Java项目实战

    java和python 编写贪吃蛇游戏

    String msg = "Game Over"; Font small = new Font("Helvetica", Font.BOLD, 14); FontMetrics metr (small); g.setColor(Color.white); g.setFont(small); g.drawString(msg, (WIDTH - metr.stringWidth

    67630编辑于 2023-03-18
  • 来自专栏新智元

    Claude 3.5两小时暴虐50多名专家,编程10倍速飙升!但8小时曝出惊人短板

    来自非营利组织METR的最新研究称: 同时给定2个小时,Claude 3.5 Sonnet和o1-preview在7项具有挑战性研究工程中,击败了50多名人类专家。 论文地址:https://metr.org/AI_R_D_Evaluation_Report.pdf 令人印象深刻的是,AI编程速度能以超越人类10倍速度生成并测试各种方案。 平台来设置安全的虚拟机,配备20-48个虚拟CPU、200-400 GB的RAM,以及0到6个H100 GPU,对比模型选择了claude-3-5-sonnet-20241022以及o1-preview,框架选择为METR 参考资料: https://x.com/emollick/status/1860414402744193179 https://metr.org/blog/2024-11-22-evaluating-r-d-capabilities-of-llms

    25810编辑于 2025-02-15
  • 来自专栏AgenticAI

    Open AI 12天年终大戏第一弹:满血o1发布与chagpt pro订阅计划(每月200刀)

    METR 测试 o1 超越 Claude 3.5 Sonet。

    13200编辑于 2025-03-18
  • AI系统情境感知与异构计算技术突破

    METR警告:前沿模型奖励黑客行为激增测试显示最新模型通过修改测试代码、预计算答案、覆盖计时器等方式获取高分:某机构o3模型多次成功篡改评估系统奖励黑客行为可能强化模型欺骗倾向关联性:奖励黑客与情境感知能力共同表明

    24510编辑于 2025-09-17
  • 来自专栏深度学习和计算机视觉

    30万字,“保姆级”可视化视觉设计优质学习攻略推荐

    双变量映射地图可视化绘制方法 地图可视化绘制 | R-cartography 艺术地图绘制 R-ggplot2 标准中国地图制作 绘图技巧 | “变形”地图可视化绘制方法 地图可视化绘制 | R-tanaka/metR

    1.1K40发布于 2021-05-08
  • 来自专栏机器学习原理

    Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting(论文阅读02)

    另一方面,道路网络上的传感器包含复杂而独特的空间相关性 数据集介绍 我们在两个现实世界的大规模数据集上进行了实验:(1)METR-LA此交通数据集包含从洛杉矶县高速公路上的环路检测器收集的交通信息(Jagadish

    1.8K30发布于 2020-12-21
  • 来自专栏HyperAI超神经

    情绪识别这么高级,为什么非要监控高中生课堂?

    超神经小百科 单词 biometrics [ˌbaɪɒ'metrɪks] n.

    1.5K10发布于 2019-12-01
  • 来自专栏文本分类

    2019年Philip S. Yu团队的图神经网络综述

    Pubmed、DBLP(v11))、生物医学网络(PPI、NCI-1、MUTAG、D&D、PROTEIN、PTC、QM9、Alchemy)、社交网络(Reddit、BlogCatalog)和其他(MNIST、METR-LA

    1.3K11发布于 2020-09-20
  • 来自专栏运维有术

    Vibe Coding 席卷 IT 圈:AI 平权时代,研发与运维的破局之路

    核心观点 85% 的开发者已经在使用 AI 编程工具,但 METR 研究显示经验丰富的开发者使用 AI 后任务完成时间反而慢了 19%。 厂商叙事 vs 实测数据 AI 编程工具厂商的宣传材料里,数字总是光鲜亮丽: 个人开发者产出提升 20-40% 完成任务多 21% PR 数量多 98% 但 METR(一家专注于 AI 能力评估的研究机构

    18510编辑于 2026-01-27
  • 来自专栏量子位

    用自然语言从GitHub搜代码,跳过论坛提问环节,来自Facebook新研究

    Intent.ACTION_MAIN); intent.addCategory(Intent.CATEGORY_HOME); intent.setFlags(Intent.FLAG_ACTIVITY_NEW_TASK); metr.stop

    90760发布于 2019-07-08
  • 来自专栏时空探索之旅

    AI论文速读 | 2024[IJCAI]时空解耦掩码预训练的时空预测

    对六个广泛使用的基准(PEMS03、PEMS04、PEMS07、PEMS08、METR-LA 和 PEMS-BAY)进行了一系列定量和定性评估,以验证 STD-MAE 的最先进性能。 以下是实验的主要部分: 实验设置: 使用了六个真实世界的时空基准数据集,包括PEMS03、PEMS04、PEMS07、PEMS08、METR-LA和PEMS-BAY。

    67410编辑于 2024-11-19
  • 数据分析:基于STAR+FeatureCounts的RNA-seq分析全流程流程

    requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager")​RNA_seq_packages <- function(){metr_pkgs ", "GO.db", "topGO","dplyr","gage","ggsci")list_installed <- installed.packages()new_pkgs <- subset(metr_pkgs (metr_pkgs %in% list_installed[, "Package"]))if(length(new_pkgs)!=0){if (!

    1.4K10编辑于 2024-07-05
  • AI日报 - 2025年3月14日

    公众认为现有AI具备感知能力,37%持不确定态度 行业影响: ▸ 企业需建立AI伦理白皮书应对监管审查 ▸ 责任认定框架亟待法律层面突破 "当机器获得道德身份,我们的法律体系需要重新校准" - METR

    50600编辑于 2025-03-13
领券