首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏NewBeeNLP

    我是如何赢得吴恩达首届 Data-centric AI 竞赛的?

    作者 | Johnson Kuan 编辑 | AI科技评论 吴恩达(英文名 Andrew Ng,是人工智能和机器学习领域国际上最权威的学者之一)在今年 6 月的时候宣布首届以数据为中心的人工智能(Data-centric 那么,获奖者对赢得吴恩达首届 Data-centric AI 竞赛的心情是怎样的呢?以下是此次竞赛最佳创新奖得主之一 Johnson Kuan 发布的博文,记录了他参赛时的过程以及获奖后的感受。 博文具体内容如下: 在过去的几个月里,我有幸参加了吴恩达首届 Data-centric AI 竞赛。

    92810发布于 2021-11-19
  • 来自专栏AI科技评论

    GPT 模型成功的背后用到了哪些以数据为中心的人工智能(Data-centric AI)技术?

    综述论文:Data-centric Artificial Intelligence: A Survey 短篇介绍:Data-centric AI: Perspectives and Challenges GPT系列模型大小比较 2 什么是Data-centric AI? Data-centric AI是一种搭建AI系统的新理念,被@吴恩达老师大力倡导。 与model-centric不同,Data-centric更侧重于提高数据的质量和数量。也就是说Data-centric AI关注的是数据本身,而模型相对固定。 以下,我们用Data-centric AI框架从三个维度进行分析。 因此,Data-centric AI的研究和开发将持续推动未来AI系统的进步。 大语言模型将为Data-centric AI提供更好的解决方案。

    1.2K10编辑于 2023-04-04
  • 来自专栏鸿的学习笔记

    吴恩达谈 MLOps:调优数据比调优模型更重要

    3月25日,吴恩达开了一个直播讲 A Chat with Andrew on MLOps: From Model-centric to Data-centric AI ,看完后深受启发,便随手写下一些笔记 在之前的 AI 系统设计当中,大家似乎更重视对模型的调优这一块,而忽视了对数据的调优,吴恩达认为前者是 Model-centric(以模型为中心),后者是 Data-centric(以数据为中心)。 solutions/machine-learning/mlops-continuous-delivery-and-automation-pipelines-in-machine-learning 概念 简单聊聊 Data-centric Model-centric: 以调整模型代码、调优模型超参数为主的系统调优策略,在这种策略下,可以认为数据集是固定的 Data-centric: 与Model-centric相对,以调整数据集为主的系统调优策略 ,在这种策略下,可以认为模型是固定的(只对数据集作适应性调整) 缘由 Data-centric 策略和 Model-centric 策略之争在某种程度上是科学家和工程师之争,正如在16年发表的Data-centric

    1.3K40发布于 2021-04-23
  • 来自专栏气象杂货铺

    关注数据而不是模型:我是如何赢得吴恩达首届 Data-centric AI 竞赛的

    如何凭借“数据增强”技术获得吴恩达首届 Data-centric AI 竞赛的最佳创新奖? 作者 | 杏花 编辑 | 青暮 吴恩达(英文名 Andrew Ng,是人工智能和机器学习领域国际上最权威的学者之一)在今年 6 月的时候宣布首届以数据为中心的人工智能(Data-centric AI)竞赛即将开赛 那么,获奖者对赢得吴恩达首届 Data-centric AI 竞赛的心情是怎样的呢?以下是此次竞赛最佳创新奖得主之一 Johnson Kuan 发布的博文,记录了他参赛时的过程以及获奖后的感受。 博文具体内容如下: 在过去的几个月里,我有幸参加了吴恩达首届 Data-centric AI 竞赛。

    1.1K40编辑于 2022-09-23
  • 来自专栏新智元

    CLUE社区发布国内首个Data-centric竞赛,白给数据分析服务

    正是看到了这种巨大的差别,在吴恩达等人的推动下这种以数据为中心 (Data-centric)的AI进一步的系统化,并成为一个有具有巨大实用价值方法论。 以数据为中心(Data-centric)的AI,是一种新型的AI探索方向。它的核心问题是如何通过系统化的改造你的数据(无论是输入或者标签)来提高最终效果。 它基于CLUE benchmark,结合Data-centric的AI的典型特征,进一步将Data-centric的AI应用于 NLP领域,融入文本领域的特定并创造性丰富和发展了Data-centric 前80名并超过Data-centric的baseline进入到复赛。

    70020发布于 2021-10-13
  • 来自专栏机器学习初学者精选文章

    【NLP】DataCLUE: 国内首个以数据为中心的AI测评

    DataCLUE 以数据为中心的AI测评(含模型和数据分析报告) DataCLUE: A Chinese Data-centric Language Evaluation Benchmark Github 正是看到了这种巨大的差别,在吴恩达等人的推动下这种 以数据为中心 (Data-centric)的AI进一步的系统化,并成为一个有具有巨大实用价值方法论。 DataCLUE是一个以数据为中心的AI测评。 它基于CLUE benchmark,结合Data-centric的AI的典型特征,进一步将Data-centric的AI应用于 NLP领域,融入文本领域的特定并创造性丰富和发展了Data-centric 任务描述和统计 实验结果 IFLYTEK(acc) Human 80.30 Baseline 56.42 Model-centric 59.31 Data-centric Report on 2021 前80名并超过Data-centric的baseline进入到复赛。

    72820发布于 2021-09-17
  • 来自专栏量子位

    吴恩达新动作:建立全新机器学习资源Hub,「以数据为中心的AI」大本营

    行早 发自 凹非寺 量子位 | 公众号 QbitAI 今天早上,吴恩达教授发推给大家推荐了一个新的资源站:Data-centric AI(DCAI)。 很高兴给大家介绍我们建立的一个新资源站Data-centric AI,这里有许多专家的文章和NeurIPS DCAI研讨会的交流谈话,来看看吧~ 这个DCAI是什么来头?

    47320编辑于 2022-03-04
  • 来自专栏SimpleAI

    数据地图---使用Training Dynamics来映射和诊断数据集

    这其实是Data-centric方向中的data selection要考虑的主要问题之一。 样本贡献也很大,但是里面可能包含很多noise,如果数据错标的话,基本都出现在hard区域 以上就差不多是论文的内容了,其实很简单,但是这样的一个数据地图,其实可以帮助我们进一步观察数据集的特点,帮助我们从data-centric

    75440编辑于 2022-11-30
  • 来自专栏有文化的技术人

    Mongo数据一致性浅析

    以复制为基础构建的分布式系统中,一致性模型通常可按照以数据为中心(Data-centric)和以客户端为中心(Client-centric)来划分, mongo一致性 MongoDB 的 Causal 但是,这里是 MongoDB 和标准不太一样的地方,MongoDB 的因果一致性提供的是 Client-centric 一致性模型下的承诺,而非 Data-centric。 这么做主要还是从系统开销角度考虑,实现 Data-centric 下的因果一致性所需要的全局一致性视图代价过高,在真实的场景中,Client-centric 一致性模型往往足够了,关于这一点的详细论述可参考

    74920编辑于 2023-08-19
  • 来自专栏机器学习与推荐算法

    NeurlPS2022推荐系统论文集锦

    Systems: Learning Guarantee and Item Mixture Powered Strategy Infinite Recommendation Networks: A Data-Centric

    78420编辑于 2022-10-31
  • 来自专栏Python进阶之路

    调研图基础模型(Graph Foundation Models)

    Data-Centric 图学习的思考:基础模型的崛起凸显了以数据为核心的人工智能(Data-Centric AI)的潜力和优势。 但由于不同图结构间的“结构关联” 不能像 NLP 中那样转化为统一的 token 表示,或像 CV 中转化为像素表示,因此如何确立和推进 Data-Centric 图学习的概念仍是个开放性问题。

    1.1K00编辑于 2024-05-25
  • 来自专栏资讯类翻译专栏

    云安全实践落入攻击者之手

    to "break the cycle set twenty years ago and place a new cornerstone for cyber defense: cloud-based, data-centric Using data-centric defense, integration, and automation of tools and overall architecture requires revising

    42020发布于 2021-01-15
  • 来自专栏算法进阶

    机器学习数据工程的概述

    近些年AI大佬吴恩达老师一直在倡导“以数据为中心的AI”(Data-centric Artificial Intelligence,DCAI),以此希望AI研究者重视数据样本的重要性,将目光从以模型为中心转向以数据为中心 0 前言 吴恩达:过去十年,人工智能最大的转变是深度学习,而接下来的十年,我认为会转向以数据为中心Data-centric Artificial Intelligence(DCAI)。 Data-centric Artificial Intelligence(DCAI)可以概括为数据工程,主要探索如何高效地构建高质量、大规模的数据集。 而数据工程(或称为Data-centric)的工作经常是脏活累活,对模型的重要性经常被忽视,相关的技术发展也比较少。 Data-centric AI:以数据为中心的人工智能是指一个为人工智能系统开发、迭代和维护数据的框架。以数据为中心的人工智能涉及构建有效训练数据、设计适当的推断数据和维护数据的任务和方法。

    8.8K22编辑于 2023-11-17
  • 来自专栏机器之心

    吴恩达近3万人学习的MLOps讲座,官方上线机器之心知识站

    吴恩达老师的这场讲座就围绕这一热门话题展开,演讲主题为《MLOps: From Model-centric to Data-centric AI》。

    32710编辑于 2023-03-29
  • 来自专栏AI算法与图像处理

    论文/代码速递2022.12.8!

    2212.03586 代码/Code: None CVPR2022 NeurIPS Updated on : 8 Dec 2022 total number : 2 MEDIAR: Harmony of Data-Centric

    64520编辑于 2022-12-11
  • 来自专栏气象杂货铺

    研讨会|机器学习和人工智能在天气和气候模式方面的新机遇(视频和PPT)

    3: High performance, Infrastructure and Big data challenges Scaling Up Deep Learning Workloads - A Data-Centric

    48930编辑于 2022-09-23
  • 来自专栏新智元

    训大模型讲究「化劲」!陶大程带队:一文打尽「高效训练」方案,别再说硬件是唯一瓶颈

    论文链接:https://arxiv.org/pdf/2304.03589.pdf 研究人员考虑了最基本的权重更新公式,并将其基本组成部分划分为五个主要方面:  1、以数据为中心(data-centric 研究人员将所有这些对数据的高效处理称为「以数据为中心」(data-centric)的方法,可以显著提高训练大规模模型的性能。 以数据为中心的课程学习 Data-centric Curriculum Learning 课程学习在训练过程的不同阶段研究渐进的训练设置,以减少整体的计算成本。

    57030编辑于 2023-05-15
  • 来自专栏新智元

    港大等发布GraphGPT:1/50微调参数,准确率提升10倍!无需超长token,LLM也能读懂图结构

    关于Data-Centric 图学习的思考:基础模型的发展展现了数据为中心的人工智能(Data-Centric AI)的有效性和优越性。 然而,由于不同的图结构之间的「结构关系」无法像NLP中转换为统一的token表示或者CV中的像素表示,如何定义和开发Data-Centric 图学习一直尚无定论。 因此,我们相信所提出的图指令微调框架可以很好的作为Data-Centric 图学习的一个研究基础。 参考资料: https://graphgpt.github.io/

    1.1K20编辑于 2023-10-29
  • 来自专栏秋枫学习笔记

    NIPS 2022 推荐系统,因果效应论文集锦

    Importance Resampling for Training Recommender Retriever【批内重要性重采样】 Infinite Recommendation Networks: A Data-Centric

    74540编辑于 2023-01-30
  • 来自专栏ThoughtWorks

    2022 技术雷达峰会 - 首批讲师及话题震撼发布!

    李栋 Thoughtworks 数据智能解决方案架构师 《Data-centric AI: 构建AI系统的基石》企业落地AI有诸多挑战,大多数情况下注意力都集中在算法和模型上,而作为模型训练最为关键的数据往往被忽视 Data-centric AI会从系统化工程的视角,解读如何夯实机器学习应用的基石。

    1.1K10编辑于 2022-05-10
领券