首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏DeepHub IMBA

    2021 年 10 月推荐阅读的10篇精选ML论文

    每个月都会有几千篇的论文在arXiv发布,我们不可能看完所有的文章,但是我们可以从中找到一些趋势: 大型语言模型不再与较小的模型在同一类别中竞争(如训练前+监督数据微调)。为什么? 幸运的是,学者们经常关注这一点,传统上大多数揭示事实的论文都来自大学,就像我们很快就会看到的那篇。 这篇论文的缺点也是它的优点:为进一步优化他们的实验而付出的有限的范围和努力。 但是还有一个重要的警告没有在论文中彻底解决:注意力矩阵中的偏差通过一个 softmax 来抑制远标记的贡献,这就像有一个注意力的“软窗口”。 这本纸质书包含了很多内容:概述、介绍和论文,内容涉及在大量数据的监督下训练的大型神经模型的新兴领域,为此,它们被称为基础模型。

    57120发布于 2021-10-09
  • 来自专栏DeepHub IMBA

    2022 年 4 月 10ML 研究论文推荐

    NVidia 的新 H100 GPU已经发布了,我们也很久没有发论文推荐了,这是4月份的论文推荐:Google 的 5400 亿参数 PaLM、Pathways、Kubric、Tensor Programs 3、Pathways: Asynchronous Distributed Dataflow for ML and PaLM: Scaling Language Modeling with Pathways 架构在 ML 中的作用是否会进一步缩小?论文的回答是:是的。 例如,作者展示了一个比GPT-3小10倍的模型如何在足够大的语料库上训练时实现性能均等。 由此产生的模型系列被命名为 Chinchilla。 10、Make-A-Scene: Scene-Based Text-to-Image Generation with Human Priors By Oran Gafni et al.

    63020编辑于 2022-04-14
  • 来自专栏我还不懂对话

    论文阅读】- 怎么快速阅读ML论文

    主题框架翻译于Eric Jang的博客https://blog.evjang.com/2021/01/understanding-ml.html,加了一些个人观点。 机器学习的论文很多,怎么从Arxiv上泛滥的文章中选择论文阅读,那么我们就需要快速地了解论文内容概要,从而决定是否精读。 ML模型是去拟合偏差和数据。有时候数据中偏差很大,有时候很小,为了确保模型泛化很好(拟合数据而非偏差)需要更多的偏差和数据,最好是无偏数据。 论文里面的说法是否可靠?个人理解,是说论文里面指标是否靠谱,方法是否实用等。凭我自己的经验,一般可以从以下几点来看:论文方法是否过于trick,是否非常复杂(奥卡姆剃刀原理)。 Referencehttps://blog.evjang.com/2021/01/understanding-ml.html图片

    73120编辑于 2022-10-08
  • 来自专栏YoungGy

    ML基石_10_LogisticRegression

    本文介绍了逻辑回归(Logistic Regression)的基本概念、问题定义、模型假设、目标函数、梯度计算、迭代算法、优化简化、梯度下降、Descent的方向、迭代速度的选择以及总结。

    69950发布于 2018-01-02
  • 来自专栏量化投资与机器学习

    【代码+论文】通过ML、Time Series模型学习股价行为

    今天编辑部给大家带来的是来自Jeremy Jordan的论文,主要分析论文的建模步骤和方法,具体内容大家可以自行查看。 COF 2017-10-04 09:52:45,696 - DEBUG - Reading company prices for DISCK 2017-10-04 09:52:45,699 - DEBUG -10-04 09:52:52,150 - DEBUG - Reading company transcripts for AAPL 2017-10-04 09:52:52,213 - DEBUG - ABC 2017-10-04 09:52:52,314 - DEBUG - Reading company transcripts for ABT 2017-10-04 09:52:52,345 - sample_text_google) if word not in w2v]) print(' -- '.join(not_in_vocab)) motofone -- segment's -- we're -- ml910

    1.8K80发布于 2018-01-30
  • 来自专栏数据派THU

    收藏|最优论文+代码查找神器,覆盖AI全领域(966个ML任务、8500+论文

    本文介绍了查找论文及对应源码神器的最新版本,从应用领域到具体任务再到实现一步到位。 目前该网站已经完成了代码与论文的自动化链接,正在研究自动提取论文中的评估数据。 每一个分类下面所列出的项目包含:论文标题、机构、发表日期、摘要、任务分类等信息。 ? 使用 现在,我们来看看这个 ML SOTA 浏览器怎么用吧。 我们可以看到 5 个数据集的 SOTA 论文,每一行分别列出了数据集名称、SOTA 模型名称、论文、源代码等。 如下图所示,点击“See all”之后,页面跳转到在 PASCAL VOC 2012 数据集上的排行榜详细信息,如下图所示,图中绿色点为曾经的 SOTA 论文,图中折线表示趋势图,灰色点表示性能较弱的其他论文

    1.6K30发布于 2019-03-08
  • 来自专栏机器学习算法与Python学习

    ML小白】10 个机器学习 Q&A,面试必知!

    机器学习有志者以及经验丰富的ML专业人员可以在面试前以此巩固其基础知识。 1. 机器学习和深度学习有什么区别? 机器学习是人工智能的一个子集,为机器提供了无需任何显式编程就能自动学习和改进的能力。 10. 机器学习项目中需要哪些步骤? 要实现一个好的工作模型,需要采取的关键步骤是收集数据、准备数据、选择机器学习模型、模型训练、评估模型、调整参数,最后是预测。

    59230发布于 2019-09-12
  • 来自专栏机器之心

    AI所有领域最优论文+代码查找神器:966个ML任务、8500+论文任你选

    目前该网站已经完成了代码与论文的自动化链接,正在研究自动提取论文中的评估数据。 数据下载 论文摘要:https://paperswithcode.com/media/about/papers-with-abstracts.json.gz 论文与代码之间的链接:https://paperswithcode.com 每一个分类下面所列出的项目包含:论文标题、机构、发表日期、摘要、任务分类等信息。 ? 使用 现在,我们来看看这个 ML SOTA 浏览器怎么用吧。 我们可以看到 5 个数据集的 SOTA 论文,每一行分别列出了数据集名称、SOTA 模型名称、论文、源代码等。 如下图所示,点击「See all」之后,页面跳转到在 PASCAL VOC 2012 数据集上的排行榜详细信息,如下图所示,图中绿色点为曾经的 SOTA 论文,图中折线表示趋势图,灰色点表示性能较弱的其他论文

    80730发布于 2019-04-29
  • 来自专栏深度学习自然语言处理

    文本匹配必读的10论文篇 - 附论文PDF

    今天给大家整理的10篇自然语言处理经典论文——文本匹配的,希望对大家的学习有所帮助! 这次我们请来了互联网TOP大厂高级算法工程师——Himon老师,推出【文本匹配】论文精讲直播,为期2天,对论文和实验结果进行手把手分析,还有直播现场互动答疑,彻底夯实文本匹配基础。 直播嘉宾: —— 直播内容与安排 —— 1、5月6日20:00直播 1.论文研究背景、成果以及意义 2.论文泛读 3.注意事项 2、5月7日20:00直播 1.论文算法模型总览 2.论文算法模型的细节 3.模型训练细节/技巧 4.实验设置及结果分析 5.论文总结 ↓ 前方福利 ↓ 原价399元,现在0.1元领取! 扫码添加客服  即可领取↓ 免费领取文本匹配论文

    1.4K50编辑于 2022-05-06
  • 来自专栏机器学习算法与Python学习

    论文推荐 | 生成对抗网络GAN论文TOP 10

    新智元报道 来源:towardsdatascience 作者:Connor Shorten 编辑:肖琴 本文选择的 10 篇 GAN 论文包括:  DCGANs  Improved Techniques 不过,这篇论文对构成当前最先进技术水平的基础论文的思想提供了很好的概述,因此非常值得阅读。 ? Li, Shaoting Zhang, Xiaogang Wang, Xiaolei Huang, Dimitris Metaxas https://arxiv.org/abs/1612.03242 10 这篇论文定义了 GAN 框架,并讨论了 “非饱和” 损失函数。论文还给出了最优判别器的推导,这是近年来 GAN 论文中经常出现的一个证明。 论文还在 MNIST、TFD 和 CIFAR-10 图像数据集上对 GAN 的有效性进行了实验验证。 论文: Generative Adversarial Networks Ian J.

    2.3K30发布于 2019-07-04
  • 来自专栏机器之心

    2020年,那些「引爆」了ML社区的热门论文、库和基准

    不久前,资源网站 Papers with Code 发文总结了 2020 年 Top 10 热门的论文、库和基准,涵盖自然语言处理、图像分类、目标检测、语义分割、实例分割、姿态估计、行人重识别等诸多领域 Top 10 热门论文 论文 1:EfficientDet: Scalable and Efficient Object Detection ? 论文 10:Hierarchical Multi-Scale Attention for Semantic Segmentation ? 项目地址:https://github.com/rwightman/pytorch-image-models 简介:pytorch-image-models 库由热衷于构建 ML 和 AI 系统的加拿大人 项目地址:https://github.com/eriklindernoren/PyTorch-GAN 简介:PyTorchGAN 库由 Apple 公司的 ML 工程师 Erik Linder-Norén

    63420发布于 2021-03-15
  • 来自专栏AI科技评论

    2019年 10 大精彩论文,哪篇论文打动了你?

    2019 年精彩学术论文 Top10(按首字母排序) [ 一 ] 论文:A Style-Based Generator Architecture for Generative Adversarial Networks 这也成为了 AlphaStar 论文发表在《Nature》杂志 2019 年 10 月刊所需要的最后一个实验。 ? 论文地址:https://arxiv.org/abs/1906.08237 代码开源:https://github.com/zihangdai/xlnet More …… 除此之外,以下这 10论文也曾在我们的候选列表里 https://science.sciencemag.org/content/365/6456/864 在 6 人德州扑克游戏中胜过人类的扑克 AI(这也是 Science 杂志总结的 2019 年 10 大科学突破第 10 名) ALBERT: A Lite BERT for Self-supervised Learning of Language Representations https://

    1.1K30发布于 2019-12-30
  • 来自专栏机器之心

    夸大ML能力、论文纸上谈兵……机器学习社区为何变成这样?

    发帖者总结了以下几点: 一些群体自认为可以掌控 ML 领域 在 ML 领域,我经常会看到一个群体或多个群体蜂拥至某个问题上,拿出 ML 这个工具,然后声称问题「已经解决」。 我曾见过很多在著名学术会议上发表 CV 论文的学者,在与他们的交谈中,发现他们不清楚「颜色空间为什么有用」甚至「不清楚什么是像素」(像素绝对不是图像上的小方块)。 绝大多数论文都是「纸上谈兵」,不涉及实际工作 过去很多人都提到过这一点,但我必须澄清自己的观点。我知道,很多因素导致了这一问题以及所有其他问题。 论文往往只包含微小的架构变化或渐进式的改进,「真正的思想」却看不到。这就导致有时一位博士却不擅长工程实践,或者其研究效率比不上有经验的硕士生。 公平来讲,ML 领域也应如此。但很遗憾,ML 领域却没有发挥应有的作用,尤其是在同行业的一般企业中。 认为ML可以解决现实世界所有问题 这一问题也常常被提及。

    33850发布于 2021-06-08
  • 来自专栏iOSDevLog

    ML任务

    ML任务: 任务 输出类型 问题的例子 算法 监督学习 回归 实数 根据其特点预测房价 线性回归和多项式回归 分类 明确的 垃圾邮件/非垃圾邮件分类 KNN,NaïveBayes,逻辑回归,决策树

    57820发布于 2018-11-20
  • 来自专栏人工智能头条

    机器学习 TOP 10 必读论文 | 资源

    翻译 | AI科技大本营 编辑 | Donna Medium上的机器学习深度爱好者必关注的账号Mybridge照例对11月发表的学术论文进行了排名,整理出了10篇必读论文,建议收藏深读。 1. Alpha Zero:用强化学习算法对中国象棋和国际象棋进行自我修炼(本论文作者包括DeepMind创始人Demis Hassabis) https://arxiv.org/pdf/1712.01815 高分辨率图像合成和有条件的GANs的语义处理(该论文由UC Berkeley的Ming-Yu Liu以及NVIDIA Research撰写) https://arxiv.org/abs/1711.11585v1 http://blog.otoro.net/2017/11/12/evolving-stable-strategies/ 在《进化策略的可视化指南 - http://blog.otoro.net/2017/10 10. 神经网络介绍(中文版《干货!这里有一份神经网络入门指导,请收下!》)

    75050发布于 2018-06-05
  • 来自专栏人工智能

    机器学习 必读论文 TOP 10

    Medium上的机器学习深度爱好者必关注的账号Mybridge照例对11月发表的学术论文进行了排名,整理出了10篇必读论文,建议收藏深读。 1. Alpha Zero:用强化学习算法对中国象棋和国际象棋进行自我修炼(本论文作者包括DeepMind创始人Demis Hassabis) https://arxiv.org/pdf/1712.01815 高分辨率图像合成和有条件的GANs的语义处理(该论文由UC Berkeley的Ming-Yu Liu以及NVIDIA Research撰写) https://arxiv.org/abs/1711.11585v1 http://blog.otoro.net/2017/11/12/evolving-stable-strategies/ 在《进化策略的可视化指南http://blog.otoro.net/2017/10 10. 神经网络介绍 (中文版《干货!这里有一份神经网络入门指导,请收下!》

    1.4K60发布于 2018-01-04
  • 来自专栏yuancao博客

    免费下论文10个方法

    全国图书馆参考咨询联盟 4.百度学术 5.爱学术 6.谷歌学术 7.OA图书馆 8.Idata 9.中国国家图书馆 10.湖南图书馆——白嫖知网,强烈推荐 眨眼间就快毕业了,是时候准备写论文了。 这里可以用临时邮箱(https://10minutemail.net/),他过滤了一些临时邮箱,如果不信,可以换个邮箱继续 ? ? 然后提交注册 ? 注册成功后,开始登录 ? 本来想通过找回密码的方式将这个账号拿回来,但想想反正前面已经有这么多能白嫖论文的方法了,就算了 10.湖南图书馆——白嫖知网,强烈推荐 注意,需要有湖南图书馆的借书证,或者ip地址是在湖南内。 邮箱得用来接收账号密码和你要下载的论文,所以得用真实的。当然如果只是一锤子买卖,只是现在需要下论文,以后就不需要下了。 然后选择你要下的论文,就能免费下载 ? 当然,如果你要长期下论文,建议还是使用自己的邮箱

    2.2K52发布于 2020-09-10
  • 来自专栏数据派THU

    ICLR 2022的10论文推荐

    来源:DeepHub IMBA本文约4800字,建议阅读10+分钟本文与你分享ICLR 2022的机器学习研究相关论文。 消息传递的神经网络(MPNN)的表现力有限,所以论文提出了一个基于将图表表示为多组子图并使用一种等变结构对其进行处理。 如何知道两个图是否相同? 论文提出了一种叫Perceiver IO通用架构,可以处理来自任意设置的数据,同时随输入和输出的大小进行线性缩放。 规模一直是ML圈内讨论的一个持久的话题。我们经常强调论文,因为这无疑是该领域必须解决的重要问题之一:在哪里添加参数和数据就不再有用了? 论文研究了上游任务(如大规模ImageNet标签)的训练前表现如何转移到下游(DS)任务(如鲸鱼检测)。

    61240编辑于 2022-05-18
  • 来自专栏深度强化学习实验室

    10期:DeepRL每日论文快报

    DeepRL每日论文快报 来源自:arxiv.com 编辑:DeepRL 时间:2019-12-13 On-policy Reinforcement Learning with Entropy Regularization

    51620发布于 2019-12-19
  • 来自专栏DeepHub IMBA

    ICLR 2022的10论文推荐

    它是世界机器学习研究世界上最大,最受欢迎的会议之一:它包含超过一千篇有关主题的论文,包括ML理论,强化学习(RL),计算机视觉(CV),自然语言处理(NLP),神经科学等。 论文提出了一种叫Perceiver IO通用架构,可以处理来自任意设置的数据,同时随输入和输出的大小进行线性缩放。 规模一直是ML圈内讨论的一个持久的话题。我们经常强调论文,因为这无疑是该领域必须解决的重要问题之一:在哪里添加参数和数据就不再有用了? 论文研究了上游任务(如大规模ImageNet标签)的训练前表现如何转移到下游(DS)任务(如鲸鱼检测)。 id=uxxFrDwrE7Y 10、Autonomous Reinforcement Learning: Formalism and Benchmarking Archit Sharma, Kelvin

    44320编辑于 2022-06-04
领券