首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏我还不懂对话

    论文阅读】- 怎么快速阅读ML论文

    主题框架翻译于Eric Jang的博客https://blog.evjang.com/2021/01/understanding-ml.html,加了一些个人观点。 机器学习的论文很多,怎么从Arxiv上泛滥的文章中选择论文阅读,那么我们就需要快速地了解论文内容概要,从而决定是否精读。 ML模型是去拟合偏差和数据。有时候数据中偏差很大,有时候很小,为了确保模型泛化很好(拟合数据而非偏差)需要更多的偏差和数据,最好是无偏数据。 论文里面的说法是否可靠?个人理解,是说论文里面指标是否靠谱,方法是否实用等。凭我自己的经验,一般可以从以下几点来看:论文方法是否过于trick,是否非常复杂(奥卡姆剃刀原理)。 Referencehttps://blog.evjang.com/2021/01/understanding-ml.html图片

    72620编辑于 2022-10-08
  • 来自专栏DeepHub IMBA

    2022 年 4 月 10篇 ML 研究论文推荐

    NVidia 的新 H100 GPU已经发布了,我们也很久没有发论文推荐了,这是4月份的论文推荐:Google 的 5400 亿参数 PaLM、Pathways、Kubric、Tensor Programs 论文的这项工作展示了如何更有效地完成超参数调整。 为了训练神经网络,必须选择合适的超参数。 论文中提到的方法可以在小型模型中找到最佳超参数,然后扩展模型到大型模型进行最终的资源密集型训练运行。 3、Pathways: Asynchronous Distributed Dataflow for ML and PaLM: Scaling Language Modeling with Pathways 架构在 ML 中的作用是否会进一步缩小?论文的回答是:是的。

    62820编辑于 2022-04-14
  • 来自专栏量化投资与机器学习

    【代码+论文】通过ML、Time Series模型学习股价行为

    今天编辑部给大家带来的是来自Jeremy Jordan的论文,主要分析论文的建模步骤和方法,具体内容大家可以自行查看。 sample_text_google) if word not in w2v]) print(' -- '.join(not_in_vocab)) motofone -- segment's -- we're -- ml910

    1.8K80发布于 2018-01-30
  • 来自专栏数据派THU

    收藏|最优论文+代码查找神器,覆盖AI全领域(966个ML任务、8500+论文

    本文介绍了查找论文及对应源码神器的最新版本,从应用领域到具体任务再到实现一步到位。 目前该网站已经完成了代码与论文的自动化链接,正在研究自动提取论文中的评估数据。 每一个分类下面所列出的项目包含:论文标题、机构、发表日期、摘要、任务分类等信息。 ? 使用 现在,我们来看看这个 ML SOTA 浏览器怎么用吧。 我们可以看到 5 个数据集的 SOTA 论文,每一行分别列出了数据集名称、SOTA 模型名称、论文、源代码等。 如下图所示,点击“See all”之后,页面跳转到在 PASCAL VOC 2012 数据集上的排行榜详细信息,如下图所示,图中绿色点为曾经的 SOTA 论文,图中折线表示趋势图,灰色点表示性能较弱的其他论文

    1.6K30发布于 2019-03-08
  • 来自专栏DeepHub IMBA

    2021 年 10 月推荐阅读的10篇精选ML论文

    每个月都会有几千篇的论文在arXiv发布,我们不可能看完所有的文章,但是我们可以从中找到一些趋势: 大型语言模型不再与较小的模型在同一类别中竞争(如训练前+监督数据微调)。为什么? 幸运的是,学者们经常关注这一点,传统上大多数揭示事实的论文都来自大学,就像我们很快就会看到的那篇。 这篇论文的缺点也是它的优点:为进一步优化他们的实验而付出的有限的范围和努力。 但是还有一个重要的警告没有在论文中彻底解决:注意力矩阵中的偏差通过一个 softmax 来抑制远标记的贡献,这就像有一个注意力的“软窗口”。 这本纸质书包含了很多内容:概述、介绍和论文,内容涉及在大量数据的监督下训练的大型神经模型的新兴领域,为此,它们被称为基础模型。

    56920发布于 2021-10-09
  • 来自专栏机器之心

    AI所有领域最优论文+代码查找神器:966个ML任务、8500+论文任你选

    目前该网站已经完成了代码与论文的自动化链接,正在研究自动提取论文中的评估数据。 数据下载 论文摘要:https://paperswithcode.com/media/about/papers-with-abstracts.json.gz 论文与代码之间的链接:https://paperswithcode.com 每一个分类下面所列出的项目包含:论文标题、机构、发表日期、摘要、任务分类等信息。 ? 使用 现在,我们来看看这个 ML SOTA 浏览器怎么用吧。 我们可以看到 5 个数据集的 SOTA 论文,每一行分别列出了数据集名称、SOTA 模型名称、论文、源代码等。 如下图所示,点击「See all」之后,页面跳转到在 PASCAL VOC 2012 数据集上的排行榜详细信息,如下图所示,图中绿色点为曾经的 SOTA 论文,图中折线表示趋势图,灰色点表示性能较弱的其他论文

    79730发布于 2019-04-29
  • 来自专栏机器之心

    2020年,那些「引爆」了ML社区的热门论文、库和基准

    Top 10 热门论文 论文 1:EfficientDet: Scalable and Efficient Object Detection ? 论文链接:https://arxiv.org/pdf/1911.09070v7.pdf 简介:这项论文最初在 2019 年 11 月份发布首版,机器之心进行了报道,本文是最新版。 项目地址:https://github.com/rwightman/pytorch-image-models 简介:pytorch-image-models 库由热衷于构建 ML 和 AI 系统的加拿大人 项目地址:https://github.com/eriklindernoren/PyTorch-GAN 简介:PyTorchGAN 库由 Apple 公司的 ML 工程师 Erik Linder-Norén 创建者认为模型架构并不总是能够反映论文中提出的观点,所以他聚焦于获取论文的核心理念而不只是确保每个层配置都正确。不过遗憾的是,由于创建者没有时间维护,该库已经过时了。

    63120发布于 2021-03-15
  • 来自专栏机器之心

    夸大ML能力、论文纸上谈兵……机器学习社区为何变成这样?

    发帖者总结了以下几点: 一些群体自认为可以掌控 ML 领域 在 ML 领域,我经常会看到一个群体或多个群体蜂拥至某个问题上,拿出 ML 这个工具,然后声称问题「已经解决」。 我曾见过很多在著名学术会议上发表 CV 论文的学者,在与他们的交谈中,发现他们不清楚「颜色空间为什么有用」甚至「不清楚什么是像素」(像素绝对不是图像上的小方块)。 绝大多数论文都是「纸上谈兵」,不涉及实际工作 过去很多人都提到过这一点,但我必须澄清自己的观点。我知道,很多因素导致了这一问题以及所有其他问题。 论文往往只包含微小的架构变化或渐进式的改进,「真正的思想」却看不到。这就导致有时一位博士却不擅长工程实践,或者其研究效率比不上有经验的硕士生。 公平来讲,ML 领域也应如此。但很遗憾,ML 领域却没有发挥应有的作用,尤其是在同行业的一般企业中。 认为ML可以解决现实世界所有问题 这一问题也常常被提及。

    33650发布于 2021-06-08
  • 来自专栏iOSDevLog

    ML任务

    ML任务: 任务 输出类型 问题的例子 算法 监督学习 回归 实数 根据其特点预测房价 线性回归和多项式回归 分类 明确的 垃圾邮件/非垃圾邮件分类 KNN,NaïveBayes,逻辑回归,决策树

    57720发布于 2018-11-20
  • 来自专栏机器学习与python集中营

    AI所有领域最优论文+代码查找神器:966个ML任务、8500+论文任你选(亲测好用)

    目前该网站已经完成了代码与论文的自动化链接,正在研究自动提取论文中的评估数据。 数据下载 论文摘要 https://paperswithcode.com/media/about/papers-with-abstracts.json.gz 论文与代码之间的链接 https://paperswithcode.com 每一个分类下面所列出的项目包含:论文标题、机构、发表日期、摘要、任务分类等信息。 ? 使用 现在,我们来看看这个 ML SOTA 浏览器怎么用吧。 我们可以看到 5 个数据集的 SOTA 论文,每一行分别列出了数据集名称、SOTA 模型名称、论文、源代码等。 如下图所示,点击「See all」之后,页面跳转到在 PASCAL VOC 2012 数据集上的排行榜详细信息,如下图所示,图中绿色点为曾经的 SOTA 论文,图中折线表示趋势图,灰色点表示性能较弱的其他论文

    1.1K20发布于 2019-06-02
  • 来自专栏量子位

    这份GitHub 2.3k星的ML论文清单拿好,工作用得上

    在工作中动手实施自己的ML项目之前,了解领域里的前沿进展,吸收前人的经验,是很有必要的。 不过,现在arXiv上每天都有成百篇新论文冒头,哪些值得看? 为此,亚马逊工程师Eugene Yan等人打造了一个论文合集,在这个GitHub项目中,持续共享Google、亚马逊、Facebook等等大公司在数据科学和机器学习方面的论文和博客文章。 ? 而这份清单,收集了电商、视频、音乐、课程种种不同业务的推荐算法技术博客/论文。 ? ,这份论文/文章列表还收录了一些失败的经验。 传送门 项目地址: https://github.com/eugeneyan/applied-ml — 完 —

    53040发布于 2020-09-14
  • 来自专栏YoungGy

    ML基石_LinearModelsForClassfication

    本文介绍了用于分类的线性模型的基本回顾,包括线性回归、逻辑回归、支持向量机、朴素贝叶斯、K近邻、决策树、随机森林、梯度提升树、神经网络等。作者通过对比各个方法的优缺点,提出了改进的随机梯度下降法、概率线性模型、OVO、OVA、Logistic回归、二分类、多分类等方案。

    67370发布于 2018-01-02
  • 来自专栏AI科技评论

    学界 | CVPR 2019 论文解读:人大 ML 研究组提出新的视频测谎算法

    AI 科技评论按:计算机视觉顶会 CVPR 2019 即将于 6 月在美国长滩召开,今年大会共收到超过 5165 篇论文投稿,最终收录的论文为 1299 篇。 今年的 CVPR 2019,卢志武博士领导的中国人民大学信息学院机器学习(ML)组共有 3 篇论文被录用,论文主题涵盖视频识别、小样本学习、视觉对话等热点问题,本文中要解读的论文便是其中关于视频识别的一篇 此外,为了克服数据量过小的问题,,作者在模型中加入了元学习 (ML) 和对抗学习 (AL) 模块, 这些都对提高模型的鲁棒性有很大的帮助。 ? 表 2:微表情识别结果 四、团队介绍 中国人民大学信息学院机器学习(ML)组由卢志武博士,以及 20 名博士生与硕士生组成,隶属于文继荣教授的大数据分析团队。 目前,人大 ML 组已经在 TPAMI、IJCV、NIPS、CVPR 等国际顶级期刊/会议上发表 40 余篇论文,主持了 NSFC、KJW 等多个国家科研项目,还曾获人工智能国际权威评测 ImageNet

    1.4K10发布于 2019-05-08
  • 来自专栏张善友的专栏

    ML-Framework:ML.NET 0.3 带来新组件

    ML.NET在今年微软在Build 2018 会议上宣布的机器学习框架现已正式推出0.3版本 https://github.com/dotnet/machinelearning/releases/tag Microsoft希望.NET开发人员能够设计自己的ML模型并将其集成到他们的应用程序中,而无需构建特定的专有技术,让AI技术平民化。 ML.NET 0.3现在提供了许多用于训练机器学习模型的新组件以及以流行的ONNX格式导出模型的选项,当然还包括了许多Bug修复。 ML.NET 0.3中新增的训练模块(Learner)适用于不同的分类要求。 在ML.NET 0.3中,可以使用LightGBM的所有功能 - 除了排名评估器,预计将在更高版本中提供。

    62820发布于 2018-07-24
  • 来自专栏机器学习炼丹之旅

    炼丹秘籍(ML指南)

    深度学习的调参就像炼丹,而我就是一位正尝试入坑的“炼丹学徒”,在收藏了几个链接后,看着臃肿的收藏夹,心血来潮,不如写篇博客,整理一下近期学习过程中遇到的好课程、好博客、好项目,会贴上链接,做个简短的评价,欢迎留言交流与评价,持续分享好的资源~

    1.3K10编辑于 2022-09-19
  • 来自专栏大数据文摘

    一周AI最火论文 | 再见,scikit-learn!终于等到新ML Python包

    原文: https://arxiv.org/abs/2002.11686v1 其他爆款论文 谷歌AI:致力于提升用于语言基础任务的街景全景入口: https://ai.googleblog.com/2020

    58620发布于 2020-03-05
  • 来自专栏数据科学与人工智能

    MLML Q&A:机器学习在金融中如何应用?

    原文链接:https://www.quora.com/How-is-machine-learning-used-in-finance

    99910发布于 2018-12-12
  • 来自专栏Spark学习技巧

    Spark的Ml pipeline

    DataFrame:这个ML API使用Spark SQL 的DataFrame作为一个ML数据集,它可以容纳各种数据类型。 大多数基础transformers和基本ML models都支持。 import org.apache.spark.ml.linalg. 2.2 Pipeline 3 import org.apache.spark.ml. {Pipeline, PipelineModel} import org.apache.spark.ml.classification.LogisticRegression import org.apache.spark.ml.feature

    3K90发布于 2018-01-31
  • 来自专栏数据科学与人工智能

    ML】机器学习介绍

    笔者邀请您,先思考: 1 您如何理解机器学习? 在我们理解机器学习之前,让我们先来谈谈为什么需要机器学习,以及我们为什么要关心它? 如果我让你写一个两个数字相加的程序,你可能会写它,但是如果我让你用同

    76920发布于 2018-12-25
  • 来自专栏流川疯编写程序的艺术

    机器学习规则:ML工程最佳实践----rules_of_ml section 【翻译】

    Machine Learning Rule: #1: 不要害怕开发没有应用机器学习技术的产品 Rule: #2: 设计评价指标并设立优先级 Rule: #3: 先使用复杂的启发式规则,然后选择机器学习方法 ML ML Phase II: 特征工程(Feature Engineering) Rule #16: 对模型重建和迭代做出规划 Rule #17: 开始时,使用可直接观察或者记录的特征(而不是算法学习得到的特征 处理这类问题的有效方法是加入位置特征 注意要保持位置特征和其他特征的分离性 不要交叉(cross)位置特征 理想情况下,让模型变成位置特征函数和其他特征函数的和 Rule #37: 评估训练和服务之间的偏差 ML 其他人对不同的产品倾向相似,但你或许不同于此 具体查看: part1 part2 part3 英文全文查看:Rules of Machine Learning: Best Practices for ML

    47620编辑于 2022-05-10
领券