搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏我还不懂对话
【论文阅读】- 怎么快速阅读ML论文？
主题框架翻译于Eric Jang的博客https://blog.evjang.com/2021/01/understanding-ml.html，加了一些个人观点。机器学习的论文很多，怎么从Arxiv上泛滥的文章中选择论文阅读，那么我们就需要快速地了解论文内容概要，从而决定是否精读。 ML模型是去拟合偏差和数据。有时候数据中偏差很大，有时候很小，为了确保模型泛化很好（拟合数据而非偏差）需要更多的偏差和数据，最好是无偏数据。论文里面的说法是否可靠？个人理解，是说论文里面指标是否靠谱，方法是否实用等。凭我自己的经验，一般可以从以下几点来看：论文方法是否过于trick，是否非常复杂（奥卡姆剃刀原理）。 Referencehttps://blog.evjang.com/2021/01/understanding-ml.html图片
72620编辑于 2022-10-08
来自专栏DeepHub IMBA
2022 年 4 月 10篇 ML 研究论文推荐
NVidia 的新 H100 GPU已经发布了，我们也很久没有发论文推荐了，这是4月份的论文推荐：Google 的 5400 亿参数 PaLM、Pathways、Kubric、Tensor Programs 论文的这项工作展示了如何更有效地完成超参数调整。为了训练神经网络，必须选择合适的超参数。论文中提到的方法可以在小型模型中找到最佳超参数，然后扩展模型到大型模型进行最终的资源密集型训练运行。 3、Pathways: Asynchronous Distributed Dataflow for ML and PaLM: Scaling Language Modeling with Pathways 架构在 ML 中的作用是否会进一步缩小？论文的回答是：是的。
62820编辑于 2022-04-14
来自专栏量化投资与机器学习
【代码+论文】通过ML、Time Series模型学习股价行为
今天编辑部给大家带来的是来自Jeremy Jordan的论文，主要分析论文的建模步骤和方法，具体内容大家可以自行查看。 sample_text_google) if word not in w2v]) print(' -- '.join(not_in_vocab)) motofone -- segment's -- we're -- ml910
1.8K80发布于 2018-01-30
来自专栏数据派THU
收藏｜最优论文+代码查找神器，覆盖AI全领域（966个ML任务、8500+论文）
本文介绍了查找论文及对应源码神器的最新版本，从应用领域到具体任务再到实现一步到位。目前该网站已经完成了代码与论文的自动化链接，正在研究自动提取论文中的评估数据。每一个分类下面所列出的项目包含：论文标题、机构、发表日期、摘要、任务分类等信息。 ? 使用现在，我们来看看这个 ML SOTA 浏览器怎么用吧。我们可以看到 5 个数据集的 SOTA 论文，每一行分别列出了数据集名称、SOTA 模型名称、论文、源代码等。如下图所示，点击“See all”之后，页面跳转到在 PASCAL VOC 2012 数据集上的排行榜详细信息，如下图所示，图中绿色点为曾经的 SOTA 论文，图中折线表示趋势图，灰色点表示性能较弱的其他论文
1.6K30发布于 2019-03-08
来自专栏DeepHub IMBA
2021 年 10 月推荐阅读的10篇精选ML论文
每个月都会有几千篇的论文在arXiv发布，我们不可能看完所有的文章，但是我们可以从中找到一些趋势：大型语言模型不再与较小的模型在同一类别中竞争(如训练前+监督数据微调)。为什么? 幸运的是，学者们经常关注这一点，传统上大多数揭示事实的论文都来自大学，就像我们很快就会看到的那篇。这篇论文的缺点也是它的优点:为进一步优化他们的实验而付出的有限的范围和努力。但是还有一个重要的警告没有在论文中彻底解决：注意力矩阵中的偏差通过一个 softmax 来抑制远标记的贡献，这就像有一个注意力的“软窗口”。这本纸质书包含了很多内容:概述、介绍和论文，内容涉及在大量数据的监督下训练的大型神经模型的新兴领域，为此，它们被称为基础模型。
56920发布于 2021-10-09
来自专栏机器之心
AI所有领域最优论文+代码查找神器：966个ML任务、8500+论文任你选
目前该网站已经完成了代码与论文的自动化链接，正在研究自动提取论文中的评估数据。数据下载论文摘要：https://paperswithcode.com/media/about/papers-with-abstracts.json.gz 论文与代码之间的链接：https://paperswithcode.com 每一个分类下面所列出的项目包含：论文标题、机构、发表日期、摘要、任务分类等信息。 ? 使用现在，我们来看看这个 ML SOTA 浏览器怎么用吧。我们可以看到 5 个数据集的 SOTA 论文，每一行分别列出了数据集名称、SOTA 模型名称、论文、源代码等。如下图所示，点击「See all」之后，页面跳转到在 PASCAL VOC 2012 数据集上的排行榜详细信息，如下图所示，图中绿色点为曾经的 SOTA 论文，图中折线表示趋势图，灰色点表示性能较弱的其他论文
79730发布于 2019-04-29
来自专栏机器之心
2020年，那些「引爆」了ML社区的热门论文、库和基准
Top 10 热门论文论文 1：EfficientDet: Scalable and Efficient Object Detection ? 论文链接：https://arxiv.org/pdf/1911.09070v7.pdf 简介：这项论文最初在 2019 年 11 月份发布首版，机器之心进行了报道，本文是最新版。项目地址：https://github.com/rwightman/pytorch-image-models 简介：pytorch-image-models 库由热衷于构建 ML 和 AI 系统的加拿大人项目地址：https://github.com/eriklindernoren/PyTorch-GAN 简介：PyTorchGAN 库由 Apple 公司的 ML 工程师 Erik Linder-Norén 创建者认为模型架构并不总是能够反映论文中提出的观点，所以他聚焦于获取论文的核心理念而不只是确保每个层配置都正确。不过遗憾的是，由于创建者没有时间维护，该库已经过时了。
63120发布于 2021-03-15
来自专栏机器之心
夸大ML能力、论文纸上谈兵……机器学习社区为何变成这样？
发帖者总结了以下几点：一些群体自认为可以掌控 ML 领域在 ML 领域，我经常会看到一个群体或多个群体蜂拥至某个问题上，拿出 ML 这个工具，然后声称问题「已经解决」。我曾见过很多在著名学术会议上发表 CV 论文的学者，在与他们的交谈中，发现他们不清楚「颜色空间为什么有用」甚至「不清楚什么是像素」（像素绝对不是图像上的小方块）。绝大多数论文都是「纸上谈兵」，不涉及实际工作过去很多人都提到过这一点，但我必须澄清自己的观点。我知道，很多因素导致了这一问题以及所有其他问题。论文往往只包含微小的架构变化或渐进式的改进，「真正的思想」却看不到。这就导致有时一位博士却不擅长工程实践，或者其研究效率比不上有经验的硕士生。公平来讲，ML 领域也应如此。但很遗憾，ML 领域却没有发挥应有的作用，尤其是在同行业的一般企业中。认为ML可以解决现实世界所有问题这一问题也常常被提及。
33650发布于 2021-06-08
来自专栏iOSDevLog
ML任务
表 ML任务：任务输出类型问题的例子算法监督学习回归实数根据其特点预测房价线性回归和多项式回归分类明确的垃圾邮件/非垃圾邮件分类 KNN，NaïveBayes，逻辑回归，决策树
57720发布于 2018-11-20
来自专栏机器学习与python集中营
AI所有领域最优论文+代码查找神器：966个ML任务、8500+论文任你选(亲测好用)
目前该网站已经完成了代码与论文的自动化链接，正在研究自动提取论文中的评估数据。数据下载论文摘要 https://paperswithcode.com/media/about/papers-with-abstracts.json.gz 论文与代码之间的链接 https://paperswithcode.com 每一个分类下面所列出的项目包含：论文标题、机构、发表日期、摘要、任务分类等信息。 ? 使用现在，我们来看看这个 ML SOTA 浏览器怎么用吧。我们可以看到 5 个数据集的 SOTA 论文，每一行分别列出了数据集名称、SOTA 模型名称、论文、源代码等。如下图所示，点击「See all」之后，页面跳转到在 PASCAL VOC 2012 数据集上的排行榜详细信息，如下图所示，图中绿色点为曾经的 SOTA 论文，图中折线表示趋势图，灰色点表示性能较弱的其他论文
1.1K20发布于 2019-06-02
来自专栏量子位
这份GitHub 2.3k星的ML论文清单拿好，工作用得上
在工作中动手实施自己的ML项目之前，了解领域里的前沿进展，吸收前人的经验，是很有必要的。不过，现在arXiv上每天都有成百篇新论文冒头，哪些值得看？为此，亚马逊工程师Eugene Yan等人打造了一个论文合集，在这个GitHub项目中，持续共享Google、亚马逊、Facebook等等大公司在数据科学和机器学习方面的论文和博客文章。 ? 而这份清单，收集了电商、视频、音乐、课程种种不同业务的推荐算法技术博客/论文。 ? ，这份论文/文章列表还收录了一些失败的经验。传送门项目地址： https://github.com/eugeneyan/applied-ml — 完 —
53040发布于 2020-09-14
来自专栏YoungGy
ML基石_LinearModelsForClassfication
本文介绍了用于分类的线性模型的基本回顾，包括线性回归、逻辑回归、支持向量机、朴素贝叶斯、K近邻、决策树、随机森林、梯度提升树、神经网络等。作者通过对比各个方法的优缺点，提出了改进的随机梯度下降法、概率线性模型、OVO、OVA、Logistic回归、二分类、多分类等方案。
67370发布于 2018-01-02
来自专栏AI科技评论
学界 | CVPR 2019 论文解读：人大 ML 研究组提出新的视频测谎算法
AI 科技评论按：计算机视觉顶会 CVPR 2019 即将于 6 月在美国长滩召开，今年大会共收到超过 5165 篇论文投稿，最终收录的论文为 1299 篇。今年的 CVPR 2019，卢志武博士领导的中国人民大学信息学院机器学习（ML）组共有 3 篇论文被录用，论文主题涵盖视频识别、小样本学习、视觉对话等热点问题，本文中要解读的论文便是其中关于视频识别的一篇此外，为了克服数据量过小的问题,，作者在模型中加入了元学习 (ML) 和对抗学习 (AL) 模块, 这些都对提高模型的鲁棒性有很大的帮助。 ? 表 2：微表情识别结果四、团队介绍中国人民大学信息学院机器学习（ML）组由卢志武博士，以及 20 名博士生与硕士生组成，隶属于文继荣教授的大数据分析团队。目前，人大 ML 组已经在 TPAMI、IJCV、NIPS、CVPR 等国际顶级期刊/会议上发表 40 余篇论文，主持了 NSFC、KJW 等多个国家科研项目，还曾获人工智能国际权威评测 ImageNet
1.4K10发布于 2019-05-08
来自专栏张善友的专栏
ML-Framework：ML.NET 0.3 带来新组件
ML.NET在今年微软在Build 2018 会议上宣布的机器学习框架现已正式推出0.3版本 https://github.com/dotnet/machinelearning/releases/tag Microsoft希望.NET开发人员能够设计自己的ML模型并将其集成到他们的应用程序中，而无需构建特定的专有技术，让AI技术平民化。 ML.NET 0.3现在提供了许多用于训练机器学习模型的新组件以及以流行的ONNX格式导出模型的选项，当然还包括了许多Bug修复。 ML.NET 0.3中新增的训练模块（Learner）适用于不同的分类要求。在ML.NET 0.3中，可以使用LightGBM的所有功能 - 除了排名评估器，预计将在更高版本中提供。
62820发布于 2018-07-24
来自专栏机器学习炼丹之旅
炼丹秘籍（ML指南）
深度学习的调参就像炼丹，而我就是一位正尝试入坑的“炼丹学徒”，在收藏了几个链接后，看着臃肿的收藏夹，心血来潮，不如写篇博客，整理一下近期学习过程中遇到的好课程、好博客、好项目，会贴上链接，做个简短的评价，欢迎留言交流与评价，持续分享好的资源~
1.3K10编辑于 2022-09-19
来自专栏大数据文摘
一周AI最火论文 | 再见，scikit-learn！终于等到新ML Python包
原文： https://arxiv.org/abs/2002.11686v1 其他爆款论文谷歌AI：致力于提升用于语言基础任务的街景全景入口： https://ai.googleblog.com/2020
58620发布于 2020-03-05
来自专栏数据科学与人工智能
【ML】ML Q&A：机器学习在金融中如何应用？
原文链接：https://www.quora.com/How-is-machine-learning-used-in-finance
99910发布于 2018-12-12
来自专栏Spark学习技巧
Spark的Ml pipeline
DataFrame：这个ML API使用Spark SQL 的DataFrame作为一个ML数据集，它可以容纳各种数据类型。大多数基础transformers和基本ML models都支持。 import org.apache.spark.ml.linalg. 2.2 Pipeline 3 import org.apache.spark.ml. {Pipeline, PipelineModel} import org.apache.spark.ml.classification.LogisticRegression import org.apache.spark.ml.feature
3K90发布于 2018-01-31
来自专栏数据科学与人工智能
【ML】机器学习介绍
笔者邀请您，先思考： 1 您如何理解机器学习？在我们理解机器学习之前，让我们先来谈谈为什么需要机器学习，以及我们为什么要关心它? 如果我让你写一个两个数字相加的程序，你可能会写它，但是如果我让你用同
76920发布于 2018-12-25
来自专栏流川疯编写程序的艺术
机器学习规则:ML工程最佳实践----rules_of_ml section 【翻译】
Machine Learning Rule: #1: 不要害怕开发没有应用机器学习技术的产品 Rule: #2: 设计评价指标并设立优先级 Rule: #3: 先使用复杂的启发式规则，然后选择机器学习方法 ML ML Phase II: 特征工程（Feature Engineering） Rule #16: 对模型重建和迭代做出规划 Rule #17: 开始时，使用可直接观察或者记录的特征（而不是算法学习得到的特征处理这类问题的有效方法是加入位置特征注意要保持位置特征和其他特征的分离性不要交叉（cross）位置特征理想情况下，让模型变成位置特征函数和其他特征函数的和 Rule #37: 评估训练和服务之间的偏差 ML 其他人对不同的产品倾向相似，但你或许不同于此具体查看: part1 part2 part3 英文全文查看：Rules of Machine Learning: Best Practices for ML
47620编辑于 2022-05-10

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

【论文阅读】- 怎么快速阅读ML论文？

2022 年 4 月 10篇 ML 研究论文推荐

【代码+论文】通过ML、Time Series模型学习股价行为

收藏｜最优论文+代码查找神器，覆盖AI全领域（966个ML任务、8500+论文）

2021 年 10 月推荐阅读的10篇精选ML论文

AI所有领域最优论文+代码查找神器：966个ML任务、8500+论文任你选

2020年，那些「引爆」了ML社区的热门论文、库和基准

夸大ML能力、论文纸上谈兵……机器学习社区为何变成这样？

ML任务

AI所有领域最优论文+代码查找神器：966个ML任务、8500+论文任你选(亲测好用)

这份GitHub 2.3k星的ML论文清单拿好，工作用得上

ML基石_LinearModelsForClassfication

学界 | CVPR 2019 论文解读：人大 ML 研究组提出新的视频测谎算法

ML-Framework：ML.NET 0.3 带来新组件

炼丹秘籍（ML指南）

一周AI最火论文 | 再见，scikit-learn！终于等到新ML Python包

【ML】ML Q&A：机器学习在金融中如何应用？

Spark的Ml pipeline

【ML】机器学习介绍

机器学习规则:ML工程最佳实践----rules_of_ml section 【翻译】

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐