首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >函数调用者与数据科学家

函数调用者与数据科学家
EN

Data Science用户
提问于 2017-11-27 04:55:52
回答 2查看 100关注 0票数 2

在我们的组织中,有许多对分析和数据科学感兴趣的人,他们对他们的工作很满意,因为他们知道R/Python等中使用什么包,对特定类型的问题调用什么算法等等。问题是,他们对底层数学知识很少,除了调用现成的函数之外,他们无法思考--也就是说,他们永远无法为特定的问题建立一个定制的解决方案。让我们称他们为函数调用者,而不是真正的数据科学家,他们对基础数学有相当的了解。

我们希望举办一个培训课程,向函数调用者传授机器学习的数学基础,并帮助他们成为数据科学家。为此,我们列出了大约十个主题,即。

·概率·各种概率分布和数据·最大似然方法·线性代数(高级)·单变量演算、多变量演算·向量演算·图形模型·贝叶斯网络·优化技术·统计模型

这将是一个80小时的课程,所以不可能像学院/大学的课程那样详细地涵盖所有内容。

问题:假设这门课程有足够的时间来教授和实施上面提到的每个主题中的3到4件事情。因此,在这样的背景下,在每个主题下可以涵盖的最好的3或4件事情是什么?

注:目标受众有科学或大学水平的数学背景,但他们对机器学习中使用的数学知识不深。

EN

回答 2

Data Science用户

回答已采纳

发布于 2017-11-27 05:20:52

我在新加坡国立大学完成了分析硕士学位。

我要给出的答案是基于我的经验。

当然,在上面提到的列表中,所有的主题都很重要,但是如果您需要从上面提到的主题中确定优先级,我认为以下内容对于任何在数据科学领域工作的人来说都是非常重要的。:

  1. 各种概率和数据分布:在这里,您可以给出基本的概率论。你不需要一个单独的概率类。更多的是其应用。
  2. 单变量微积分/多变量微积分:这是非常重要的,当你试图预测某件事时,它起着重要的作用。
  3. 图形模型:是的,这些都有助于实现各种社区检测算法、社交网络等等。
  4. 贝叶斯网络:这是重要的基本技术之一,应该为所有统计学家所知。
  5. 统计模型:它们需要暴露在不同的统计模型中,因为您知道有许多模型可以在不同的场景中表现得更好,这只能通过实践来实现。

休息在开始时并不那么重要,如果有必要的话,你可以根据第一次会议的结果进行另一次会议。在这里,您可以涵盖所有的主题,如线性代数(高级),向量演算,优化技术,最大似然法。如您所知,这些技术将在基本模型准备就绪后发挥作用,如果您希望提高模型的准确性或将模型WRT调整到您的业务问题上,您将使用这些技术。

我希望这个答案能对你有所帮助。

票数 1
EN

Data Science用户

发布于 2017-11-27 08:29:14

我完全理解你的关心,我很感激你想教基础数学这一事实。根据我的经验,我认为一个更好的方法是不直接学习数学,而是用你已经解决的问题来教数学,即黑客学习数学的方式。作为程序员,我们可以编写我们所学的程序,这是一种积极的肯定。下面是一个非常好的存储库,其中包含了这些行的内容:https://github.com/amitkaps/hackermath

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/25126

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档