在我们的组织中,有许多对分析和数据科学感兴趣的人,他们对他们的工作很满意,因为他们知道R/Python等中使用什么包,对特定类型的问题调用什么算法等等。问题是,他们对底层数学知识很少,除了调用现成的函数之外,他们无法思考--也就是说,他们永远无法为特定的问题建立一个定制的解决方案。让我们称他们为函数调用者,而不是真正的数据科学家,他们对基础数学有相当的了解。
我们希望举办一个培训课程,向函数调用者传授机器学习的数学基础,并帮助他们成为数据科学家。为此,我们列出了大约十个主题,即。
·概率·各种概率分布和数据·最大似然方法·线性代数(高级)·单变量演算、多变量演算·向量演算·图形模型·贝叶斯网络·优化技术·统计模型
这将是一个80小时的课程,所以不可能像学院/大学的课程那样详细地涵盖所有内容。
问题:假设这门课程有足够的时间来教授和实施上面提到的每个主题中的3到4件事情。因此,在这样的背景下,在每个主题下可以涵盖的最好的3或4件事情是什么?
注:目标受众有科学或大学水平的数学背景,但他们对机器学习中使用的数学知识不深。
发布于 2017-11-27 05:20:52
我在新加坡国立大学完成了分析硕士学位。
我要给出的答案是基于我的经验。
当然,在上面提到的列表中,所有的主题都很重要,但是如果您需要从上面提到的主题中确定优先级,我认为以下内容对于任何在数据科学领域工作的人来说都是非常重要的。:
休息在开始时并不那么重要,如果有必要的话,你可以根据第一次会议的结果进行另一次会议。在这里,您可以涵盖所有的主题,如线性代数(高级),向量演算,优化技术,最大似然法。如您所知,这些技术将在基本模型准备就绪后发挥作用,如果您希望提高模型的准确性或将模型WRT调整到您的业务问题上,您将使用这些技术。
我希望这个答案能对你有所帮助。
发布于 2017-11-27 08:29:14
我完全理解你的关心,我很感激你想教基础数学这一事实。根据我的经验,我认为一个更好的方法是不直接学习数学,而是用你已经解决的问题来教数学,即黑客学习数学的方式。作为程序员,我们可以编写我们所学的程序,这是一种积极的肯定。下面是一个非常好的存储库,其中包含了这些行的内容:https://github.com/amitkaps/hackermath
https://datascience.stackexchange.com/questions/25126
复制相似问题