首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏数据科学与人工智能

    数据科学数据科学家与数据科学

    一、数据科学家的起源 "数据科学"(DataScience)起初叫"datalogy "。 Jeff Wu做出题为“统计学=数据科学吗? 的演讲,建议统计改名数据科学统计数据科学家。 2002年,国际科学理事会:数据委员会科学和技术(CODATA)开始出版数据科学杂志。 2003年,美国哥伦比亚大学开始发布数据科学杂志,主要内容涵盖统计方法和定量研究中的应用。 二、数据科学家的定义 数据科学(Data Science)是从数据中提取知识的研究,关键是科学数据科学并不局限于大数据,但是数据量的扩大诚然使得数据科学的地位越发重要。 数据科学的从业者被称为数据科学家。数据科学家通过精深的专业知识在某些科学学科解决复杂的数据问题。

    1.4K90发布于 2018-02-26
  • 来自专栏数据科学与人工智能

    数据科学数据科学入门指南

    数据科学虽然刚刚兴起,却发展迅速。 只要有数据的地方,就需要数据科学团队来分析、挖掘数据。 因而,在各个行业都需要大量的数据科学家。 所以我并不建议从最基础的数学理论开始学习数据科学。 下面的这些建议会告诉你如何高效、快速的入门数据科学 ? 数据科学知识体系图 1. 学习别人的程序特别是高手的程序,是数据科学进阶的有效途径。 尝试着重复作者的工作,在这个过程中,你会了解到这个模型的细节以及数据科学的方方面面,比如如何更好的组织你的成果。 数据科学是一座高山,停止学习意味着你永远无法到达顶点。 但是,养成这些良好的习惯,你会很自然的成为以为数据科学专家。 掌握正确的方法和习惯,任何人都可以掌握这门科学

    1K90发布于 2018-02-26
  • 来自专栏数据科学与人工智能

    数据科学】如何学习数据科学

    解决一些好玩的小问题:好奇心是数据科学的关键。如果你对国家的经济问题,犯罪统计,体育成绩等感兴趣的话,去收集数据并开始回答你的问题吧。 有很多的培训材料可以在网上找到: 统计202 加州理工学院的数据科学课程 Coursera:数据科学,机器学习,数据分析,数据分析计算 加州大学伯克利分校 - 数据科学 骑士新闻中心的课程:资讯图像和数据可视化 关注业内领袖:网络中有很多厉害的数据科学家,关注这些人可以得到很好的启发。 ) 定期参加聚会:本地的数据科学/ R聚会,这一领域的发展非常迅速,我至少每隔一年去那里。 3、有用的数据科学读物 数据挖掘导论 果壳中的R 数据之魅 可视化之美 查看更多的数据科学的书籍:O'Reilly,Manning 4、对我感觉没多大用的东西 学习多个统计工具:一年前,我开始有一些

    947100发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    数据科学】什么是数据科学家与数据科学

    一、数据科学家的起源 “数据科学”(DataScience)起初叫”datalogy “。 Jeff Wu做出题为“统计学=数据科学吗? 的演讲,建议统计改名数据科学统计数据科学家。 2002年,国际科学理事会:数据委员会科学和技术(CODATA)开始出版数据科学杂志。 2003年,美国哥伦比亚大学开始发布数据科学杂志,主要内容涵盖统计方法和定量研究中的应用。 二、数据科学家的定义 数据科学(Data Science)是从数据中提取知识的研究,关键是科学数据科学并不局限于大数据,但是数据量的扩大诚然使得数据科学的地位越发重要。 数据科学的从业者被称为数据科学家。数据科学家通过精深的专业知识在某些科学学科解决复杂的数据问题。

    1.8K60发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    数据科学数据科学可以做什么

    机器学习是数据科学的发动机。每种机器学习方法(也称为算法)获取数据,反复咀嚼,输出结果。机器学习算法负责数据科学里最难以解释又最有趣的部分。数学的魔法在此发生。 许多数据科学问题看起来是这种形式,或者可以被组织成这种形式。这是最简单也最常提到的数据科学问题。几个典型的例子: 这名顾客会不会继续订阅? 这图片上是一只猫还是一只狗? 这名顾客会不会点击顶部链接? 无监督学习和增强学习的算法家族则有完全不同的数据科学问题。 数据是如何构成? 有关数据如何构成的问题属于无监督学习。有许多技术试图提炼数据的结构。 维度归约是另一种简化数据的方式,让数据能更容易传播,更快速计算,更容易存储。 在根本上,维度归约都是在创造一种描述数据点的简易方法。一个简单的例子是GPA学分绩点。 这里的优势是多数增强学习算法可以在没有数据的情况下开始工作。它们在运行中收集数据,从尝试和错误中学习。

    1.4K100发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    数据科学数据科学的教育体系

    数据科学领域里工作的人才需要具备两方面的素质:一是概念性的,主要是对模型的理解和运用;二是实践性的,主要是处理实际数据的能力。 总结一下,大数据的影响将主要来自以下几个方面。 首先是数据科学将成为科研体系中的重要部分,并逐渐达到与包括物理、化学、生命科学等学科在内的自然科学分庭抗礼的地位。 现在的物理学、化学、机械工程等学科,以及生命科学、材料科学、天体物理、地球科学等学科的大部分都是沿着这样一条主线展开的。另一条是以数据为主线。 数据科学的兴起,将极大地推动许多社会科学学科朝着量化的方向发展,使他们逐步由经验性的模式转变成科学性的模式。 如果做好了这一点,我们在数据科学领域就自然而然地走到了世界的前沿。 来源:大数据栋察

    81270发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    数据科学数据科学中隐藏的数据智慧

    数据智慧”一词是我对应用统计学核心部分的重新定义。这些核心部分在伟大的统计学家(或者说是数据科学家)John W. Tukey 和 Geogre Box 的文章中有详细阐述。 这样一个有信息量的名称可以使人们意识到应用统计作为数据科学一部分的重要性。 “数 据智慧“是数学、自然科学和人文主义这三方面能力的融合,是科学和艺术的结合。在缺乏有实践经验者的指导下,个人很难仅仅靠从读书中获得“数据智慧”, 想要学习它的最好方法就是和拥有它的人一起共事。 1.要回答的问题 数 据科学的问题最开始往往来自于统计学或者数据科学以外的学科。例如,神经科学中的一个问题:大脑是如何工作的?或银行业中的一个问题:该对哪组顾客推广新 服务? 而这种交流对于数据科学项目的成功是必不可少的。在有充足数据来源的情况下,经常发生情况的是在数据收集前要回答的问题还没有被精确定义。

    1K50发布于 2018-02-28
  • 来自专栏用户画像

    数据科学

    https://blog.csdn.net/jxq0816/article/details/82823331 数据科学:如何从实际的生活中提取数据,然后利用计算机的运算能力和模型算法从这些数据中找出一些有价值的内容 1、数据科学在工程上的挑战可以大致分为3类:特征提取、矩阵运算和分布式机器学习。 (1)一个建模项目的成功很大程度上依赖于建模前期的特征提取。它包含数据清洗、数据整合、变量归一化等。 经过处理后,原本搅作一团的原始数据将被转换为能被模型使用的特征。这些工作需要大量的自动化程序来处理,特别是面向大数据时,因为这些大数据无法靠“人眼”来检查。 2、模型搭建的挑战 数据科学对模型搭建的要求也可以总结为3点:模型预测效果好、模型参数是稳定且“正确”的、模型结果容易解释。 (1)模型的预测效果好,这是数据科学成功的关键。 (3)数据科学家将模型搭建好了,并不是一个数据科学项目的终点。为了充分发挥数据的价值,需要将模型结果应用到实际的生产中,参与这个过程的不仅有懂模型的数据科学家,还有更多非技术的业务人员。

    63720发布于 2018-09-29
  • 来自专栏数据科学与人工智能

    数据科学】教你成为数据科学“大咖”!

    以往高等学府才能接触到的计算机科学数据科学,也随着这次风潮来到了公众面前。OSDSM,即数据科学开源课程,能够从理论和技术两方面,帮助人们学习有效利用数据的核心技能。 二、学习数据科学的动力 现在数据科学家岗位面临极大的缺口。所谓数据科学家,就是同时掌握统计学 知识与程序设计技巧,能够服务大数据开发的技术专家。成为一名数据科学家,就有了大数据时代互联网行业的通行证。 一名数据科学家所需的核心能力——好奇、聪明,能进行流畅的数据分析,有研究的耐心,有严谨的科学态度,对事物持普遍怀疑态度(这些都是将数据科学家从其他人中区分出来的特质)——是所有行业的人中广泛具有的。 数据科学的平台和工具正通过开源得到了极大丰富,大数据时代的数据科学家也通过开源不断增加。 此外,还有另一项趋势可以缓解现在的人才缺口:数据科学民主化。 四、从这里开始:数据科学的课程表 这些数据科学的开源课程,从数学、编程等几个方面塑造数据科学“大咖”。这不是为了重温大学课程,而是以问题导向准备知识。

    1.4K40发布于 2018-02-28
  • 来自专栏数据科学与人工智能

    数据科学数据科学中的 Spark 入门

    Apache Spark 为数据科学提供了许多有价值的工具。 随着 Apache Spark 1.3.1 技术预览版的发布,强大的 Data Frame API 也可以在 HDP 上使用数据科学家使用数据挖掘和可视化来帮助构造问题架构并对学习进行微调。 我们将通过一系列的博客文章来描述如何结合使用 Zeppelin、Spark SQL 和 MLLib 来使探索性数据科学简单化。 总结 数据科学家们使用许多种工具进行工作。Zeppelin 为他们提供了一个新工具来构建出更好的问题。 在下一篇文章中,我们将深入讨论一个具体的数据科学问题,并展示如何使用 Zeppelin、Spark SQL 和 MLLib 来创建一个使用 HDP、Spark 和 Zeppelin 的数据科学项目。

    1.9K60发布于 2018-02-26
  • 来自专栏PPV课数据科学社区

    【推荐】数据科学家与数据科学

    一、数据科学家的起源 "数据科学"(DataScience)起初叫"datalogy"。 Jeff Wu做出题为“统计学=数据科学吗?的演讲,建议统计改名数据科学统计数据科学家。 2002年,国际科学理事会:数据委员会科学和技术(CODATA)开始出版数据科学杂志。 2003年,美国哥伦比亚大学开始发布数据科学杂志,主要内容涵盖统计方法和定量研究中的应用。 二、数据科学家的定义 数据科学(Data Science)是从数据中提取知识的研究,关键是科学数据科学并不局限于大数据,但是数据量的扩大诚然使得数据科学的地位越发重要。 数据科学的从业者被称为数据科学家。数据科学家通过精深的专业知识在某些科学学科解决复杂的数据问题。

    89960发布于 2018-04-20
  • 来自专栏数据科学与人工智能

    数据科学数据科学的整合与细分

    自从大数据这个词出来以后,数据已经成为一个非常明确的科学领域。在这当中很少有人详细地探讨数据科学的结构和它面临的问题,包括我们行业面临的问题。 数据科学有三个非常重要的层次:数据的获取、数据的描述和数据的分析,这三件事是不同的,不要把它混淆了。 1.数据的获取 ? 以前数据的稀缺导致行业内出现非常大的非良性循环。 ? ? 而在这个时候,机器化数据出来的东西做点频率表,做点交互表很简单。如果数据描述能够替代数据分析,这个世界一定会毁掉,因为数据想骗人太容易了。 ? 数据不再稀缺,你在机器化数据面前,你填数的过程当中,数据的真假还在存疑,这时候你不败谁败,必然败。 而且别忘了机器化数据的成本趋近于零,所以大中型研究公司的解体、兼并、重组在不远的将来一定会频现,这是没有办法的趋势。 ? 现在数据科学有七大危险趋势: ? ? ? ? ? ? ?

    1.1K80发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    数据科学】需求高涨的数据科学

    数据科学(data science)是一个很久之前就存在的词汇,但数据科学家(data scientist)却是几年前突然出现的一个新词。 数据科学家所需的技能 数据科学家这一职业并没有固定的定义,但大体上指的是这样的人才。 (1) 计算机科学 一般来说,数据科学家大多要求具备编程、计算机科学相关的专业背景。简单来说,就是对处理大数据所必需的Hadoop、Mahout等大规模并行处理技术与机器学习相关的技能。 Facebook对数据科学家的招聘信息 Facebook计划为数据科学团队招聘数据科学家。应聘该岗位的人,将担任软件工程师、量化研究员的工作。 数据科学家与商业智能专家之间的区别在于,从包括公司外部数据在内的数据获取阶段,一直到基于数据最终产生业务上的决策,数据科学家大多会贯穿数据的整个生命周期。

    1.2K80发布于 2018-02-27
  • 来自专栏数据科学人工智能

    数据科学通识第二讲:数据科学

    视频内容 1 什么是数据科学 数据科学是一门交叉学科,主要研究如何利用科学的方法、过程、算法或系统,从结构化的或非结构化的数据中提炼知识、洞察规律、获得见解。 信用风险评估是一个运用数据科学来帮助金融企业进行决策的典型案例。 2 数据科学的基本内涵 数据科学的基本内涵有两层意思:用数据的方法研究科学和用科学的方法研究数据。 在如今这个数据爆炸的时代,数据驱动来推进相关原理和方法发现的科学研究方法被称为科学研究的第四范式,比如生物信息学、天体信息学等等。 数据科学基本内涵的第二层意思,是指用科学的方法研究数据。 这就是数据科学的另一层含义,用科学的方法研究数据。 2.1 数据的方法研究科学 科学研究的第四范式也称作数据密集型科学。 2.2 科学的方法研究数据科学的方法研究数据数据科学的另一层内涵,它的意思是指数据科学在数学、统计学、计算机科学的多学科的支撑下,从数据采集、数据管理、数据治理、数据分析、数据可视化、数据伦理等众多的方面来开展科学的研究

    1.1K40发布于 2020-04-21
  • 来自专栏数据科学与人工智能

    数据科学数据科学岗位工作面试指南

    结束 Galvanize 全栈专业和数据科学专业课程的学习后,我们的学生将接受面试辅导和实践,经过简历筛选之后介绍给合作伙伴公司。 一个数据科学专业的毕业生 Greg Kamradt 讨论了他个人在求职面试过程中遇到的挑战和成功之处。 因为市场上对数据科学家有非常高的需求(而且需求逐年增长),潜在的就业者可能会遇到众多的面试机会。 考虑其他可供选择的数据科学行业 关注类似 Hacker News 的热门招聘网站 目标:编制一个巨大的公司名单,然后再逐步精简名单 2.为自己和面试官提供便利 给自己设计一个能引起面试官或技术人员注意的说辞 为什么选择我们部门的数据分析工作? 当你面试的时候,不要期望天上掉下馅饼。这也是为什么在面试过程中投入时间、精力是如此的重要。你要确保自己是符合资格的,准备好并展示你的技能吧!

    64870发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    数据科学数据科学岗位工作面试指南

    结束 Galvanize 全栈专业和数据科学专业课程的学习后,我们的学生将接受面试辅导和实践,经过简历筛选之后介绍给合作伙伴公司。 一个数据科学专业的毕业生 Greg Kamradt 讨论了他个人在求职面试过程中遇到的挑战和成功之处。 因为市场上对数据科学家有非常高的需求(而且需求逐年增长),潜在的就业者可能会遇到众多的面试机会。 考虑其他可供选择的数据科学行业 关注类似 Hacker News 的热门招聘网站 目标:编制一个巨大的公司名单,然后再逐步精简名单 2.为自己和面试官提供便利 给自己设计一个能引起面试官或技术人员注意的说辞 为什么选择我们部门的数据分析工作? 当你面试的时候,不要期望天上掉下馅饼。这也是为什么在面试过程中投入时间、精力是如此的重要。你要确保自己是符合资格的,准备好并展示你的技能吧!

    71050发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    数据科学|数据科学中的信息理论方法

    在这里,我们打算探索这个界面的现代应用,这些应用正在塑造21世纪的数据科学。 当然,标准信息理论工具与信号处理或数据分析方法之间有一些显著的差异。 这本书的目的是为新兴的数据科学问题的信息理论方法的最近的应用提供一个综述。 本书的潜在读者可能是信息理论、信号处理、机器学习、统计学、应用数学、计算机科学或相关研究领域的研究人员,或寻求了解信息理论和数据科学并在此界面上找出开放问题的研究生。 这本书包含了16个不同的章节,由世界范围内公认的领先专家撰写,涵盖了信号处理、数据科学和信息论界面上的各种各样的主题。本书以信息理论的介绍作为其余章节的背景开始,也设置了贯穿全书使用的符号。 最后一章,第16章,通过对范诺不等式在一系列数据科学问题中的调研,将本书的几个主题联系起来。章节是独立的,涵盖了各自主题的最新研究结果,并且可以彼此独立地处理。

    59720编辑于 2022-12-22
  • 来自专栏数据科学与人工智能

    数据科学家】揭秘数据科学

    在《大数据研究的科学价值》一文中,中国工程院李国杰院士相信数据界存在普适的共性问题,比如电网数据分析的算法也可应用于供水和交通管理上。李国杰给出的结论是肯定的:数据科学就是关于数据科学。 “数据科学家”这个新称谓近两年才被叫响。大数据数据科学家有着千丝万缕的联系,因此容易让人产生一种错觉,数据科学家是大数据时代特有的一类专才。 但其实在传统的结构化数据处理过程中,数据科学家的身影就已经出现。记者最近采访了一些中国的大数据企业,其中很多企业并没有设立数据科学家这一职位,但数据分析师、数据工程师等都在做着数据科学家的工作。 尽管大数据项目的实施在没有数据科学家的情况下也能够成功地完成,但有鉴于数据科学家将成为大数据项目的工具、系统和输出的最终用户,数据科学家在大数据项目的计划阶段至关重要。 自己培养数据科学家 在品友互动其实并没有数据科学家这个职位,有的只是算法工程师、数据工程师等,他们从事的是数据科学家的工作。

    1.4K100发布于 2018-02-27
  • 来自专栏AI研习社

    数据科学进阶之路:了解数据科学工作,管理数据科学家团队

    雷锋网 AI 研习社按:本篇是来自 Schibsted 多媒体组的数据科学经理 Alex 发布于 Medium 上的一篇文章,作者结合自身四年的行业经验,详细介绍了实际的数据科学工作,以及如何管理好数据科学团队 2014 年我加入 Schibsted 传媒集团的一个小团队,当时是第六位数据科学家。这些年,我在这家公司研究了许多数据科学方法,目前该公司已经有 40 多名数据科学家了。 我希望能为世界各地的数据科学家和数据科学管理人员提供同样有价值的思考。 这篇文章分为两部分: 第一部分:数据科学家的实际工作 第二部分:如何管理数据科学家团队 第一部分着重于描述数据科学家要做的实际工作,而第二部分则讨论如何管理数据科学团队以获得最大的影响力。 希望这篇文章对作为数据科学家或者是数据科学经理的你能有所帮助。

    55410发布于 2018-07-26
  • 来自专栏超级架构师

    数据科学难题,怎么解释到底什么是数据科学

    然而,今天,数据挖掘似乎被分割为机器学习和数据科学本身之间的概念。如果要支持上述解释,那么数据挖掘就是一个过程,那么将数据科学视为数据挖掘的超集以及后续术语是有意义的。 ? 数据科学 那么,在讨论了这些相关概念及其在数据科学中的位置之后,究竟什么是数据科学?对我而言,这是试图精确定义的最艰难的概念。 数据科学既是数据挖掘的同义词,也是包含数据挖掘的概念的超集。 数据科学产生各种不同的结果,但它们都有共同的洞察力。 我还建议它也主要与Drew Conway的数据科学维恩图一致,尽管我会补充一点:我相信他非常合理且有用的图形实际上指的是数据科学家,而不是数据科学。 这可能是分裂的头发,但我不认为{field |纪律|数据科学本身的概念包括黑客技能;我相信这是科学家们拥有的一项技能,以便能够进行数据科学研究。

    79230发布于 2018-10-23
领券