首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏数据科学与人工智能

    数据科学家】揭秘数据科学家

    数据科学家”这个新称谓近两年才被叫响。大数据数据科学家有着千丝万缕的联系,因此容易让人产生一种错觉,数据科学家是大数据时代特有的一类专才。 但其实在传统的结构化数据处理过程中,数据科学家的身影就已经出现。记者最近采访了一些中国的大数据企业,其中很多企业并没有设立数据科学家这一职位,但数据分析师、数据工程师等都在做着数据科学家的工作。 尽管大数据项目的实施在没有数据科学家的情况下也能够成功地完成,但有鉴于数据科学家将成为大数据项目的工具、系统和输出的最终用户,数据科学家在大数据项目的计划阶段至关重要。 数据科学家与传统的从事数据处理工作的数据库分析师、数据分析师有何区别呢? “数据库工程师有很多种,有些人的工作与数据科学家相关。‘数据科学家’虽然是一个新名词,但是从事数据分析工作的人一直存在。 自己培养数据科学家 在品友互动其实并没有数据科学家这个职位,有的只是算法工程师、数据工程师等,他们从事的是数据科学家的工作。

    1.4K100发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    数据科学家数据科学家修炼之路

    经常有人问我“要成为数据挖掘工程师或者数据科学家应该读什么书?”类似的问题。下面是一份建议书单,同时也是成为数据科学家的指南,当然,这不包括取得合适大学学位的要求。 在深入探讨之前,数据科学家似乎需要掌握许多技巧,如:统计学、编程、数据库、演讲技巧、数据清理与变换知识。 ? 理想情况下,你需要具备以下技能: 了解统计学与数据预处理知识。 理解统计陷阱。 数据预处理 我必须再次强调确认并检查你数据的重要性。数据预处理除了能将数据转换成算法更易识别或处理的模式还能防止将输入数据错误。 信息提取与文本分析是数据科学家需要掌握的重要技能。 结语 最后,这里还有一些数据科学家不该错过的书籍: Data Mining and Statistics for Decision Making by Stéphane Tufféry (A personal

    1.1K100发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    数据科学家】LInkedin数据科学家如何工作

    在互联网企业中,LinkedIn是一家出了名的“慢公司”,但LinkedIn也是最成功的社交网络,用户品质、广告价值都是行业翘楚,秘密在于LinkedIn有一个高效的数据科学家团队。 为什么人们现在如此的关心统计和数据,为什么数据科学家成了最性感的工作, 最近,在TiE的峰会上, LinkedIn的首席数据科学家Manu Sharma 接受了采访, 揭秘了LinkedIn的数据分析的工作 数据科学家需要具备好奇心和直觉。 他们需要想的问题是:我能用这些数据来做什么呢? 我需要问什么样的问题?这些数据能告诉我什么? 他们还需要足够的直觉来了解他们所采用方法的局限性。 数据科学家的工作包括, 采集数据, 整理数据, 建立正确的模型, 测试模型, 还要有一定的编程能力。 一个数据科学家需要具备这些技能, 而这些技能也是一个初创企业在建立它的数据科学家团队所需要的技能。 问: LinkedIn数据应用的重点是那几个方面?

    76490发布于 2018-02-27
  • 来自专栏博文视点Broadview

    数据科学家 VS 真数据科学家

    管理决策层在搭建其数据科学家团队时,有时也不是很清楚他们想要的到底是什么。他们往往最终招募的是很纯粹的技术极客、计算机科学家,或者缺乏恰当大数据经验的人。 事实上,你可以成为一名真正的数据科学家,且不需要掌握这些技能。NoSQL和MapReduce不是新概念——在这些关键词被创建之前,就有很多人接触到它们。 成为一名数据科学家,你需要以下能力。 数据科学家在商业分析、统计学和计算机科学等领域也是通才,比如会掌握这些专业知识:健壮性、实验设计、算法复杂度、仪表盘和数据可视化。 一些数据科学家也是数据策略师——他们可以开发数据收集策略,并使用数据来发现可操作的、能对商业产生影响的见解。这就要求数据科学家具有创造性,能根据业务要求,制定分析、提出解决方案。 本文选自《数据天才:数据科学家修炼之道》

    67920发布于 2020-06-11
  • 来自专栏数据科学与人工智能

    数据科学家】SparkR:数据科学家的新利器

    摘要:R是非常流行的数据统计分析和制图的语言及环境,有调查显示,R语言在数据科学家中使用的程度仅次于SQL,但大数据时代的海量数据处理对R构成了挑战。 摘要:R是数据科学家中最流行的编程语言和环境之一,在Spark中加入对R的支持是社区中较受关注的话题。 项目背景 R是非常流行的数据统计分析和制图的语言及环境,有一项调查显示,R语言在数据科学家中使用的程度仅次于SQL。 为了方便数据科学家使用Spark进行数据挖掘,社区持续往Spark中加入吸引数据科学家的各种特性,例如0.7.0版本中加入的python API (PySpark);1.3版本中加入的DataFrame 工欲善其事,必先利其器,SparkR必将成为数据科学家在大数据时代的又一门新利器。 (责编/仲浩) 作者:孙锐,英特尔大数据团队工程师,HIVE和Shark项目贡献者,SparkR主力贡献者之一。

    4.3K100发布于 2018-02-27
  • 来自专栏大数据杂货铺

    谁是数据科学家

    他/她是否整日忙于数据或在他/她的实验室中尝试复杂的数学?毕竟,“谁是数据科学家”? Ť 这里有对数据科学家提供了一些定义。简而言之,数据科学家就是实践数据科学艺术的人。 数据科学家是业务分析师还是数据分析师,两者有所不同! 尽管所有这些学科的初始培训或基本要求都是相似的,但数据科学家需要: ? 当今的数据科学家面临的主要挑战不是找到现有业务问题的解决方案,而是确定对组织及其成功至关重要的问题。 为什么数据科学家被称为“数据科学家”? 数据科学家的作用确实是具有挑战性的!尽管数据科学家使用的技能和能力差异很大,但要成为一名高效的数据科学家,他应该: 1. 数据科学家就像网站管理员一样,不仅需要成为所有行业的杰作,而且还需要掌握以上领域中的至少一个。 数据科学家做什么呢? 数据科学家扮演着双重角色-“分析师”和“艺术家”!

    65810发布于 2020-02-11
  • 来自专栏数据科学与人工智能

    数据科学家】如何成为一名数据科学家

    关于数据科学家的更多讨论: 你能列出十个著名的女性数据科学家吗?Can you name 10 famous data scientist women? 谁是最富有的数据科学家数据科学并不局限于大数据,但是数据量的扩大诚然使得数据科学的地位越发重要。 数据科学的从业者被称为数据科学家数据科学家通过精深的专业知识在某些科学学科解决复杂的数据问题。 林仕鼎,百度大数据首席架构师 如果从广义的角度讲,从事数据处理、加工、分析等工作的数据科学家数据架构师和数据工程师都可以笼统地称为数据科学家;而从狭义的角度讲,那些具有数据分析能力,精通各类算法,直接处理数据的人员才可以称为数据科学家 Patil(美国科学促进会科学与技术政策研究员,为美国国防部服务)的话来总结数据科学家需要具备的能力: 数据科学家倾向于用探索数据的方式来看待周围的世界。 (决策力) 三、数据科学家所需硬件技能 (1) 计算机科学 一般来说,数据科学家大多要求具备编程、计算机科学相关的专业背景。

    94060发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    数据科学家】九个成为数据科学家的必备技能

    本文详细列举了从雇主角度看来,数据科学家加强自身市场竞争力所必备的9个数据科学技能。 过去一年中人们对数据科学的兴趣骤然增长。 技术技能:分析学 1 教育 数据科学家受教育程度都很高,其中88%至少拥有硕士学位,46%有博士学位。虽然有一些名人特例,不过通常来说成为一名数据科学家需要扎实的教育背景,才能掌握所需的深度知识。 6 非结构化数据 数据科学家能够处理非结构化数据这一点非常重要,无论这些数据是来自社交媒体、视频源或者音频的。 非技术类技能 7 求知欲 毫无疑问最近到处都能看到这个词,尤其是在与数据科学家关联时。 网上有很多资源,不过笔者不希望让读者产生这样的错觉——成为数据科学家非常简单,上几节MOOCs就够了。除非你有扎实的定量经验,否则成为数据科学家之路还是颇有挑战的——但也并非不可能。 8 Burtch Works研究:关于数据科学家的薪金,如果想要了解更多信息与当前数据科学家人数统计的话,请下载我们的数据科学家薪金研究报告。

    793100发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    数据科学家】9步让你从菜鸟成为数据科学家

    由于数据科学和数据分析是个快速发展的领域,当前的合格申请者严重缺乏。这使得数据科学家对于那些有兴趣,并寻找新的职业生涯的人成为有前途的和有利可图的领域。 员工:当然,我还能把它们相乘 但如何能成为一个数据科学家呢? 首先,各个公司对数据科学家的定义各不相同,当前还没有统一的定义。 因此,排除一个数据科学的学位计划(世界各地的著名大学雨后春笋般的出现着),你需要采取什么措施,成为一个数据科学家数据清理有助于消除重复和“坏”数据。两者都是数据科学家工具箱中的必备工具。 8 练习 在你在新的领域有一个工作之前,你如何练习成为数据科学家?使用开源代码开发一个你喜欢的项目、参加比赛、成为网络工作数据科学家、参加训练营、志愿者或实习生。

    71050发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    数据科学家数据科学家的八大关键技能

    人们最常见的偏见就是,认为统计学家就是数据科学家或者具有分析背景的商务智能专家会是一个好的数据科学家。也许在某些情况下这是正确的,但也有例外。 那么,成为真正的数据学家(DS)需要具备怎样的技能呢? 商业智能专业知识:并不一定要成为一个商业智能专家,但是一个数据科学家需要知道如何抽取,清洗,转换,分析和报告数据数据科学家并不是ETL开发者,但他/她可以与ETL开发者交流,并了解他的术语和行动。 数据科学家需要推动这一迭代过程。此外,数据科学家还需要将分析结果呈现出来。为此,需要良好的故事叙述能力。 6. 好奇心:根据分析的业务/主题,数据科学家可能不是此领域的专家。 好奇心与数据科学技术,工具和科技有同等地位。 7. 创造力:数据科学家需要在上述所有技能中使用大量的工具和技术。为了做到这一点,数据科学家在如何使用这些工具和技术方面应该发挥创造力。 如果一个案例只需要线性回归和条形图,那么数据科学家不应该过度设计它。数据科学家需要提供的是信息的洞察力和增值信息,而不是重新创造世界。

    78960发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    数据科学】数据科学家数据科学

    关于数据科学家的更多讨论: 你能列出十个著名的女性数据科学家吗?Can you name 10 famous data scientist women? 谁是最富有的数据科学家数据科学并不局限于大数据,但是数据量的扩大诚然使得数据科学的地位越发重要。 数据科学的从业者被称为数据科学家数据科学家通过精深的专业知识在某些科学学科解决复杂的数据问题。 不远的将来,数据科学家们需要精通一门、两门甚至多门学科,同时使用数学,统计学和计算机科学的生产要素展开工作。所以数据科学家就如同一个team。 如果从广义的角度讲,从事数据处理、加工、分析等工作的数据科学家数据架构师和数据工程师都可以笼统地称为数据科学家;而从狭义的角度讲,那些具有数据分析能力,精通各类算法,直接处理数据的人员才可以称为数据科学家 Patil(美国科学促进会科学与技术政策研究员,为美国国防部服务)的话来总结数据科学家需要具备的能力: 数据科学家倾向于用探索数据的方式来看待周围的世界。

    1.4K90发布于 2018-02-26
  • 来自专栏CDA数据分析师

    数据科学家修炼指南

    Software engineer’s guide to getting started with data science 数据科学家修炼指南 December 30, 2012 By prasoonsharma GETTING STARTED 开始 a) Self-learning (2 - 4 months) 自学(2-4个月) Explore if data science is for you 看看数据科学家是不是适合你 如果你对于国家经济、犯罪统计、体育比赛数据有疑问,那赶紧找来这些数据并且开始解决你的问题。 我很幸运能接触到内外部的数据科学大牛们。他们真的让我了解数据科学问题从何下手(如何思考,假想,验证/解决/否定问题)。 从他们身上,我真的理解了 “假想是数据分析的驱动力”,而不是“数据分析靠一拍脑袋”。就是说在试图从数据中分析出有用结果之前,一定要充分理解商业领域那些事儿。

    1K60发布于 2018-02-05
  • 来自专栏猴子数据分析

    如何成为数据科学家

    这是国外数据科学学习平台DataCamp成员写的一篇图文 8步 成为数据科学家。我们具体来看下有哪些学习内容和学习资源。 这里说的8步,不是你用8周就可以完成,而是一种学习的方法。 首先,什么是大数据科学家数据科学家是一个跨学科人才,是比软件工程师更擅长统计学,比统计学家更擅长软件工程的人。需要掌握的知识有数学统计,编程能力,机器学习,研究能力等。 目前,数据科学家大部分是本科或者硕士学历(本科37%,硕士31%)。但是不要担心,从调查数据来看,有5%高中毕业的人也成为了数据科学家。这足以证明,只要你努力去提供自己,英雄是不问出处的。 商业智能(BI)​www.zhihu.com 第5步:提升到大数据级别 当你开始处理海量规模的数据时,绝大多数的数据科学家要解决的问题,都无法在单机上完成,需要用分布式处理大数据集,使用的工具有Hadoop 如何自己找数据分析项目来做?​www.zhihu.com 第7步:实习、实战、或找份工作 判别自己是不是一个真正的数据科学家的最佳途径,就是用你新学的知识迎难而上,进入数据分析的工作领域。

    93730发布于 2021-03-15
  • 来自专栏技术沉淀

    数据科学家的RoadMap

    RoadMap.jpg 资料来源

    85870发布于 2018-06-21
  • 来自专栏数据科学与人工智能

    数据科学家数据大师Olivier Grisel给志向高远的数据科学家的指引

    今天,Olivier深入到技术层面进行探讨,他回答了数据科学初学者提出的所有问题。 不要等待,数据科学从现在开始! OG:一个很好的规则就是根据你最终必需处理的数据量来抉择,当然还要把未来数据的增量考虑进去。最近,一台配置很好的机器可以有上百G的RAM。当然,原始数据集可能比这更大。 一旦你提取了特征并将其转为数值表,你就可以得到更小的数据集,那样你就可以在内存中处理数据并使用scikit-learn运行预测模型。 大数据基础设施的挑战 FD:人们开始考虑如何管理大量的数据,对于如何得到一个很好的衡量标准,你的建议是什么呢? OG:在你开始做机器学习之前,从一个基本模型开始很重要。 子样本总归还是好的,回到小数据世界能确保你遵循正确的方法。 事实上,你也应该这样做,这样你就可以确保当你向你的样本添加更多的数据时,实际上你是在提高你的模型性能。这有利于检查。

    81080发布于 2018-02-27
  • 来自专栏PPV课数据科学社区

    【推荐】数据科学家数据科学。

    Jeff Wu做出题为“统计学=数据科学吗?的演讲,建议统计改名数据的科学统计数据科学家。 关于数据科学家的更多讨论: 你能列出十个著名的女性数据科学家吗?Can you name 10famous data scientist women? 谁是最富有的数据科学家数据科学并不局限于大数据,但是数据量的扩大诚然使得数据科学的地位越发重要。 数据科学的从业者被称为数据科学家数据科学家通过精深的专业知识在某些科学学科解决复杂的数据问题。 如果从广义的角度讲,从事数据处理、加工、分析等工作的数据科学家数据架构师和数据工程师都可以笼统地称为数据科学家;而从狭义的角度讲,那些具有数据分析能力,精通各类算法,直接处理数据的人员才可以称为数据科学家 Patil(美国科学促进会科学与技术政策研究员,为美国国防部服务)的话来总结数据科学家需要具备的能力: · 数据科学家倾向于用探索数据的方式来看待周围的世界。

    90060发布于 2018-04-20
  • 来自专栏奇点大数据

    数据科学家节选(4)

    人们热衷于进行各种数据观测、拟合,希望对数据进行可期望的预判,这种行为究竟本质上是在做什么呢?从带有一定功利色彩的眼光来看,这实际上是一种趋利避害的过程。 在本书最开始的部分在对科学家的特征进行归纳的过程中其实已经明确过了,科学是测量的学科,是量化计算的学科,而且即便不具备突破性也需要精确性和体系性这两个最为基本的特性。 能够精确地量化地进行“应验”,而这个过程中对数据的观测、拟合,对于模型的归纳是在做什么呢?调整的最终目的是为了让模型所表达的“体系”和观测的现象一致。

    47870发布于 2018-04-11
  • 来自专栏数据科学与人工智能

    数据科学家数据工程师

    As the field of data science continues to grow and mature, it is nice to begin seeing some distinction in the roles of a data scientist. A new job title gaining popularity is the data engineer. In this post, I lay out some of the distinctions between the 2

    87350发布于 2018-02-28
  • 来自专栏PPV课数据科学社区

    数据科学家养成记:成为数据科学家八步走

    但如何能成为一个数据科学家呢? 首先,各个公司对数据科学家的定义各不相同,当前还没有统一的定义。 但在一般情况下 ,一个数据科学家结合了软件工程师与统计学家的综合技能,并且在他或者他希望工作的领域拥有大量的行业知识和经验。 ? 一个好的数据科学家必须能够理解数据告诉你的内容,做 到这一点,你必须有扎实的基本线性代数,对算法和统计技能的理解。在某些特定场合可能需要高等数学,但这是一个好的开始场合。 在你在新的领域有一个工作之前,你如何练习成为数据科学家?使用开源代码 开发一个你喜欢的项目、参加比赛、成为网络工作数据科学家、参加训练营、志愿者或实 习生。 目前,PPV课已开通数据科学家栏目,并且每日为大家带来大数据行业最新最干货的内容,欢迎大家关注微信公众号(ppvke123)。

    1.1K80发布于 2018-04-20
  • 来自专栏奇点大数据

    数据科学家节选(2)

    【节选自即将由电子工业出版社出版的《数据科学家养成手册》第二章】 科学之科 在中国古汉语体系中多为单字词,所以大家想想也能猜得出“科学”一词其实并非中国所发明。 的确,“科学”是个舶来的词汇。 科学是一种泛指的领域,数据科学、计算机科学、社会科学、经济科学、语言科学、生物科学等等,这些各领域的科学各自有各自的体系和规范以及认知特性。这些都是小的,窄而深的认知领域。

    76480发布于 2018-04-10
领券