首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏数据科学与人工智能

    数据科学家】揭秘数据科学家

    数据科学家”这个新称谓近两年才被叫响。大数据数据科学家有着千丝万缕的联系,因此容易让人产生一种错觉,数据科学家是大数据时代特有的一类专才。 但其实在传统的结构化数据处理过程中,数据科学家的身影就已经出现。记者最近采访了一些中国的大数据企业,其中很多企业并没有设立数据科学家这一职位,但数据分析师、数据工程师等都在做着数据科学家的工作。 尽管大数据项目的实施在没有数据科学家的情况下也能够成功地完成,但有鉴于数据科学家将成为大数据项目的工具、系统和输出的最终用户,数据科学家在大数据项目的计划阶段至关重要。 数据科学家与传统的从事数据处理工作的数据库分析师、数据分析师有何区别呢? “数据库工程师有很多种,有些人的工作与数据科学家相关。‘数据科学家’虽然是一个新名词,但是从事数据分析工作的人一直存在。 自己培养数据科学家 在品友互动其实并没有数据科学家这个职位,有的只是算法工程师、数据工程师等,他们从事的是数据科学家的工作。

    1.4K100发布于 2018-02-27
  • 来自专栏SeanCheney的专栏

    数据科学家访谈录》总结·3

    统计学的重要性 “数据科学里很重要的一块是对统计学的训练。从根本上来说,“数据科学”这个名词意味着你是一个科学家,而科学家有责任和义务去做出正确结果。 职业经历:Dynaptics,JRG Software,财务软件公司Intuit的资深数据科学家&数据创新领袖。 (注:从姓氏判断,George因该是希腊裔) ? 数据科学家的技术列表中大概包括了统计学、机器学习、SQL和Hadoop,以及一门类似Java一类的主流编程语言。 概括来说,一个数据科学项目的目的是提高某一项现存的商业流程的利润效率。 一名成功的数据科学家应该具备什么? 一名成功的数据科学家应该有能力去改变他周边的世界。 未来数据科学的走向是怎样的? ) 卓越的数据科学家与普通数据科学家之间的区别在哪里?

    85610发布于 2018-09-19
  • 来自专栏数据科学与人工智能

    数据科学家数据科学家修炼之路

    经常有人问我“要成为数据挖掘工程师或者数据科学家应该读什么书?”类似的问题。下面是一份建议书单,同时也是成为数据科学家的指南,当然,这不包括取得合适大学学位的要求。 在深入探讨之前,数据科学家似乎需要掌握许多技巧,如:统计学、编程、数据库、演讲技巧、数据清理与变换知识。 ? 理想情况下,你需要具备以下技能: 了解统计学与数据预处理知识。 理解统计陷阱。 数据预处理 我必须再次强调确认并检查你数据的重要性。数据预处理除了能将数据转换成算法更易识别或处理的模式还能防止将输入数据错误。 信息提取与文本分析是数据科学家需要掌握的重要技能。 结语 最后,这里还有一些数据科学家不该错过的书籍: Data Mining and Statistics for Decision Making by Stéphane Tufféry (A personal

    1.1K100发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    数据科学家】LInkedin数据科学家如何工作

    为什么人们现在如此的关心统计和数据,为什么数据科学家成了最性感的工作, 最近,在TiE的峰会上, LinkedIn的首席数据科学家Manu Sharma 接受了采访, 揭秘了LinkedIn的数据分析的工作 数据科学家的工作包括, 采集数据, 整理数据, 建立正确的模型, 测试模型, 还要有一定的编程能力。 一个数据科学家需要具备这些技能, 而这些技能也是一个初创企业在建立它的数据科学家团队所需要的技能。 问: LinkedIn数据应用的重点是那几个方面? 答:LinkedIn的数据应用主要在三个方面: 1. 开发创新的数据产品 2. 从内部数据发现趋势和机会 3. 推动业务成长 比如”推理算法”被用来根据用户的数据进行一些信息的推测。 所以,在美国总统经济政策报告里, 这些数据也会被采用。 这些数据同样的对企业的发展也很重要。 问:数据分析最佳实践的原则是什么? 答: 1. 数据量越大越好 2. 原始数据比加工数据3.

    76490发布于 2018-02-27
  • 来自专栏博文视点Broadview

    数据科学家 VS 真数据科学家

    管理决策层在搭建其数据科学家团队时,有时也不是很清楚他们想要的到底是什么。他们往往最终招募的是很纯粹的技术极客、计算机科学家,或者缺乏恰当大数据经验的人。 事实上,你可以成为一名真正的数据科学家,且不需要掌握这些技能。NoSQL和MapReduce不是新概念——在这些关键词被创建之前,就有很多人接触到它们。 成为一名数据科学家,你需要以下能力。 一些数据科学家也是数据策略师——他们可以开发数据收集策略,并使用数据来发现可操作的、能对商业产生影响的见解。这就要求数据科学家具有创造性,能根据业务要求,制定分析、提出解决方案。 现代数据也有很大的不同,已经被描述为3个V:速度(velocity)(实时、快速流动)、多样化(variety)(结构化、非结构化,如微博内容)和大数据量(volume)。 本文选自《数据天才:数据科学家修炼之道》

    68420发布于 2020-06-11
  • 来自专栏数据科学与人工智能

    数据科学家】SparkR:数据科学家的新利器

    摘要:R是非常流行的数据统计分析和制图的语言及环境,有调查显示,R语言在数据科学家中使用的程度仅次于SQL,但大数据时代的海量数据处理对R构成了挑战。 摘要:R是数据科学家中最流行的编程语言和环境之一,在Spark中加入对R的支持是社区中较受关注的话题。 项目背景 R是非常流行的数据统计分析和制图的语言及环境,有一项调查显示,R语言在数据科学家中使用的程度仅次于SQL。 为了方便数据科学家使用Spark进行数据挖掘,社区持续往Spark中加入吸引数据科学家的各种特性,例如0.7.0版本中加入的python API (PySpark);1.3版本中加入的DataFrame 工欲善其事,必先利其器,SparkR必将成为数据科学家在大数据时代的又一门新利器。 (责编/仲浩) 作者:孙锐,英特尔大数据团队工程师,HIVE和Shark项目贡献者,SparkR主力贡献者之一。

    4.3K100发布于 2018-02-27
  • 来自专栏CDA数据分析师

    初级数据科学家求职时的 3 大必备能力

    对我而言,在招募初级数据科学家时,我希望在他们身上发现这些特质: 1. 拥有自主学习的动力和决心; 2. 掌握“足够的”编程基本原理; 3. 当目标和指标不明确或有时间限制时,知道如何去分析数据。 虽然数据科学家不需要能够构建完美的系统,但是在最近一次学术会议上数据科学家小组一致认为,他们需要写出“大约 500 行相干代码”。这一重要的数量,远高于许多初级数据科学家的水平。 这就说明作为一名初级数据科学家已经掌握足够的编程知识,并且能够运用于实践。 3. 当目标和指标不明确且时间受限时分析数据。 ? 最后,一名出色的初级数据科学家需要能够独立完成分析,创建高质量工件并提出令人信服的见解。数据科学存在着模糊性。数据科学家常常需要处理复杂的数据源,伴随着模糊的目标和反馈环路这会导致错误的结论。 这当中例子就有数据科学家 David Robinson(尽管他水平远不止是初级数据科学家) 对特朗普用不同 Android 手机 和 iPhone 发上的推文进行分析。

    83670发布于 2018-02-26
  • 来自专栏大数据文摘

    3大技能助你成为超级数据科学家!(附链接)

    数据文摘授权转载自数据派THU 编译:张睿毅、王威力 好的数据科学家和超级数据科学家有什么区别? ? 实际上,数据科学家不可能具备以下所列的所有技能。但在我看来,正是这些技能使超级数据科学家超越优秀的数据科学家。 在这篇文章的最后,我希望您会发现这些技能对您作为一名数据科学家的职业生涯有帮助。 尽管如此,互联网上有很多资源可以让您开始学习R,比如Simplearn的数据科学培训和R编程语言。对于有抱负的数据科学家来说,这是一个很好的资源。 3. 熟悉诸如AmazonS3之类的云工具也是有益的。一项由Crowdflower开展的调查发现,LinkedIn中3490个数据科学工作岗位中49%的岗位将Apache Hadoop列为第二大重要技能。 作为一名数据科学家,您必须能够借助数据可视化工具(如ggplot、d3.js、matplotlib和tableau)实现数据可视化。这些工具将帮助您将项目中的复杂结果转换为易于理解的格式。

    57220发布于 2019-07-02
  • 来自专栏大数据杂货铺

    谁是数据科学家

    他/她是否整日忙于数据或在他/她的实验室中尝试复杂的数学?毕竟,“谁是数据科学家”? Ť 这里有对数据科学家提供了一些定义。简而言之,数据科学家就是实践数据科学艺术的人。 当今的数据科学家面临的主要挑战不是找到现有业务问题的解决方案,而是确定对组织及其成功至关重要的问题。 为什么数据科学家被称为“数据科学家”? 它涉及在逻辑上以及美学上以可呈现的形式修改和组合数据3.交付数据: 交付是叙述故事并获得价值的地方。它确保最终结果已经传递给相关人员。 数据科学家具备哪些技能? 数据科学家的作用确实是具有挑战性的!尽管数据科学家使用的技能和能力差异很大,但要成为一名高效的数据科学家,他应该: 1. 在创新地运用各种技术来提取数据并获得解决业务问题和挑战的有用见解方面,他非常有创新性和与众不同。 2. 有能力定位和解释丰富的数据源。 3.

    66110发布于 2020-02-11
  • 来自专栏数据科学与人工智能

    数据科学家】如何成为一名数据科学家

    关于数据科学家的更多讨论: 你能列出十个著名的女性数据科学家吗?Can you name 10 famous data scientist women? 谁是最富有的数据科学家? 林仕鼎,百度大数据首席架构师 如果从广义的角度讲,从事数据处理、加工、分析等工作的数据科学家数据架构师和数据工程师都可以笼统地称为数据科学家;而从狭义的角度讲,那些具有数据分析能力,精通各类算法,直接处理数据的人员才可以称为数据科学家 如何系统地学习数据挖掘? 做数据分析不得不看的书有哪些? 怎么学习用R语言进行数据挖掘? (3) 数据可视化(Visualization) 信息的质量很大程度上依赖于其表达方式。 (ETL(Extract、Transform、Load)、数据治理、管理责任、元数据) * 优化与启发(整数计划法、非线性计划法、局部探索法、超启发(模拟退火、遗传算法)) (3) 春学期 * 大数据分析 《大数据的冲击》. 城田真琴. 野村综合研究所创新开发部高级研究员、IT分析师,日本政府“智能云计算研究会”智囊团成员 [3].麦肯锡.

    94560发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    数据科学家】九个成为数据科学家的必备技能

    2 SAS软件与/或R语言 对其中至少一种分析工具有深入的了解,一般对数据科学来说R语言更好一些。 技术能力:计算机科学 3 语言要求 都是公司在招聘数据科学类角色时最常提出的语言要求。 熟悉类似Amazon S3这样的云工具也会很有优势。 6 非结构化数据 数据科学家能够处理非结构化数据这一点非常重要,无论这些数据是来自社交媒体、视频源或者音频的。 非技术类技能 7 求知欲 毫无疑问最近到处都能看到这个词,尤其是在与数据科学家关联时。 3 证书——KDnuggets编写了一个很长的列表清单。 4 Bootcamps——想要了解这种方式与学历项目或MOOCs的对比情况。 8 Burtch Works研究:关于数据科学家的薪金,如果想要了解更多信息与当前数据科学家人数统计的话,请下载我们的数据科学家薪金研究报告。

    795100发布于 2018-02-27
  • 来自专栏庄闪闪的R语言手册

    数据科学家的10个提示和技巧Vol.3

    原文:10 Tips And Tricks For Data Scientists Vol.3[1] 译者:赵西西 原博客简介:Predictive Hacks是与数据科学相关的一切的在线资源中心。 该博客由一群数据科学家所运营,专注于讲解在各种领域如何使用大数据技术(从机器学习和人工智能到业务领域)。 1 引言 前面已经介绍了一些数据分析的技巧,主要是用Python和R实现。 具体内容可见:翻译|给数据科学家的10个提示和技巧Vol.1;翻译|给数据科学家的10个提示和技巧Vol.1;翻译|记住一些常用的R包;翻译|R用于研究,Python用于生产。 If 2 or 3, then 1. df = pd.DataFrame({'A':[1,1,2,2,3,3], 'B':[1,2,3,1,2,3]}) df A B 0 1 1 1 1 2 2 2 3 3 2 1 4 3 2 5 3 3 首先根据映射函数创建字典,再对每一列应用applymap()函数: # 创建映射字典 d = {1 : 0, 2: 1, 3: 1}

    1.3K40发布于 2021-06-25
  • 来自专栏数据科学与人工智能

    数据科学家】9步让你从菜鸟成为数据科学家

    由于数据科学和数据分析是个快速发展的领域,当前的合格申请者严重缺乏。这使得数据科学家对于那些有兴趣,并寻找新的职业生涯的人成为有前途的和有利可图的领域。 员工:当然,我还能把它们相乘 但如何能成为一个数据科学家呢? 首先,各个公司对数据科学家的定义各不相同,当前还没有统一的定义。 3 学习代码 数据科学家必须知道如何调整代码,以便告诉计算机如何分析数据。从一个开放源码的语言如Python那里开始吧。 数据清理有助于消除重复和“坏”数据。两者都是数据科学家工具箱中的必备工具。 8 练习 在你在新的领域有一个工作之前,你如何练习成为数据科学家?使用开源代码开发一个你喜欢的项目、参加比赛、成为网络工作数据科学家、参加训练营、志愿者或实习生。

    71250发布于 2018-02-27
  • 来自专栏数据科学与人工智能

    数据科学家数据科学家的八大关键技能

    人们最常见的偏见就是,认为统计学家就是数据科学家或者具有分析背景的商务智能专家会是一个好的数据科学家。也许在某些情况下这是正确的,但也有例外。 那么,成为真正的数据学家(DS)需要具备怎样的技能呢? 3. 业务分析:一位数据科学家并不要求是一位业务分析师,但是他需要具有业务分析师的能力。在案例/项目之中,需要与企业用户深入探讨,以了解他们的需求。 数据科学家需要推动这一迭代过程。此外,数据科学家还需要将分析结果呈现出来。为此,需要良好的故事叙述能力。 6. 好奇心:根据分析的业务/主题,数据科学家可能不是此领域的专家。 好奇心与数据科学技术,工具和科技有同等地位。 7. 创造力:数据科学家需要在上述所有技能中使用大量的工具和技术。为了做到这一点,数据科学家在如何使用这些工具和技术方面应该发挥创造力。 如果一个案例只需要线性回归和条形图,那么数据科学家不应该过度设计它。数据科学家需要提供的是信息的洞察力和增值信息,而不是重新创造世界。

    79560发布于 2018-02-27
  • 来自专栏CDA数据分析师

    数据科学家修炼指南

    Software engineer’s guide to getting started with data science 数据科学家修炼指南 December 30, 2012 By prasoonsharma GETTING STARTED 开始 a) Self-learning (2 - 4 months) 自学(2-4个月) Explore if data science is for you 看看数据科学家是不是适合你 202 coursework is perfect for this 基础学习统计:Stats 202 是完美的选择 Learn a statistical tool: I spent 3 学个统计工具:我在菜鸟阶段开始花3个月投入学习R,并且乐在其中。 Solve toy problems: Curiosity is key to data science. ________________________________________ 3.

    1K60发布于 2018-02-05
  • 来自专栏数据科学与人工智能

    数据科学】数据科学家数据科学

    关于数据科学家的更多讨论: 你能列出十个著名的女性数据科学家吗?Can you name 10 famous data scientist women? 谁是最富有的数据科学家数据科学并不局限于大数据,但是数据量的扩大诚然使得数据科学的地位越发重要。 数据科学的从业者被称为数据科学家数据科学家通过精深的专业知识在某些科学学科解决复杂的数据问题。 如果从广义的角度讲,从事数据处理、加工、分析等工作的数据科学家数据架构师和数据工程师都可以笼统地称为数据科学家;而从狭义的角度讲,那些具有数据分析能力,精通各类算法,直接处理数据的人员才可以称为数据科学家 如何系统地学习数据挖掘? 做数据分析不得不看的书有哪些? 怎么学习用R语言进行数据挖掘? (3) 数据可视化(Visualization) 信息的质量很大程度上依赖于其表达方式。 (ETL(Extract、Transform、Load)、数据治理、管理责任、元数据) * 优化与启发(整数计划法、非线性计划法、局部探索法、超启发(模拟退火、遗传算法)) (3) 春学期 * 大数据分析

    1.4K90发布于 2018-02-26
  • 来自专栏技术沉淀

    数据科学家的RoadMap

    RoadMap.jpg 资料来源

    86170发布于 2018-06-21
  • 来自专栏猴子数据分析

    如何成为数据科学家

    这是国外数据科学学习平台DataCamp成员写的一篇图文 8步 成为数据科学家。我们具体来看下有哪些学习内容和学习资源。 这里说的8步,不是你用8周就可以完成,而是一种学习的方法。 首先,什么是大数据科学家数据科学家是一个跨学科人才,是比软件工程师更擅长统计学,比统计学家更擅长软件工程的人。需要掌握的知识有数学统计,编程能力,机器学习,研究能力等。 目前,数据科学家大部分是本科或者硕士学历(本科37%,硕士31%)。但是不要担心,从调查数据来看,有5%高中毕业的人也成为了数据科学家。这足以证明,只要你努力去提供自己,英雄是不问出处的。 www.zhihu.com 第3步:理解数据库 在大部分的实际数据分析项目中,数据大部分是存储在数据库中的,所以你的学会数据库的操作,如关系数据库MySQL,非关系型数据库MongoDB等。 www.zhihu.com 2.数据可视化是将数据分析的结果显示出来,便于展示。 3.数据报表作为数据分析的最后一步,是将数据分析和结果制作成易于理解的报告。

    94330发布于 2021-03-15
  • 来自专栏数据科学与人工智能

    数据科学家数据大师Olivier Grisel给志向高远的数据科学家的指引

    今天,Olivier深入到技术层面进行探讨,他回答了数据科学初学者提出的所有问题。 不要等待,数据科学从现在开始! OG:一个很好的规则就是根据你最终必需处理的数据量来抉择,当然还要把未来数据的增量考虑进去。最近,一台配置很好的机器可以有上百G的RAM。当然,原始数据集可能比这更大。 一旦你提取了特征并将其转为数值表,你就可以得到更小的数据集,那样你就可以在内存中处理数据并使用scikit-learn运行预测模型。 大数据基础设施的挑战 FD:人们开始考虑如何管理大量的数据,对于如何得到一个很好的衡量标准,你的建议是什么呢? OG:在你开始做机器学习之前,从一个基本模型开始很重要。 子样本总归还是好的,回到小数据世界能确保你遵循正确的方法。 事实上,你也应该这样做,这样你就可以确保当你向你的样本添加更多的数据时,实际上你是在提高你的模型性能。这有利于检查。

    81280发布于 2018-02-27
  • 来自专栏PPV课数据科学社区

    【推荐】数据科学家数据科学。

    关于数据科学家的更多讨论: 你能列出十个著名的女性数据科学家吗?Can you name 10famous data scientist women? 谁是最富有的数据科学家数据科学并不局限于大数据,但是数据量的扩大诚然使得数据科学的地位越发重要。 数据科学的从业者被称为数据科学家数据科学家通过精深的专业知识在某些科学学科解决复杂的数据问题。 如果从广义的角度讲,从事数据处理、加工、分析等工作的数据科学家数据架构师和数据工程师都可以笼统地称为数据科学家;而从狭义的角度讲,那些具有数据分析能力,精通各类算法,直接处理数据的人员才可以称为数据科学家 (3) 数据可视化(Visualization) 信息的质量很大程度上依赖于其表达方式。 (ETL(Extract、Transform、Load)、数据治理、管理责任、元数据) * 优化与启发(整数计划法、非线性计划法、局部探索法、超启发(模拟退火、遗传算法)) (3) 春学期 * 大数据分析

    90360发布于 2018-04-20
领券