首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI研习社

    数据工程师必看:分析数据时常见的 7 类统计陷阱

    本文为 AI 研习社编译的技术博客,原标题为 7 Common Mistakes in Interpreting Analytics Data: Statistical Pitfalls for Your 现在,允许我向你揭示当做统计说明时 7 个最常见的错误。 1. 假设网站的转化率为 7%,在你为这个数据过度兴奋前,先拆分一下这个数据。你会发现其中 9% 来自于PC用户,只有 1% 来自于移动端用户 就这样,你就有了线索。 7 解决通用型(One-Size-Fits-All)报告设置 在解释分析数据时另外一个常犯的错误是坚持标准报告设置,而不是尝试调整它,让它向你传递你需要的精准数据:与你网站相关的数据 。 原文链接: https://medium.com/@OPTASY.com/7-common-mistakes-in-interpreting-analytics-data-statistical-pitfalls-for-your-ux-team-to-avoid-b69b699f1737

    45130发布于 2018-08-16
  • 来自专栏有关SQL

    数据工程师必须掌握的7个大数据实战项目

    此时有个工程师,仅凭一人之力完成了这项工作,整个过程,他只做了 4 件事情: 1) 首先他是资深编程爱好者。 接下来,我整理一些大数据已经发挥它真正作用的应用场景,如果你要做大数据项目,肯定离不开这7个范畴。 因此,你说大数据离我们远吗,我说肯定很近。不管你信不信,反正我信了。 Oliver 的文章《the 7 most common Hadoop and Spark projects》以及其他百度文库参考资料 - https://www.javaworld.com/article /2972303/the-7-most-common-hadoop-and-spark-projects.html Oliver 就是《77编程语言》的作者 https://www.techworld.com.au /article/455387/epic_codefest_7_programming_languages_7_days/ 完

    2.6K10发布于 2019-12-31
  • 来自专栏机器学习AI算法工程

    面对数据工程师,你有7个问题可以问

    运用数据进行管理不是什么新鲜事,但是大数据还是个新概念, 有相关的风险、挑战和机会。高级管理者需要具备一定的认识,以备他们的数据专家提出新观点时,自己有所准备。 记住,当你的数据工程师说起一个新点子时,你应该向他提出下面这些问题: 1.你想解决的是什么问题? 对于数据工程师或者其它相关人员,找到一些新的应用或者好玩的东西实在太容易了,问题是这些东西是否与业务相关。 其次,先进的数据分析需要超强的判断力。数据专家倾向于只看数据而忽视其它因素,你得保证这种事不要发生。你越重视他们的工作结果,他们提供给你的数据就越清晰完整。 小心一些,不要让业务与数据之间的联系过分敏感。你需要关注的其实只是纽约证券交易所的瞬间暴跌或者推特上的负面言论带来的业务下滑。 7.我能为此做些什么?

    95860发布于 2018-03-09
  • 来自专栏阿贤Linux

    Linux运维工程师面试题(7

    Linux运维工程师面试题(7)祝各位小伙伴们早日找到自己心仪的工作。持续学习才不会被淘汰。地球不爆炸,我们不放假。机会总是留给有有准备的人的。加油,打工人! 在新容器中运行命令save:将一个或多个镜像保存到 tar 包(默认流式传输到标准输出)tag:创建一个引用 SOURCE_IMAGE 的标签 TARGET_IMAGEversion:查看 Docker 版本信息7 暴露端口WORKDIR:指定工作目录ONBUILD:子镜像引用父镜像的指令USER:指定当前用户HEALTHCHECK:健康检查STOPSIGNAL:退出容器的信号SHELL:指定shell10 容器数据持久保存方式数据卷 Volume Container):间接使用宿主机空间,数据卷容器是将宿主机的目录挂载至一个专门的数据卷容器,然后让其他容器通过数据卷容器读写宿主机的数据,此方式不常用。 、个人博客公众号:阿贤Linux个人博客:blog.waluna.tophttps://blog.waluna.top/---原文链接: Linux运维工程师面试题(7).

    1K30编辑于 2023-09-05
  • 来自专栏让技术和时代并行

    1% 顶尖工程师7 个简单习惯

    我曾与杰出的工程师一起工作过,他们既有在 FAANG 这样的大公司,也有像初创公司这样的小公司。他们让我看到了神话般的“10x”工程师——他们确实存在于现实生活中! 代码有三种受众:人类读者、机器读者和用户 我认识的最好的工程师都具有产品意识:首先考虑为人类解决问题。 我认识的最好的工程师总是评估他们的代码对所有受众的价值。 测试也不应该测试代码中的实现细节,例如测试前端代码中的某些 CSS 选择器与使用数据属性或仅进行屏幕截图测试。 经常沟通 没有伟大的系统是单独建立的。 编码快……但慢 我认识的最好的工程师通过缓慢编码来快速完成项目。 听起来很奇怪,对吧? 上述所有这些原则和习惯都为整体,第一次编码增加了更多时间。但它们允许工程师一步一步地推进项目的进展。 我记下的每一位工程师如今都处于各自领域的顶尖地位,因为他们专注并成为某个领域的专家,无论是前端基础设施、分布式系统还是干净的 UI。 经常且适当地推销自己。这些工程师根本没有隐藏在众目睽睽之下。

    32210编辑于 2024-01-17
  • 来自专栏CU技术社区

    运维工程师需要掌握的7大武器

    随着互联网时代的快速发展,各个领域对于终端设备的稳定性、可操作性也提出了更高的要求,于是乎,一个看似神秘的岗位就这么诞生了,这就是----运维工程师。 运维工程师 —— “Operations Engineer”,字面意思可理解为管理系统、服务器的工程师。 特别是,当系统不出现问题的时候,许多运维都不重视容灾备份和数据安全,这样一旦系统出现了故障,系统的恢复就需要花很长的时间。 06 不断学习 计算机的发展真的是太快了,新的知识、新的技术层出不穷。

    77620发布于 2019-10-25
  • 来自专栏数据科学与人工智能

    数据科学家数据工程师

    As the field of data science continues to grow and mature, it is nice to begin seeing some distinction in the roles of a data scientist. A new job title gaining popularity is the data engineer. In this post, I lay out some of the distinctions between the 2

    87750发布于 2018-02-28
  • 来自专栏Java学习网

    在创业公司当好工程师7 个特质

    在创业公司当好工程师7 个特质 不是每一个优秀的工程师都能在创业公司做得很好。 我曾经跟最有效率的创业公司的工程师工作,他们有能力和决策能力,有效把控局面。 他们表现出 7 个特质: 1、系统的调试技巧 工程时间的很大一部分实际上是花在调试和了解一个复杂的系统中去的。 (提示:先从数据中看)。 2、勇敢跳进你不知道是什么的地方 作为创业工程师,你经常需要跳入大又不熟悉的代码库。可能需要研究一些开源工具,因为该工具不按你的设想工作。 一个用户增长工程师熟练使用数据分析工具可以分析运行试验,而不会被一个数据分析员所阻碍。 也有例外,当你在一个特别的技术空间工作,专家可能是能最大限度发挥作用的。 7、磨砺,加上学习决心和反思 对以上特质的一个重要发现是,如果你有足够的动机,那都是可学习的技能。长期学习这些技能的动力来自“磨砺”这种品质。

    80470发布于 2018-02-27
  • 来自专栏木东居士的专栏

    数据工程师的算法!

    翻出来了17年自己梳理的数据工程师的算法学习内容,当时的理解和现在会有些许不同,但整体来看还是可以的,有一些比较细节的内容并没有花较多的时间来整理,留待大家自己补充了,在此不再做任何修改分享给大家参考, 该图中包含的算法范围可能会比较广,当然大家在学习的时候也可以有所取舍,根据居士个人经验,简单举例说明一下几大块算法对数据工程师的重要性,或者说是学习建议吧: 分布式算法:大数据相关的同学必备,日常工作可能使用不多 大数据算法:偏ETL和基于大数据平台开发的同学最好多做了解,现在很多大数据处理的背后都隐藏了这些大数据相关的算法,比如ES、Kylin、Hadoop。 数据结构:这里居士只列了图、树和一些高阶数据结构,有朋友问学算法在工作中到底有没有用,我可以很负责任地说,这一块是肯定有用的。 学习算法:数据挖掘相关的内容,学一下扩展自己技能是很有必要的,因为数据开发很可能会做数据挖掘相关的平台,比如广告系统、推荐系统、机器学习平台等。

    70450发布于 2019-05-17
  • 来自专栏鸿的学习笔记

    数据工程师的未来

    Apache Airflow 和 Apache Superset 的创建者 Maxime Beauchemin 写了一篇文章讨论数据工程师的未来,其中讲述了他对数据工程师的现状的认知和未来发展的猜测,可供大家参考 ,即 为了有效地扩展数据科学和分析,团队需要一名专业工程师来管理 ETL、构建管道和扩展数据基础设施。 数据工程师也是一项吃力不讨好的工作,团队在构建基础设施、运行作业以及处理来自分析和 BI 团队的临时请求之间徘徊。因此,成为一名数据工程师既是福也是祸。 这段话道尽了大部分数据工程师团队的心酸,我想那些“取数工程师”应该更有感触。 数据工程师几乎就像是良好数据习惯的守护者。例如,如果分析工程师在每次运行 dbt 时重新处理仓库,他们就会养成坏习惯。

    72720发布于 2021-11-02
  • 来自专栏Albert陈凯

    数据挖掘工程师书单

    数据挖掘工程师书单

    54740发布于 2018-04-04
  • 来自专栏大数据文摘

    数据工程师的崛起

    ),但在13年离开时我的职位却是数据工程师。 但他们也不像数据科学家,数据工程师受到一位更成熟的“父亲”– 软件工程师 – 启发。数据工程师创造工具、基础、框架和服务。事实上,相比于数据科学家,数据工程师可以说是更接近于软件工程师。 -Bill Inmon 相应得,数据仓库还是与以前一样,数据工程师负责数据仓库的多方面搭建并在其上操纵。数据工程师总是关注于在数据仓库及其附属产品。 在这些项目中数据工程师教会人们怎么样更专业地操作数据数据工程师同时也是数据仓库的管理员,编目、整理元数据,定义从数据仓库抽取数据的过程。 服务 数据工程师还会做些更高级别的抽象事务,在一些工作场景中提供服务和工具化使数据工程师数据科学家和分析师可能人工处理的工作自动化。

    92330发布于 2018-05-25
  • 来自专栏大数据文摘

    数据工程师的没落

    数据文摘作品 作者:Maxime Beauchemin 编译:阮雪妮,笪洁琼,Aileen 这个行业的辛酸,也许只有数据工程师们自己能懂。 本文是几个月前大数据文摘推送的一篇文章《数据工程师的崛起》的后续 。那是最近一篇尝试定义数据工程和描述数据工程师这一新职位与数据科学领域以往和现在的职位之间的联系的文章。 如果对数据工程师这个职位不了解的读者,可以参考这篇文章《数据科学行业的8个关键角色:职责与技能》了解数据科学行业职责分类。 如果团队人员中有数据工程师,他的工作可能是帮助数据科学家和分析师收集他们需要的数据。如果需要的数据不能在数据仓库的结构化部分得到,分析师可能会查找一些原始数据来做出短期的解决方案。 是否是真正的软件工程师? 这个领域的人们应该听到过关于数据工程师是否是“真正的软件工程师”,或是某种不同类别的工程师的争论。在某些机构中这一职位是不同的,并且可能有不同(更低)的工资级别。

    86630发布于 2018-05-24
  • 来自专栏明明如月的技术专栏

    优秀软件工程师必备的 7 个好习惯

    在这篇文章中,我将根据 Lula 的 “7 Habits of Successful Software Engineers” 视频的主要观点,结合自己的理解,谈谈优秀的软件工程师应该具备的 7 个好习惯 二、7个好习惯 1 不要急于编码 软件工程师最常犯的错误之一就是在没有完全理解需求和其他相关背景的情况下就急于编码。这会导致浪费时间、出现错误、甚至交付不满足客户需求的软件。 如果和数据工程师交流,应该重点沟通日志和数据分析相关的信息,让他更容易得知道如何分析新的项目的数据。 5 培养高效沟通的能力 虽然软件工程师可以有自己的边界意识和个性,但是软件工程师不应该仅仅坐在角落里闷头写代码。 一名优秀的软件工程师通常都很擅长沟通。 优秀的软件工程师的成长之路就是从点到线再到面的过程。 7 拥有成长思维 成长思维是一种认为人的能力是可以通过后天的努力而改变的思维模式。

    68020编辑于 2023-03-30
  • 来自专栏数据科学与人工智能

    数据科学】揭秘硅谷数据工程师求职

    导言 大数据工程师是如今最火的职业,没有之一。也可能是未来十年最火的职位。那么对于如此新型的职业和技术,留学生朋友们应该如何求职?硅谷大数据达人,董老师为你揭秘。 在杜克读书时候,刚好我的导师就是在大数据方面做一些实践,我也很欣喜可以把研究和最新的工业实践Hadoop平台结合,当时做出了很好的结果发表在VLDB,SOCC国际数据库和云计算大会上。 这与我当时的大数据研究项目有很大的相关性。在技术的广度和深度有了一定的积累以后,我把更多关注放在了互联网产品上,我个人对消费者互联网一直都非常感兴趣。 很快就晋升为了资深工程师。 因为自身对创业公司氛围的喜爱,决定去寻找其他的机会。决定离开LinkedIn觉得当时的工作被限制在广告领域,而个人对广告方面兴趣并不大。 如果HR发现简历的一些关键字和背景符合职位需求,简单介绍公司,安排1,2轮电面,如果通过,邀请onsite面试,里面会有4-7轮,里面涉及到不少白板编程 我记得印象深刻的面试:面试者岁数大些,当时我面的时候也没出众

    99890发布于 2018-02-27
  • 来自专栏学习笔记持续记录中...

    处理模型数据7

    Spring MVC提供了以下几种途径输出模型数据: ModelAndView 控制器处理方法的返回值是ModelAndView,则其既包含视图信息,也包含模型数据信息 // success.jsp 返回的目标页面 return modelAndView; } } Map&Model Spring MVC 在内部使用了一个org.springframework.ui.Model接口存储模型数据 ,具体步骤: 1)SpringMVC在调用方法前会创建一个隐含的数据模型,作为模型数据的存储容器, 成为”隐含模型” 2)如果方法的入参类型为Map或Model,会将隐含模型的引用传递给这些入参。 3)在方法体内,可以通过这个入参对象访问到模型中的所有数据,也可以向模型中添加新的属性数据 Spring Web MVC 提供Model、Map或ModelMap让我们能去暴露渲染视图需要的模型数据。 ,则可以在控制器上标注一个@SessionAttributes,配置需要在session中存放的数据范围,Spring MVC将存放在model中对应的数据暂存到HttpSession 中。

    50500发布于 2020-03-18
  • 来自专栏网络技术联盟站

    网络工程师学Python-7-while 循环

    在 Python 中,while 循环是一种重复执行代码块的结构,只要指定的条件为 True,就会继续执行。

    53800编辑于 2023-04-19
  • 来自专栏火星娃统计

    GEO数据挖掘7

    GEO数据挖掘7 sunqi 2020/7/13 概述 GSVA分析,gene Set Variation Analysis,被称为基因集变异分析,是一种非参数的无监督分析方法,用来评估芯片核转录组的基因集富集结果 分组情况 table(group_list) ## group_list ## Control Vemurafenib ## 3 3 ##导入MigDB数据集名 "c7.all.v6.2.symbols.gmt" "h.all.v6.2.symbols.gmt" # 安装GSVA包 # BiocManager::install('GSVA') library es_max) df=df[df$P.Value<0.01 & abs(df$logFC) > 0.5,] write.csv(df,file = 'GSVA_DEG.csv') 结束语 至此,GEO数据分析的基础基本介绍完毕 ,后面计划解读一些geo数据挖掘的文章 love&peace

    1.9K30发布于 2020-09-15
  • 来自专栏木东居士的专栏

    数据工程师该如何入门?

    0x00 前言 最近发现身边有不少小伙伴想转行做数据工程师,聊天的过程中发现大家对该如何入门有很多迷茫的地方,周末写篇博客记录一下。 哪些人适合继续阅读 数据工程师该如何入门? 对之前的工作没信心想搞互联网,发现大数据方向挺不错 本文结构 前面已经限定了一个大致的话题范围,下面介绍一下主要的文章结构: 数据工程师的日常工作,或者是什么是数据工程师 数据工程师需要具备什么技能 该怎么学 0x01 数据工程师的技能树 1. 什么是数据工程师 数据工程师这个概念其实很模糊,不同的人和公司对它赋予的含义也区别很大,感兴趣的可以看一下我前面的几篇文章。在这里,我们大概聊一下一般意义上的数据工程师在工作中会做什么? 集群运维:安装、测试、运维各种大数据组件 数据开发:细分一点的话会有ETL工程师数据仓库工程师数据系统开发:偏重Web系统开发,比如报表系统、推荐系统等 ?

    94250发布于 2018-05-25
  • 来自专栏机器学习AI算法工程

    数据挖掘工程师面试指南

    数据越来越火,数据挖掘师也水涨船高,更多的年轻人选择了这个行业,但是你了解他吗?面试的时候该如何表现呢? 数据挖掘领域是一个独特的行业,通常的招聘面试方法可能不大适用于本行业的特点。 在招聘一个合格的数据挖掘工程师时,公司一般关注以下三个方面: 他聪明吗?聪明意味着能透过复杂的信息建构问题并以正确的方式加以解决。聪明人还能从失败中获取经验。 他能否专注于项目? 为了解候选人是否具有数据挖掘工程师的潜质,需要一小时的面试,主要通过以下五个环节: 1、简介 如同交谈之初的寒暄一样,简介是使候选人放松下来。可以先介绍一下公司本身的情况,再回答对方的一些疑问。 因为优秀的数据挖掘工程师要能面对客户,清晰的论证并支持其提出的观点。 4、解决问题 软件公司的面试一般会包括“编码测试”,考查数据挖掘工程师也应该如此。一种可以参考的作法是提供一份存在缺陷的分析报告。

    1K40发布于 2018-03-09
领券