首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏程序你好

    数据科学的前6语言

    2012年的《哈佛商业评论》(Harvard business review)正确地将数据科学列为“21世纪最性感的工作”。即使在这份报告发表6年后的今天,《商业评论》仍被证明是正确的。 随着人工智能和机器学习的出现,“数据科学”一词在精通技术的人中间流行起来。用最简单的话说,数据科学是一种利用科学技术和算法从数据中挖掘知识的方法,无论是结构化的还是非结构化的。 无论您是数据科学领域的新手还是专业人士,您需要记住的一些基本内容包括分析数据、应用编程工具(如对数据进行序列和选择)以及执行简单的数据可视化。 R R编程语言被数据挖掘人员和数据科学家广泛用于分析数据。简化工作在统计学家中也很流行。R提供了强大的面向对象编程工具,使其在其他计算语言中处于优势地位。静态图形使图形和其他数学符号的生成更加容易。 SQL 结构化查询语言(SQL)用于处理大型数据库。特别是,它有助于管理结构化数据。学习SQL可以很好地提高数据科学家的语言技能。这种语言的缺点是缺乏可移植性。

    1.2K30发布于 2018-09-29
  • 来自专栏CDA数据分析师

    数据分析不能碰的6禁区!

    1 没有明确分析数据的 要分析一个数据,首先要明确自己的目的,为什么要收集和分析这样一份数据。只有明确了目的之后,才能够把握好接下来应该收集哪些数据,应该怎么收集数据,应该分析哪些数据等。 2 没有合理安排时间 数据分析也要合理安排时间,一般有几个步骤,收集数据、整理数据、分析数据、美化表格。在做这些之前,要预估每一个步骤需要花多少时间,哪一步比较重要,需要花更多的时间等。 数据分析重点应该在于分析,应该以最快的速度收集完数据,才有更多的时间整理和分析,最后经过分析的数据才是最有价值的。 5 不懂得分析哪些数据 这是比较普遍的问题,收集了数据后不知道要分析哪些项目,哪些数据点才能体现出分析的目的。 6 表格不美观,不清晰 做数据分析一般使用的是excel表格记录,一份美观清晰的表格不仅使我们可以清楚的看到这份数据的重点,方便查到所想要的数据。在收集数据的过程中,也可以提高收集和分析数据的效率。

    72360发布于 2018-02-11
  • 来自专栏机器学习/数据可视化

    Python入门-6数据类型操作

    Python的6数据类型操作总结 本文对Python中常见6数据类型的操作进行了汇总: Numbers(数字) String(字符串) List(列表) Tuple(元组) Dictionary(字典 = 1.3常用函数 取绝对值:abs 四舍五入:round 取整:int 转浮点数:float 二、字符串String 字符串是Python中常见的数据类型之一,能够使用str函数将其他类型的数据强制转成字符类型 2.1键盘输入 终端中通过input函数输入的任何内容都是字符串数据 2.2三种方法生成 通过3种方法生成字符串数据: 单引号:`python` 双引号:“python” 三引号:一般字符串内容较长时使用 列表元素重复:* 返回列表中的最值(比较ASCII码):max、min 3.3常见操作 索引和切片操作(类比字符串) append:将整体追加到列表的末尾 extend:列表中的每个元素进行合并,组成一个的列表 ,字典是无序的数据类型,主要是用来存放具有一定映射关系的数据

    74520编辑于 2023-08-23
  • 来自专栏华章科技

    数据分析不能碰的6禁区

    没有明确分析数据的目的 要分析一个数据,首先要明确自己的目的,为什么要收集和分析这样一份数据。只有明确了目的之后,才能够把握好接下来应该收集哪些数据,应该怎么收集数据,应该分析哪些数据等。 没有合理安排时间 数据分析也要合理安排时间,一般有几个步骤,收集数据、整理数据、分析数据、美化表格。在做这些之前,要预估每一个步骤需要花多少时间,哪一步比较重要,需要花更多的时间等。 数据分析重点应该在于分析,应该以最快的速度收集完数据,才有更多的时间整理和分析,最后经过分析的数据才是最有价值的。 不懂得分析哪些数据 这是比较普遍的问题,收集了数据后不知道要分析哪些项目,哪些数据点才能体现出分析的目的。 表格不美观,不清晰 做数据分析一般使用的是excel表格记录,一份美观清晰的表格不仅使我们可以清楚的看到这份数据的重点,方便查到所想要的数据。在收集数据的过程中,也可以提高收集和分析数据的效率。

    36730发布于 2018-08-13
  • 来自专栏灯塔大数据

    6数据人物浅谈未来三年数据的发展

    新工具,新视角 维珍传媒(Virgin Media)洞察分析部负责人马克·查普曼(Mark Chapman) (维珍传媒:英国第一家通信、电视全业务运营商,欧洲最大的移动虚拟网络运营商,也是英国第二付费电视公司 大数据相关技术在不断改进,现在我们可以通过大数据对我们的行业进行深度分析和发掘,而不是像之前一样收集“便宜又大包的黄页式”数据库。 我认为企业利用的数据类型将发生重大变化,不论是内部数据的开源数据集,还是社交媒体等产生的非结构性数据集,这些数据类型都将发生巨变。 数据整合是成功关键 联合利华信息分析副总裁柯尔斯顿·穆迪(Kjersten Moody) (联合利华:跨国消费品公司,总部设在荷兰鹿特丹和英国伦敦,世界第三消费品公司,世界上最大的涂抹食品生产商,最古老的跨国公司之一 联合利华目前专注于整合不同渠道数据,对客户数据体验进行重新定义,建立互动性更高的数据联系。这样一来,我们就能让客户深度发掘数据信息,并做出正确的行动决策。 翻译:灯塔大数据

    94180发布于 2018-04-08
  • 来自专栏互联网大杂烩

    6设计原则

    所有引用基类的地方必须能透明地使用其子类对象。 只要父类能出现的地方子类就可以出现。

    40830发布于 2018-08-22
  • 来自专栏木东居士的专栏

    数据团队思考:小型数据团队发展的6建议

    数据团队思考:小型数据团队发展的6建议 0x00 前言 最近遇到了不少待在小型数据团队的朋友在吐槽自己的团队如何如何的坑,比如说: 基础建设特别差,用什么没什么! 鉴于这些吐槽的内容,居士将从如下几个方面来分享本篇的主题:小型数据团队发展的6建议 为什么你的团队是一个小型的数据团队? 小团队会面临什么样的难题? 很多大公司的数据团队可能也是很少的几个人。这里面有两种可能: 公司本身并不需要特别强大的数据支撑,或者还没有重视。 另一种可能是一个的公司的各个部门里面,都会有自己的小的数据团队。 0x03 小型数据团队发展的10建议 步入正题。 一、前期发展,以经验丰富的员工为主 小团队的前期发展,以经验丰富的老司机快速搭建框架是最为稳妥的,要尽可能地减少试错成本。 另外,数据挖掘本来也是数据团队的工作内容,这里的6个建议同样适用。 补充说明一点:本文是从团队的角度来考虑,并不是个人的角度。 最后,欢迎大家提出你的意见,批评也很欢迎,一起讨论才会有进步。

    1.1K10发布于 2019-11-12
  • 来自专栏云计算D1net

    关于SaaS和数据恢复的6谬误

    这里有六个关于SaaS应用的谬误,会可能导致你天真地相信你公司云端的数据是安全的。而事实上它们却处于严重的风险之中,并且如果没有数据保护的解决方案的话,将可能会永久的失去。 谬误一:你总是可以恢复你的云端数据 云计算提供商确实能提供不同程度的恢复,但是有一个问题:这种备份并非旨在将所有数据都能提供给客户。 提供数据保护。虽然这两种技术有一些重叠的特性,但是它们在根本上是不同的两种方法: ·件同步和共享是建立在用户内容的实时协作基础上的,但它不是用于在用户错误、数据损坏或面对勒索软件所采取的数据恢复。 数据被全方位所保护着,包括用SaaS应用程序进行文件存储,并且在设备一旦丢失或被盗的情况下,其附加的功能够帮助组织跟踪设备,和/或远程删除企业的数据。 另外,原生的云内容分析能力可以帮助你更为深入地了解在横跨多个数据源的时候,潜在的数据和合规方面的风险。

    76850发布于 2018-03-27
  • 来自专栏新智元

    智能音箱2017爆发,6数据看懂亚马逊与谷歌之争

    厨房是Echo最频繁的使用场景之一; 6. 亚马逊将发布带屏幕的Echo。 相信以上结论会对国内暗流涌动的智能音箱之战会有较强的借鉴意义。 6月24日,Fortune报道。 Ad Age 公布的一份最新研究表明,谷歌的智能音箱 Home 比起亚马逊的 Alexa 要更可靠,对正确地回答用户命令这一任务进行量化的结果显示,双方有6倍的差异。 在所提供的答案的正确性上,谷歌的虚拟助理是亚马逊的6倍。 这一结果有些出乎意料。但是,考虑到两家公司在语音助理技术上的不同路径,这也是能理解的。 与此同时,亚马逊通常会选择与信息和内容合作伙伴协作,来获得数据。对于随机用户来说,特别是现在许多AI 业务都是在云上完成,谷歌和亚马逊的搜索结果可能不会有本质的区别。但是,搜索引擎的数据集是海量的。 但是根据新的数据,这一数字上升到了1.5到1.6台。 虽然数字没有那么精确,但是Echo的统治力是毋庸置疑的。

    861120发布于 2018-03-28
  • 来自专栏逻辑熊猫带你玩Python

    Python | 6数据类型方法归纳总结(中)

    撰文编辑:逻辑熊猫 | 图片:网络与截图 - 正文 - ▼ -01- 概述 | 六中数据类型 Python提供的基本数据类型有六种: · 数字(Number) · 字符串(String) · 元组 6、set.discard():如果它是一个成员,从集合中移除一个元素。如果元素不是成员,则什么都不做。 7、set.intersection():将两个集合的交集作为一个新集合返回。

    95940发布于 2018-08-30
  • 来自专栏逻辑熊猫带你玩Python

    Python | 6数据类型方法归纳总结(下)

    撰文编辑:逻辑熊猫 | 图片:网络与截图 如需转载,请后台联系授权 往期内容 Python 自助篇 “6数据类型方法归纳总结(上)” “6数据类型方法归纳总结(中)” - 正文 - ▼ -01 - 概述 | 六中数据类型 Python提供的基本数据类型有六种: · 数字(Number) · 字符串(String) · 元组(Tuple) · 集合(Sets) · 列表(List) · 字典( 6.L.index(value, [start, [stop]]) :返回value的第一个索引。如果value不存在,就会引发ValueError。可以使用start和stop制定检索的范围。 6.D.pop(key[,default]) :删除指定的键并返回相应的值。如果没有找到该键,则返回默认值,否则会引发KeyError。

    1K20编辑于 2023-03-18
  • 来自专栏逻辑熊猫带你玩Python

    Python | 6数据类型方法归纳总结(下)

    撰文编辑:逻辑熊猫 | 图片:网络与截图 - 正文 - ▼ -01- 概述 | 六中数据类型 Python提供的基本数据类型有六种: · 数字(Number) · 字符串(String) · 元组 6.L.index(value, [start, [stop]]) :返回value的第一个索引。如果value不存在,就会引发ValueError。可以使用start和stop制定检索的范围。 6.D.pop(key[,default]) :删除指定的键并返回相应的值。如果没有找到该键,则返回默认值,否则会引发KeyError。

    1.5K31发布于 2018-08-30
  • 来自专栏逻辑熊猫带你玩Python

    Python | 6数据类型方法归纳总结(中)

    撰文编辑:逻辑熊猫 | 图片:网络与截图 如需转载,请后台联系授权 往期精彩内容 Python | 自助篇 Python | "6数据类型方法归纳总结(上)" - 正文 - ▼ -01- 概述 | 六中数据类型 Python提供的基本数据类型有六种: · 数字(Number) · 字符串(String) · 元组(Tuple) · 集合(Sets) · 列表(List) · 字典(Dictionary 6、set.discard():如果它是一个成员,从集合中移除一个元素。如果元素不是成员,则什么都不做。 7、set.intersection():将两个集合的交集作为一个新集合返回。

    55820编辑于 2023-03-18
  • 数据清洗6核心方法,一文讲透!

    我做数据这么多年,总是会听到:"我快被这个月的数据搞疯了!上周做的销售报表,今天业务部门说数据对不上,差了好几十万。""数据一直对不上,是不是数据源有问题?"" 你想,如果你的销售数据里混入了测试数据,或者客户年龄出现了负值,基于这些数据制定的市场策略,怎么可能正确呢? 第一步:理解数据与诊断问题在动手之前,先为数据做一次全面体检。使用描述性统计查看数据的基本分布,检查是否有明显的异常值,查看数据的前几行和后几行,对数据有个直观感受。 文本清洗:包括去除首尾空格、统一小写、纠正拼写错误、将同义词统一。数据类型转换:确保每一列的数据类型是正确的,比如把存储为字符串的数字,转换为数值类型,才能进行数学运算。 数据离散化:将连续数据分段,变成类别数据。比如将年龄分为青年、中年、老年。

    87910编辑于 2025-11-22
  • 来自专栏逻辑熊猫带你玩Python

    Python | 6数据类型方法归纳总结(上)

    撰文编辑:逻辑熊猫 | 图片:网络与截图 - 正文 - ▼ -01- 概述 | 六中数据类型 Python提供的基本数据类型有六种: · 数字(Number) · 字符串(String) · 元组 6.islower():如果字符中至少包含一个能区分大小写的字符,并且这些字符都是小写则返回True,否则返回Flase 。

    2.2K41发布于 2018-08-30
  • 来自专栏代码世界

    6设计原则总结

    6设计原则总结 一、单一职责原则  单一职责原则:英文名称是Single Responsiblity Principle,简称是SRP。定义:应该有且仅有一个原因引起类的变更。 可维护性提高,可读性提高,那当然更容易维护了; 变更引起的风险降低,变更是必不可少的,如果接口的单一职责做得好,一个接口修改只对相应的实现类有影响,对其他的接口无影响,这对系统的扩展性、维护性都有非常的帮助 ”,而不是“肥嘟嘟”的一堆方法; 已经被污染了的接口,尽量去修改,若变更的风险较大,则采用适配器模式进行转化处理; 了解环境,拒绝盲从。 一个展示数据的列表,按照原有的需求是6列,突然有一天要增加1列,而且这一列要跨N张表,处理M个逻辑才能展现出来,这样的变化是比较恐怖的,但还是可以通过扩展来完成变化,这就要看我们原有的设计是否灵活。 2、元数据(metadata)控制模块行为   编程时使用元数据来控制程序的行为,减少重复开发。用来描述环境和数据数据,通俗地说就是配置参数,参数可以从文件中获得,也可以从数据中库中获得。   

    99390发布于 2018-04-12
  • 来自专栏程序那些事

    Fabric的6特性

    在考虑准入的网络时,您应该考虑您的区块链用例是否需要遵守数据保护法规。许多用例(尤其是在金融部门和医疗保健行业)受数据保护法律的约束,这些法律要求了解网络的成员是谁以及谁在访问特定数据6)当提交peer节点收到一批事务时 7)验证是否符合背书策略,并检查读/写集以检测冲突的事务。如果两项检查均通过,则该块将提交到账本,并且每个事务的状态更新都将反映在状态数据库中。 3 需要了解的数据 由于竞争力,保护法和个人数据机密性的规定,企业需要对某些数据元素进行隐私保护,这可以通过在区块链上进行数据分区来实现。 通道帮助提供了数据分区功能,只有那些需要了解数据的人员才能看到事务数和数据本身。 4 通过不可变的分布式账本进行复杂查询 分布式账本是区块链应用程序状态转换的顺序记录。 6 保护数字钥匙和敏感数据 HSM(硬件安全模块)提供了对数字密钥的高级保护。对于涉及身份管理的方案,HSM可以更好的保护密钥和敏感数据。 更多教程请参考 flydean的博客

    1.7K20发布于 2020-07-08
  • 来自专栏全栈测试

    JavaScript系列之JS数据类型,6基本数据类型

    每种编程语言都有其支持的数据类型,不同的数据类型用来存储不同的数据,比如文本、数值、图像等。 今天介绍JS基本数据类型,JavaScript中的数据有如下几种: 基本类型:字符串(String)、数字(Number)、布尔(Boolean)、空(Null)、未定义(Undefined)、符号(Symbol 1.7976931348623157e+30 (3) 数值的特殊值 另外,Number 类型中还有一些比较特殊的值,分别为 Infinity、-Infinity 和 NaN,其中 Infinity:用来表示正无穷的数值 ,一般指大于 1.7976931348623157e+308 的数; -Infinity:用来表示负无穷的数值,一般指小于 5e-324 的数; NaN:即非数值(Not a Number 的缩写), 六 符号(Symbol) 1 简介 Symbol是 ECMAScript6 中引入的一种新的数据类型,表示独一无二的值。

    2.5K20编辑于 2022-11-11
  • 数据质量怎么管理?总结数据质量管理的6方法

    二、数据全生命周期管理数据质量管理是贯穿数据全生命周期的,从数据产生,到数据存储、数据使用,再到数据销毁,每一个环节都要做好管控。少一个环节都可能出问题。 2.数据存储与整合数据存储的时候要做好备份,防止数据损坏、丢失,同时要定期检查数据,及时发现存储过程中出现的问题,比如数据格式错乱、部分数据丢失、数据冗余等。 2、流程与制度数据质量管理需要依托标准化流程推进,核心流程涵盖四方面:数据标准管理流程:明确数据标准的制定、发布、修订流程,保障标准的统一性与权威性。 四、数据质量管理的6方法1、数据清洗数据清洗就是处理原始数据里的无效、错误内容,具体操作分三步走。 6数据修复数据修复不是简单的删除或修改,而是要形成“发现-定位-整改-复查”的闭环,彻底解决问题。

    45410编辑于 2026-03-19
  • YashanDB数据库的6集成技术与优势

    当前数据库技术面临诸多挑战,包括高并发处理中的性能瓶颈、海量数据的高效存储与访问、跨节点数据一致性保障以及复杂事务的高效管理等。 本文将深入分析YashanDB的六集成技术及其带来的优势,为数据库开发者和运维人员提供技术参考和应用指导。1. 向量化执行利用SIMD指令批量处理相同数据类型的列数据,提高CPU计算密度,显著提升查询速度。并行执行策略涵盖节点间并行和节点内分割,借助PX并行执行算子实现高效数据交换和聚合。 整体设计确保海量数据的低延迟查询及资源动态调度,提升系统的并发吞吐能力。4. 事务与并发控制机制集成YashanDB集成了基于多版本并发控制(MVCC)的事务管理,支持ACID四属性。 这些技术有效降低运维复杂度,保障数据库稳定性和业务不中断。6. 全面安全管理体系整合安全方面,YashanDB构建了用户管理、身份认证、访问控制、数据加密、审计及反入侵防护的多层安全体系。

    16910编辑于 2025-11-20
领券