首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏CDA数据分析师

    解读 | 数据需要掌握的5个商业技能

    CDA数据分析师 出品 作者:徐杨老师 编辑:Mika 各位小伙伴大家好!我是徐杨老师,好久不见! 今天给大家带来5数据科学家需要的商业技能,聊聊商业与数据科学两者如何携手并进。 也许老板是这么想的: 我需要的是一个可以将数据与商业结合的人,能解决复杂的数据问题,与管理层分享他的见解。 所以今天为你提供五个关键的业务知识方向,向你展示如何利用数据来实现实际的业务解决方案。 02 收集正确的数据 了解必要的数据是否已经存储在组织中以及以何种格式存储。如图像、文字或声音这样的非结构化数据也要收集,这可帮助企业额外挖掘出更深入的信息。 定量数据是从业务或通过调查收集的,比较容易分析和直观地表示。 然而,要提供更多的丰富性和上下文,离不开定性数据也就是非结构化数据。 03 分析数据 首先利用BI工具,多维度探索数据。还可以进行文本挖掘,进行交互式深入研究。使用数据模型和算法模型,为出现的业务信息做出决策。

    42910编辑于 2022-06-28
  • 数据必看!5大主流报表工具全方位对比

    润乾报表则可以将取数及复杂关联运算等放到独立的计算引擎中,并提供了大数据量游标取数,这样即提高了开发效率,还能提高运算性能和数据容量,并真正支持了大数据报表。 Smartbi 的长项是 BI 功能,它提供了自助分析平台,可视化的操作建立数据关联模型,并且提供 ETL 工具加工数据成独立的数据模型,提供了全方位的数据分析功能。 侧重数据分析,建模简单、项目搭建快、周期短。QlikView 应该是首家内存式 BI,数据分析时可将数据全部加载到内存中,操作响应及时、速度快。 支持离线分析功能,一旦数据刷新完成,用户就可以随时随地的进行离线数据分析。 通过 ODBC 连接数据库,支持 sqlsever、oracle、mysql 等主流数据库,支持 Excel 文件,对一些特殊数据源支持不友好(如多维数据库、nosql 等数据库),可能需要后续产品改进

    82110编辑于 2025-06-09
  • 来自专栏一英里广度一英寸深度的学习

    机器学习入门数据集--5.皮马糖尿病预测数据

    在本项目的前期训练中,数据最后的结果都不理想。因此在代码中引入了多种数据模型:逻辑回归、高斯朴素贝叶斯、K近邻分类、决策树分类、支持向量机分类、xgboost。在训练集上,最高准确率为77%。 数据解析 数据名称:pima_indians-diabetes.csv 来源 https://www.kaggle.com/uciml/pima-indians-diabetes-database#diabetes.csv wangsen/ai/13/homework/diabetes.csv") df.info() target = df.pop("Outcome") data = df.values print(data[:5] X:数据 y:预测数据 soring:调用的方法 cv:交叉验证生成器或可迭代的次数 n_jobs:同时工作的cpu个数(-1代表全部) verbose:详细程度 fit_params:传递给估计器的拟合方法的参数 keras https://www.kesci.com/home/project/5a5b691046c4ba639c6fbfa2 多种 机器学习https://blog.csdn.net/weixin

    6.4K30发布于 2019-03-04
  • 来自专栏CDA数据分析师

    华为内部万分享:5分钟,轻松搞懂大数据

    单个的数据并没有价值,但越来越多的数据累加,量变就会引起质变,就好像一个的意见并不重要,但1千、1万的意见就比较重要,上百万人就足以掀起巨大的波澜,上亿足以改变一切。    二、大数据将重构很多行业的商业思维和商业模式   我想以对未来汽车行业的狂野想象来展开这个题目。   在的一生中,汽车是一项巨大的投资。 1997年5月11日,国际象棋大师卡斯帕罗夫在和IBM公司开发的计算机“深蓝”进行对弈时宣布失败, 计算机“深蓝”因此赢得了这场意义深远的“人机对抗”。   类似的逻辑在后续也用到了机器翻译上。 在这种情况下,数字化生存不仅在人生前存在,也可以在死后继续存在。死了,可以在虚拟空间中继续存在。 科技的 进步在很多的时候总会超出我们的想象,试想如果未来我们一个拥有的电脑设备超过现在全球现在计算能力的总和,一个产生的数据量超过现在全球数据量的总 和,甚至你的宠物小狗产生的信息量都超过现在全球数据量的总和

    85890发布于 2018-02-23
  • 来自专栏思考是一种快乐

    5法则:小样本也有力量

    而公司员工有上千,一个一个问太费时。你并不需要得到精确的结果,有没有好的办法呢? 有一个简单的办法:你只需要随机问5即可! 这5个数字的最小值为30,最大值为60。那么,你就可以断定:所有员工通勤时间的中间值,有93.75%的可能性在30~60分钟之间。 原理 上面用到的方法叫5法则。 假如我们随机选的5个都大于或都小于中间值,那么中间值就在30~60的范围之外。这样的情况概率有多大呢? 根据定义,随机算一个值,其大于中间值的概率是50%。这个扔一个硬币,正面朝上的概率是一样的。 随机选择5个都大于中间值的概率,等于连续扔5次硬币全部正面朝上的概率。这样的概率是1/32,即3.125%。同样,所有5个都小于中间值的概率也是3.125%。 中间值在5范围(30~60)的概率 = 100% - 3.125% - 3.125% = 93.75% 有时候,一个好的测量方法,能够大大节省成本!

    1.5K10发布于 2019-09-23
  • 来自专栏音乐与健康

    情绪疗愈——每5就有1受心理疾病困扰

    全球 10 亿受精神障碍困扰,中国 38% 的人正在失眠,这组触目惊心的数据背后,藏着一个即将爆发的 500 亿市场。   行业现状:需求3年就能翻 5 倍? 中国精神心理疾病患病率从 2015 年的 17.5% 飙升到 2025 年的 23%,每 5 个人里就有 1 个正在被情绪问题困扰。 某社交平台数据显示,2025 年 “情绪疗愈” 相关话题浏览量突破千亿次 。

    98510编辑于 2025-10-25
  • 来自专栏SDNLAB

    爱立信将招聘500专攻5G

    瑞典基础设施制造商爱立信本周表示,自去年7月开始削减成本以来,已经裁员了超过1.8万名员工,目前爱立信计划招聘500的研发团队,专攻5G。 他补充说,该公司正在看到其4G产品组合良好的发展势头,该产品组合支持运营商从4G向5G过渡。 爱立信从一些早期的5G运营商合作中受益,该公司与加拿大Rogers公司签订了一份多年的合同,在多个城市部署5G。此外,T-Mobile在今年2月宣布将使用爱立信和诺基亚的设备进行5G部署。 Borje Ekholm表示,爱立信正在看到一个更加稳定的市场,并越来越关注5G无线和网络核心领域,爱立信对该领域的关注不仅是来自于北美运营商。他表示,中国也正在迅速向5G方向发展。 他指出,大多数网络运营商的网络数据流量每隔大约18到24个月就会增加一倍,为了满足这一需求,运营商必须降低每千兆位的成本,为了提高效率,运营商必将进入5G。

    65840发布于 2018-06-11
  • 来自专栏Python编程 pyqt matplotlib

    PyQt5 动画类--跳舞的火柴

    import sysfrom PyQt5.QtCore import QPropertyAnimation, QRect, QEasingCurvefrom PyQt5 import QtGuifrom 代码实现了一个火柴,他开心时可以跳跃、可以舞蹈,不开心时可以躺地上…… ? 代码有点复杂: #! (1, 2), (1, 3), (1, 4), (1, 5), (2, 3), (2, 4), (2, 5), (3, 4), (3, 5), (4, 5), # Right arm (4, 10), (4, 11), (5, 10), (5, 11), (10, 11), # Right leg.

    1.9K21发布于 2019-11-14
  • 来自专栏博文视点Broadview

    运营看哪些数据

    ---- --正文-- 运营看哪些数据? 第一大类是原始数据,包括如下几类。 (1)市场属性数据:行业数据、竞品数据,以及获得用户流量的渠道属性数据,包括渠道分类、曝光、点击、播放、流量、成本等数据。 (5)供应方属性数据:供应方分类、组织或个体的属性等数据。 ▊《运营之上:互联网业务的全局运营方法论与实践》 徐全安 著 10年+跨越不同行业、多次从0到1经验总结 通用运营框架、抓手方法论总结 让运营“做且只做”有价值的工作 本书是在运营的基础职能之上对“ 4月30日京东5折最后一天 快快扫码抢购吧! 如果喜欢本文欢迎 在看丨留言丨分享至朋友圈 三连  热文推荐   Excel用户如何学习数据分析语言DAX? 你的烂代码终于有了解决方案!

    73110编辑于 2023-05-19
  • 来自专栏code秘密花园

    如何15天开发完3D数据可视化大屏

    相信从事过数据可视化开发的你对大屏并不陌生,那么开发一个酷炫的大屏一定是很多数据可视化开发者想要做的事情。 我们使用three.js,大约一周的时间开发出了一个酷炫的数据可视化大屏: ? text.w > 0.3) { // 此处过滤数值越大 文字越细 earthColor = vec4(0.7, 0.7, 0.7, 1); // 文字颜色;覆盖前面的颜色计算 } } 贴图5 depth.xyz, 0.86), 1.0); // mix混合白色让海洋亮一些 } gl_FragColor = earthColor; } 其他uniform 除了贴图外,我们还要定义 5 2.2 点击交互 可视化不仅仅是静态的图形数据,还需要与人交互。 所以这个酷炫的地球就需要支持选中国家并且获取到国家名称。 路径计算 在进行贝塞尔曲线之前,我们需要对位置数据进行一次处理。 因为飞线要映射在球体上,而后台数据是不可能直接返回Vector3(x, y, z)的数据供你使用的。

    4.1K41发布于 2020-10-30
  • 来自专栏雨落凋殇

    E5sub续订机器SQLite版

    简介 E5SubBot是一款用于E5续订的Bot软件,由于该项目使用的是MYSQL数据库,小内存服务器安装MYSQL显然不现实,唯一的选择只能是使用远程MYSQL,连接其他服务器上的数据库。 部署 在Docker上部署E5SubBot For SQLite # 创建用于存放数据的文件夹 mkdir /opt/e5sub # (重要)创建数据库文件 touch /opt/e5sub/e5sub.db run -d -v /opt/e5sub/config.yml:/root/config.yml -v /opt/e5sub/e5sub.db:/root/e5sub.db --restart=always /E5SubBot /opt/e5sub/E5SubBot # 添加执行权限 chmod a+x /opt/e5sub/E5SubBot # 编辑配置文件(文件内容请阅读部署配置) vim /opt/e5sub 满后自动解绑单账户并发送通知,不限制错误次数将值改为负数(-1)即可;bot重启后会清零所有错误次数 cron API调用频率,使用cron表达式 bindmax 最大可绑定数 dbfile sqlite数据库文件名

    1.9K31发布于 2021-01-03
  • 来自专栏机器人网

    AGV搬运机器暴利最高的TOP 5

    相较于多关节的工业机器,AGV是中国机器人行业国产化率最高,同时品牌集中度最高的细分领域,不仅国外企业难以进入,就连国外市场也被中国企业大力抢占。 AGV俗称搬运机器,由于降低成本的压力一直贯穿于整个制造业和物料搬运行业,因此自动导引车(AGV)在生产过程中发挥着日益重要的作用。 这个一直被新松把持的产品,近年来被三丰机器等厂家撬动。在2010年之前,一台双举升合装可是卖到150万,还是独一份的买卖,这可是200%利润。 而现在,面对三丰机器、佳顺、广州井源、嘉腾、东杰装备、苏州华晓等后来者,现在大概80万一台。

    1.8K20发布于 2018-07-23
  • 来自专栏cloudskyme

    设计模式(5)-己所不欲,施之于(代理模式)

    什么是代理?在我们的日常生活中的例子非常多。 比如上网有的时候使用代理服务器,通过代理上网,这就是代理的一个非常常见的例子。 从这里边可以看到3个对象:真实网路对象,代理对象还有客户端对象。 真实对象

    62940发布于 2018-03-20
  • 来自专栏火星娃统计

    GEO数据挖掘5

    GEO数据挖掘5 sunqi 2020/7/13 GEO数据挖掘5 概述 GO和KEGG富集分析 KEGG全称 Kyoto Encyclopedia of Genes and Genomes,由日本京都大学生物信息学中心的 数据库能够把基因及表达信息作为一个整体的网络进行研究,通俗点讲就是通过基因寻找通路 GO全称为gene ontology,由基因本体联合会(Gene Ontology Consortium)建立的数据库 ,数据库对基因和蛋白功能进行限定和描述 GEO数据挖掘离不来富集分析,单纯的差异表达基因不能说明什么问题,只有对基因根据现有知识做定义定位分类,这样才能在生物学上解释这个差异,也就是故事才能讲顺了 注释 :GO和KEGG的具体作用不再赘述,等代码实现完成之后后续再学习理论知识 另外,KEGG和GO分析可以通过软件实现,具体参考官网 数据预处理 用到的数据集为差异分析后得到的数据集deg,详情见上章 rm by cytochrome P450 3/82 ## hsa04390 hsa04390 Hippo signaling pathway 5/

    1.5K10发布于 2020-09-15
  • 来自专栏新智元

    硅谷顶级投资看2017趋势,AI将成为5年前的“大数据

    硅谷的顶级投资都在关注什么技术趋势?2017年是“科技泡沫”破灭的时间点吗?本文带来了几位硅谷著名风投公司合伙的洞察。 2016年对于硅谷的创业公司来说是重要的一年。 硅谷银行(SVB)的数据证实了这一点,数据显示2017年的风险投资约达到250亿美元,比2016年减少约38%。 安全和数据主权(在非本国区域保护本国公司和政府的数据安全)将成为国家以及企业的优先事项。 VB:你的公司明年是否有投资某个特定行业的打算? AI将成为五年前的“大数据” ? Ravi Viswanathan,恩颐投资(NEA)合伙 投资:Acquia,BloomReach和Boku VentureBeat:2017年的热门技术趋势是什么?

    86090发布于 2018-03-26
  • 来自专栏灯塔大数据

    出行大数据:金融5点下班,互联网人你们颤抖了吗

    近期,滴滴联合几大数据机构发布了一份《中国智能出行2015大数据报告》,这份报告显示,截止到2015年底,中国智能出行平台(包含除滴滴以外的叫车平台)总共有3亿注册用户和超过1000万的注册司机,并且注册用户正在以月均 13%的速度增长,这意味着,中国每4个人中就有一个使用App叫车。 同时,在这份报告中我们还看到了一些有趣的数据。 最拥堵的居然是 每次雷锋网记者去上海,那边的小伙伴总会悻悻的问,你觉得北京堵还是上海堵? 同时数据表明,全国平均出行速度最慢的点出现在下午17时左右,低至20km/h。这意味着,高峰期开车出行,每分钟只能挪动333米。

    64460发布于 2018-04-10
  • 来自专栏华章科技

    数据解读城市:北京 本地VS外地

    今天小编找来一篇运用大数据解读城市人口分布的文章,供大家阅读!

    42310发布于 2018-08-13
  • 来自专栏镁客网

    「投资说」峰锐资本李丰:投资视角看未来5

    镁客网——我们关注智能硬件 峰锐资本创始合伙李丰峰锐资本创始合伙李丰 12月2日下午消息,由新浪网举办的主题为“未来商业模式”的首届“C+峰会”今日在北京万达索菲特酒店正式开幕,在下午的峰会现场,峰锐资本创始合伙李丰从投资的视角分享关于未来五年互联网行业的观点与预测 第一个中国为什么和美国在最近4、5年出现了非常多的“独角兽”公司,所谓估值超高的公司。 我想问的另外一个问题跟我们刚才讲的话题不相关,过去5年出了如此多的“独角兽”公司,在中国和美国,原因是什么?这就说到了为什么有了所谓寒冬的说法和兼并收购。 我猜我们这个行业往后5年,我们与资本市场共同振动的方式会产生若干的变化,这是我们当时做的预测。 预测的结果可以花3—5年来看,以前我只负责做预测,做预测想清楚之后就用钱投我认为对的方向,现在身体力行证明了不光我们做这件事,我们自己也愿意下来试一试,可以面临今后5年在我们这个行业中必然会发生的一些变化

    77430发布于 2018-05-25
  • 来自专栏PaddlePaddle

    电力系统+AI,让5倍提升!

    精准的AI预测模型 除新能源的影响之外,国网枣庄供电公司电网调度专家在研究中还发现,数据质量不佳、重要用户的生产计划调整、电网线路检修等实际问题也都会严重影响母线负荷预测的精度。 在该研究的基础上,双方共同打造的高精度母线负荷预测系统拥有多项领先优势: 该系统基于百度智能云自研的时序建模引擎,能够充分挖掘负荷数据在时间序列上的潜在规律。 采用迁移学习、表征学习等方法提升模型的泛化能力,使得模型能够更好的适应新能源的“双高”特性带来的数据分布波动与漂移,增强系统鲁棒性。 与传统预测方式相比,枣庄电网的调度负荷预测专责在使用该系统进行预测时平均效能够提升5倍以上。 系统提供的预测结果为电网调度运行、电力市场现货交易的试运行提供了坚实的数据基础,为新型电力系统的建设提供了支撑。

    69020编辑于 2022-09-01
  • 来自专栏前端达人

    分享 5 个让兴奋的 ES13 功能

    英文 | https://javascript.plainenglish.io/5-most-exciting-es13-features-you-should-know-about-c1c304f4ce02 在这篇文章中,我想与大家分享 5 种我最喜欢的技术,这些技术是我已经开始在工作中实施的。 1. 顶级wait wait 是我最喜欢的功能,因为它使我的代码显得更加优雅。确实,不再有回调地狱的负担。 1.动态加载模块 const enStrings = await import(`/i18n/en`) 2.初始化数据库 const connection = await connectDB() 3. const array = [ 1, 2, 3, 4, 5 ] const lastEle = array[ array.length - 1 ] // 5 // You can't read like const array = [ 1, 2, 3, 4, 5 ] const lastEle = array.at(-1) // 5 const firstEle = array.at(0) // 1 4

    40720编辑于 2023-09-14
领券