首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器学习/数据可视化

    数据平滑9妙招

    今天给大家分享9常见数据平滑方法:移动平均Moving Average指数平滑Exponential Smoothing低通滤波器多项式拟合贝塞尔曲线拟合局部加权散点平滑LoessKalman滤波小波变换 它对最近的数据点给予较高的权重,而对较早的数据点给予较低的权重。这使得EMA更适合用于追踪快速变化的数据。 指数平滑的主要特点包括:加权平滑:指数平滑使用指数权重来平滑数据。较新的数据点获得更高的权重,而较旧的数据点获得较低的权重。这意味着它对最近的数据更为敏感,从而更好地捕获了数据的最新趋势。 7, 8, 9])y = np.array([10, 8, 7, 6, 5, 4, 3, 2, 1])# 三阶多项式拟合degree = 3coefficients = np.polyfit(x, y 数据平滑:Savitzky-Golay滤波器旨在平滑数据,减小数据中的高频噪声和突发波动。它保留了数据中的趋势和主要特征,同时去除了噪声。

    6K44编辑于 2023-10-13
  • 来自专栏腾讯大数据的专栏

    腾讯大数据天穹SuperSQL执行核心剖析

    “随着大数据技术的蓬勃发展,在大数据平台构建过程中也面临着很多挑战和困扰” 1. 数据孤岛:由于历史原因以及不同数据中心的业务差异性,众多异构数据源形成了数据孤岛,导致大量且繁重的人工数据搬迁。 与此同时,由于不同国家的数据安全法限制,很多数据无法搬迁,数据安全和查询效率都难以保证 2. SuperSQL是腾讯自研的统一数据自适应计算平台,以自适应作为串联,整合了不同的大数据组件。通过开放融合的架构,实现一套系统解决公有云、私有云、内网的大数据痛点问题。 腾讯天穹Presto实现了动态Catalog加载功能,允许在单一SQL中指定多个数据源Catalog,以实现跨源计算。 在天穹体系下,SuperSQL基于Data Fabric技术理念,设计出虚拟表方案实现湖仓一体。 虚拟表的本质是虚拟化,通过Schema虚拟化和数据虚拟化实现湖仓一体的融合。

    2.4K51编辑于 2024-04-28
  • 来自专栏数据科学与人工智能

    数据】银行业9数据科学应用案例

    以下我们罗列银行业使用的数据科学用例清单,让您了解如何处理大量数据以及如何有效使用数据。 1 欺诈识别 2 管理客户数据 3 投资银行的风险建模 4 个性化营销 5 终身价值预测 6 实时和预测分析 7 客户细分 8 推荐引擎 9 客户支持 结论 1 欺诈识别 机器学习对于有效检测和防范涉及信用卡 这创建了TB级的客户数据,因此数据科学家团队的第一步是分离真正相关的数据9 客户支持 杰出的客户支持服务是保持与客户长期有效关系的关键。作为客户服务的一部分,客户支持是银行业中一个重要但广泛的概念。实质上,所有银行都是基于服务的业务,因此他们的大部分活动都涉及服务元素。 原文链接:https://activewizards.com/blog/top-9-data-science-use-cases-in-banking/ 版权声明:作者保留权利,严禁修改,转载请注明原文链接

    4K30发布于 2018-07-30
  • 来自专栏灯塔大数据

    2015年数据行业的9关键词

    而国内,国家也将大数据纳入国策。 我们在年底盘点了2015年数据行业九关键词,管窥这一年行业内的发展。 2 国家政策——战略 今年中国政府对于大数据发展不断发文并推进,这标志着大数据已被国家政府纳入创新战略层面,成为国家战略计划的核心任务之一:2015年9月,国务院发布《促进大数据发展行动纲要》,大力促进中国数据技术的发展 与传统数据库相比,DBaaS能提供低成本、高敏捷性和高可扩展性等云计算特有的优点。 9 数据科学家——性感 ? 数据科学家能够通过统计变成涉及、开发和调用算法而支持业务决策;管理海量数据;可视化数据以辅助理解。 内容来源:36数据

    1.6K60发布于 2018-04-10
  • 来自专栏腾讯大数据的专栏

    天穹SuperSQL:腾讯下一代大数据自适应计算引擎

    SuperSQL作为腾讯大数据智能计算平台的入口和决策中心,整合不同的大数据系统组件,旨在解决传统大数据架构下的痛点和难点问题,诸如大数据的语言门槛高、大数据引擎多而杂、大数据计算链路长而复杂、资源利用率低 ,自适应不同架构下的数据融合计算需求,通过自动数据冷热分层,多级缓存,提升存储访问性能 场景架构自适应:适配多云混合架构,实现最优的跨集群、跨DC、跨云计算路由,打通数据链路,解决数据孤岛 融合计算平台已在天穹落地 由于特征维度,训练数据多,模型训练慢,因此对特征进行降维。 为此,天穹Presto做了针对性的优化,在动态的计算环境中,通过感知节点算力的变化,自适应地调整计算任务的调度,避免低算力节点的影响。 天穹Presto自适应任务调度主要分为:Task自适应调度与Split自适应调度,方案实现的核心思想是:根据节点的算力情况动态分配Split和Task,整体架构如下图所示:  ‍ ‍天穹Presto

    6K20编辑于 2022-08-26
  • 来自专栏腾讯大数据的专栏

    天穹SuperSQL如何把腾讯 PB 级大数据计算做到秒级?

    天穹SuperSQL是腾讯自研,基于统一的SQL语言模型,面向机器学习智能调优,提供虚拟化数据和开放式计算引擎的大数据智能融合平台。 Presto在腾讯天穹SuperSQL大数据生态中,定位为实现秒级大数据计算的核心服务。主要面向即席查询、交互式分析等用户场景。 得益于Presto的多数据源访问能力,天穹Presto支持对接了Hive、Iceberg、MySQL等数据源,且为了更好地支持内部的业务,我们也扩展开发了内部的TDW Connnector,支持访问腾讯内部的数据仓库数据 同时天穹Presto使用了Alluxio作为数据源(Hive表、Iceberg表)的缓存层,用于加速热点数据的访问,可有效提升Presto查询的效率。 2.3 Iceberg Connector功能增强 腾讯天穹实时数仓-数据湖分析系统DLA使用了Iceberg作为表的数据组织格式,用户数据入湖后,可以通过Presto Iceberg Connector

    2.1K51编辑于 2022-01-23
  • 直面“AI曼哈顿计划”,中国科学智能的破局之道

    《意见》提出利用人工智能技术加速“从0到1”科学发现的核心引擎,通过科学模型建设、科研平台智能化升级、高质量科学数据集开放共享,提升跨模态数据处理能力,推动科研范式从线性探索转向智能驱动,助力破解基础学科重大难题 11月,美国紧随而来推出“创世纪计划”,这项被喻为“AI曼哈顿计划”的国家战略,集结全美超算资源与联邦数据,构建从假设提出、模拟计算到实验验证的全链条AI科研平台,重点攻关先进制造、生物技术、关键材料等六战略领域 从AlphaFold破解蛋白质结构预测难题,到气象模型提升预测精度,科学智能已展现出颠覆科研范式的巨大潜力,而足量且高质量的科研训练数据与算力基础设施,正是实现这一突破的首要条件。 这种技术优势正转化为实实在在的科研价值,在生物医药领域,“天穹”已推动多款药物进入临床前试验阶段,通过高精度模拟发现新的变构口袋及候选药物分子;在新材料领域,其支撑的电解液数据集成为国家新材料大数据中心门户首批入驻的 AI-Ready材料数据集,为锂电池等新材料研发注入算力动能,与此同时,3D科学计算机“天穹”的应用边界仍在持续拓展,为我国基础科学探索注入持久算力动能,为各领域科技突破提供全场景支撑。

    12910编辑于 2026-03-19
  • 来自专栏博文视点Broadview

    数据中台建设的9误区,你中了几条?

    目前,行业对数据中台存在诸多误解和理解偏差,因此在建设数据中台的过程中,错误的理解可能导致数据中台建设的失败。 下图为数据中台建设的9误区,下面详细介绍每个误区。 图  数据中台建设的9误区 01. 数据中台等同于数据工具的集合 数据工具的集合能有效地提高数据开发和使用的效率,实现让数据易用的目标。 因此,数据工具是数据中台建设的中间产物,而非终极目标。 02. 数据中台等同于数据平台 数据平台是数据中台的一部分功能,是实现数据好用的核心能力和基础设施。 建设数据中台是一项体系性工程,耗时长,花费,用人多,需要企业自上而下推动,需要企业勠力同心,才能实现数据中台的真正价值。 活动方式:关注下方“博文视点Broadview”公众号,在后台回复“数据中台抽奖”参与活动,届时会在参与的小伙伴中抽取1名幸运鹅! 活动时间:截至9月15日(周三)开奖。

    39210编辑于 2023-05-06
  • 来自专栏PPV课数据科学社区

    【译文】数据科学家必须具备的9能力

    【陆勤看点】如何认识和理解数据科学家?一种很好的方法就是查看数据科学家职位的描述,即数据科学家在公司中负责什么?数据科学家需要什么样职能要求?本文是一个数据科学部门招聘数据科学家的描述,值得一看。 数据科学部门正在寻找有热情应用统计学、机器学习和分析从数据集中获得洞见的数据驱动人。 在数据科学部门中,我们通过把那些最优秀数据工程师和数据科学家召集在一起,并让他们帮助我们的顾客从它们的数据中提取他们所需的相关信息。 6、回复“答案”查看hadoop面试题题目及答案 7、回复“爱情”查看大数据与爱情的故事 8、回复“笑话”查看大数据系列笑话 9、回复“大数据1、大数据2、大数据3、大数据4”查看大数据历史机遇连载 专注大数据行业人才的培养。每日一课,大数据(EXCEL、SAS、SPSS、Hadoop、CDA)视频课程。大数据资讯,每日分享!数据咖—PPV课数据爱好者俱乐部!

    80150发布于 2018-04-20
  • 来自专栏CDA数据分析师

    数据挖掘与数据建模的9定律(深度长文 收藏细读!)

    最简单的解释可以概括为“数据是困难的”,经常采用自动化减轻这个“问题”的数据获取、数据清理、数据转换等数据预处理各部分的工作量。 这是数据预处理重要的原因,并且在数据挖掘过程中占有如此的工作量,这样数据挖掘者可以从容地操纵问题空间,使得容易找到适合分析他们的方法。 有两种方法“塑造”这个问题空间。 第一种方法是将数据转化为可以分析的完全格式化的数据,比如,大多数数据挖掘算法需要单一表格形式的数据,一个记录就是一个样例。 有五种因素说明试验对于寻找数据挖掘解决方案是必要的: 数据挖掘项目的业务目标定义了兴趣范围(定义域),数据挖掘目标反映了这一点; 与业务目标相关的数据及其相应的数据挖掘目标是在这个定义域上的数据挖掘过程产生的 数据挖掘者应该在模型不损害业务理解和适应业务问题的情况下关注预测准确度、模型稳定性以及其它的技术度量。 9 变化律:所有的模式因业务变化而变化。 数据挖掘发现的模式不是永远不变的。

    1.8K50发布于 2018-02-11
  • 来自专栏java一日一条

    未来编程的9猜想

    二进制协议再崛起 基于REST协议在JOSN数据包中传送数据至少比老一套的XML数据及标签的90%有效负载而言要简单很多;但极其注重效率的程序员可能会质疑,为什么必须将二进制数据转换为字符串才能在JSON 物联网将产生比以往更多的数据,许多设备将使用大量编码要求更严格的小数据包。当效率成为硬性要求,程序员会想方设法为数据库添加更高效的二进制协议。 3. 数据库更大、更强 不错,搜索引擎可以作为网页的索引,而如今已经存在可以作为世界索引的数据库了,这都得归功于新一代定位应用和自动驾驶汽车不断扩张的市场需求。 数据库之精细令人叹为观止,比如自动驾驶汽车可以输入红路灯、报纸自动售卖机和消防栓的位置数据,好保证行程的安全。数据规模之庞大,为自动驾驶汽车所用绝对绰绰有余。 9. 指手画脚的BOSS让人抓狂 这算不上是展望,因为他们已经做到了——这些上司们在速成班里学了点编程,就觉得自己成了行家,程序员于是就这样“被帮助”了。 “你要用一个变量吗?”

    1.1K20发布于 2018-09-18
  • 来自专栏数据猿

    数据到智慧——拓尔思发布9新品

    9月21日,大数据和人工智能的领军企业拓尔思在北京举办新产品发布会,在这场题为“大数·云·智”的发布会上,拓尔思正式发布了9新产品。 记者 | Jimmy 官网 | www.datayuan.cn 微信公众号ID | datayuancn 导语:9月21日,大数据和人工智能的领军企业拓尔思在北京举办新产品发布会。 在这场题为“大数·云·智”的发布会上,拓尔思正式发布了9新产品,分别涵盖技术基础平台、行业应用产品及数据智能云服务三类别,并与政府、媒体、安全、金融等多个行业的用户及业内专家约500多人分享了最新实践经验和应用案例 本次发布会拓尔思发布的九新品包括:大数据时代的检索引擎TRS Hybase海贝大数据管理平台V8.0、代表“人工智能皇冠上的明珠”的TRS DL-CKM基于深度学习的自然语言处理引擎V7.0、全球最快的分布式数据库 当天,拓尔思集团旗下的9家成员企业和生态伙伴也同场亮相,天行网安、金信网银、科韵大数据、耐特康赛、八爪鱼·大数据、极海、有数金服、智齿客服、数知科技等公司分别展示了各自的业务概览,涵盖网络信息安全、金融监管科技

    1.5K80发布于 2018-04-24
  • 来自专栏数据猿

    【AI模型展】思必驰DFM模型——具有通用智能、针对垂域的行业语言模型

    思必驰DFM模型 该AI模型由思必驰投递并参与数智猿×数据猿×上海大数据联盟共同推出的《2025中国数智产业AI模型先锋企业》榜单/奖项评选。 大数据产业创新服务媒体 ——聚焦数据 · 改变商业 思必驰自研的对话式语言模型DFM(Dialogue Foundation Model),中文直译为“通用对话基础模型”,具备通用语言计算模型的所有 具体来看,思必驰可为客户提供数据工程、基底模型、训练平台、提示词工程等一系列模型所需的技术工程资源,并结合客户的高端智算算力、专有场景数据,实现垂直领域的模型大规模可定制能力,赋能智能汽车、智能家居 点击文末“阅读原文”链接还可查看思必驰DFM模型官网 ★以上由思必驰投递申报的项目案例,最终将会角逐由数智猿×数据猿×上海大数据联盟联合推出的《2025中国数智产业AI模型先锋企业》榜单/奖项。 该榜单最终将于9月8日北京举办的“2025第五届数智化转型升级发展论坛——暨AI模型&AI Agent趋势论坛”现场首次揭晓榜单,并举行颁奖仪式,欢迎报名莅临现场:

    54910编辑于 2025-10-21
  • 来自专栏sktj

    Kubernetes(9:数据)

    作用是在Pod中共享数据 创建Pod,volumeMounts ? image.png emptyDir是Host上创建的临时目录,其优点是能够方便地为Pod中的容器提供共享存储,不需要额外的配置。

    41520发布于 2019-09-24
  • 来自专栏企鹅号快讯

    2018全球9科技趋势展望

    以下为德勤对2018年全球科技市场做出的9预测: 1.2018年,全球将有超过10亿智能手机用户至少拥有一次创作增强现实(AR)内容的经历。 1/5的北美家庭将通过手机移动网络进行全部的互联网数据接入。 9。得益于新的芯片和更好的软件工具,2018年企业测试和部署机器学习技术的努力将增加一倍。 以上文字来源于德勤

    88370发布于 2018-03-02
  • 来自专栏PHP在线

    PHP中9缓存技术总结

    该种方式可以用于如商城中的商品页; 3、数据缓存 顾 名思义,就是缓存数据的一种方式;比如,商城中的某个商品信息,当用商品id去请求时,就会得出包括店铺信息、商品信息等数据,此时就可以将这些数据缓存 到一个 ; 4、查询缓存 其实这跟数据缓存是一个思路,就是根据查询语句来缓存;将查询得到的数据缓存在一个文件中,下次遇到相同的查询时,就直接先从这个文件里面调数据,不会再去查数据库;但此处的缓存文件名可能就需要以查询语句为基点来建立唯一标示 ; 试想,如果对商品页不缓存,那么每次访问一个商品就要去数据库查一次,如果有10万人在线浏览商品,那服务器压力就了; 6、内存式缓存 提到这个,可能大家想到的首先就是Memcached;memcached 一般的使用目的是,通过缓存数据库查询结果,减少数据库访问次数,以提高动态Web应用的速度、 提高可扩展性。 ,默认60 memory_limit = 128M ; 每个PHP页面所吃掉的最大内存,默认8M 9、Opcode缓存 我们知道,php的执行流程可以用下图来展示: ?

    1.9K50发布于 2018-03-08
  • 来自专栏吴伟祥

    国内9免费CDN汇总 转

    9、Nimsoft:国外CDN,在全球数十个国家有服务器(包括在中国),放在国外的网站推荐使用,并提供网站检测工具。

    44.1K60发布于 2018-10-10
  • 来自专栏PHP在线

    PHP中9缓存技术总结

    该种方式可以用于如商城中的商品页; 3、数据缓存 顾 名思义,就是缓存数据的一种方式;比如,商城中的某个商品信息,当用商品id去请求时,就会得出包括店铺信息、商品信息等数据,此时就可以将这些数据缓存 到一个 ; 4、查询缓存 其实这跟数据缓存是一个思路,就是根据查询语句来缓存;将查询得到的数据缓存在一个文件中,下次遇到相同的查询时,就直接先从这个文件里面调数据,不会再去查数据库;但此处的缓存文件名可能就需要以查询语句为基点来建立唯一标示 ; 试想,如果对商品页不缓存,那么每次访问一个商品就要去数据库查一次,如果有10万人在线浏览商品,那服务器压力就了; 6、内存式缓存 提到这个,可能大家想到的首先就是Memcached;memcached 一般的使用目的是,通过缓存数据库查询结果,减少数据库访问次数,以提高动态Web应用的速度、 提高可扩展性。 ,默认60 memory_limit =128M;每个PHP页面所吃掉的最大内存,默认8M 9、Opcode缓存 我们知道,php的执行流程可以用下图来展示: ?

    2K40发布于 2018-03-08
  • 来自专栏nginx遇上redis

    9项目管理领域

    项目范围管理(Project Scope Management) 其作用是保证项目计划包括且仅包括为成功地完成项目所需要进行的所有工作。范围分为产品范围和项目范围。产品范围指将要包含在产品或服务中的特性和功能,产品范围的完成与否用需求来度量。项目范围指为了完成规定的特性或功能而必须进行的工作,而项目范围的完成与否是用计划来度量的。二者必须很好地结合,才能确保项目的工作符合事先确定的规格。因此选项B是正确的。 项目时间管理(Project Time Management) 其作用是保证在规定时间内完成项目。因此选项C是错误的。 项目成本管理(Project Cost Management) 其作用是保证在规定预算内完成项目。因此选项D是错误的。 项目质量管理(Project Quality Management) 其作用是保证满足承诺的项目质量要求。 项目人力资源管理(Project Human Resource Management) 其作用是保证最有效地使用项目人力资源完成项目活动。 项目沟通管理(Project Communications Management) 项目沟通管理, 是在人、思想和信息之间建立联系, 这些联系对于取得成功是必不可少的。参与项目的每一个人都必须准备用项目“语言”进行沟通, 并且要明白, 他们个人所参与的沟通将会如何影响到项目的整体。 项目沟通管理是保证项目信息及时、准确地提取、收集、传播、存贮以及最终进行处置。 其作用是保证及时准确地产生、收集、传播、贮存以及最终处理项目信息。 项目风险管理(Project Risk Management) 项目风险管理, 需要的过程有识别、分析不确定的因素, 并对这些因素采取应对措施。?项目风险管理要把有利事件的积极结果尽量扩大, 而把不利事件的后果降低到最低程度。其作用识别、分析以及对项目风险作出响应。 项目采购管理(Project Procurement Management) 其作用是从机构外获得项目所需的产品和服务。项目的采购管理是根据买卖双方中的买方的观点来讨论的。特别地,对于执行机构与其他部门内部签订的正式协议,也同样适用。当涉及非正式协议时,可以使用项目的资源管理和沟通管理的方式解决。

    57820编辑于 2023-02-10
  • 来自专栏华章科技

    50%企业数据治理失败!这9要素才是成功关键

    导读:企业数据治理的9个要素。 影响企业数据治理建设成效的因素很多,主要有9个要素,如图3-2所示。 ▲图3-2 企业数据治理的9个要素 01 数据战略 很多企业都说自己重视数据,但是能规划出明确的目标、范围、实施路径并具备可执行数据战略的企业却很少。 03 数据文化 数据文化是企业所有人员对数据价值的一致认同,具体表现为:用数据说话,用数据管理,用数据决策,用数据创新。 04 管理流程 数据治理的目标是提升数据质量,让数据源于业务,回馈业务。 涉及的数据治理技术主要包括数据建模、数据标准、数据质量、数据安全、数据集成、数据处理、数据使用等。 企业的数据治理应做好全面规划,结合企业实际业务需求选择合适的技术路线,有条不紊地推进。

    1.1K20编辑于 2022-04-14
领券