首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏大数据文摘

    5架构:细数数据平台的组成与扩展

    数据处理平台已不集中于传统关系型数据库,各种其他平台层出不穷,也各有其适用范围。 从哪些角度去理解各种数据处理平台的设计思想及发展演进呢? 这种方式有一个弊端是存储的数据量受限于内存的大小,数据量一,索引也增大,数据就饱和了。 2)第二种方式是把的索引结构,拆成很多小的索引来存储。 列式存储尤其适用于表扫描,求均值、最大最小值、分组等聚合查询场景。 列式存储特别适合需要加载数据块,且数据块分到多个文件中的场景。Druid把一些近线实时数据放到写优化的存储中,然后随着时间的推移逐步把这些数据迁移到读优化的存储中。 5、流式处理架构 不像是批处理架构,把数据存储到HDFS上,然后在上面执行各种跑批任务。

    1.9K80发布于 2018-05-22
  • 来自专栏数据科学与人工智能

    美国大数据智能理财平台5模式

    不过,世易时移,近年来美国出现了智能投资市场,涌现出很多基于大数据分析的智能理财平台,大大降低了财富管理的门槛,让原先处于“服务真空区”的中产阶级也能享受同等的财富管理服务。 ? 智能理财平台为什么会成功? 现在看来,有两因素促成了这些智能理财平台的成功。 首先,ETF基金的出现大大降低了投资成本。 第1种:基于大数据分析给出投资建议 这种类型的平台根据客户在其他理财交易平台的行为数据,全面了解客户的财务状况和投资现状,帮助客户对过去的投资决策做出回顾。 第2种:基于大数据分析购买投资组合 这种类型的平台基于客户的财务状况和风险承受能力,为客户推荐或购买相应的交易型指数基金。 ETF成为这类型平台的首选基金,因为它的周转率低,降低了交易成本。 第5种:跟投基金经理人的交易 这种类型的平台会即时跟踪基金经理人的投资组合以及每一笔交易动态,平台可以自动帮助普通投资者做出同样的交易或通知投资者让他们自己做出决定。

    2.3K60发布于 2018-02-28
  • 5步骤打造基于YashanDB数据库的数据平台

    构建基于 YashanDB 数据库的数据平台是一个复杂的过程,涉及多个步骤。以下是五步骤,可以帮助你构建一个有效的数据平台:第一步:需求分析与规划1. 明确目标:确定数据湖的主要用途,例如数据分析、机器学习或实时处理等。2. 数据来源:识别需要集成的各种数据来源,包括结构化、半结构化和非结构化数据。3. 数据采集:设置数据采集管道,确保能够有效地从不同来源获取数据,包括批量和实时数据。2. 格式转换:在数据进入数据湖之前,进行必要的数据格式转换,保证数据的一致性。3. 元数据管理:为数据湖中的数据创建元数据,便于后续的数据管理和查询。第四步:数据存储与管理1. 选择存储解决方案:根据数据量、访问频率和处理要求,选择合适的存储方式(如 ODS、数据仓库等)。2. 持续优化:根据用户反馈和数据使用情况,不断优化数据湖的结构和性能,迭代改进流程。这五步骤为构建基于 YashanDB 的数据平台提供了一个系统化的框架。

    11810编辑于 2025-11-14
  • 来自专栏PDF转换docx

    5值得推荐的客户协作平台

    3.简道云知识库 简道云知识库依托于其本身的零代码平台,像富文本编辑、结构化存储、容量、可分享协作、安全性强、支持权限设置这些功能我就不说了,都有。 他们的知识库,沿袭了产品本身的特点(重数据管理、重流程协作),因此可以把知识管理与工作流结合起来。 主要功能 简道云流程 管理员提前设置好流程的节点,负责人和数据流转的路径。 一旦数据提交后,就会进入流程,按照流程的设定进行流转。流程常用于如财务报销、请假审批等场景。 简道云仪表盘 在表单中收集得到的数据,可通过仪表盘来进行查看、分析和处理。 5.ONLYOFFICE ONLYOFFICE是一款开源且免费的办公套件,向用户提供了文本文档,电子表格,演示文稿,以及免费的表单模板等功能。在最新的版本更新中又添加了加密版本的协作空间。 结语; 以上就是我给大家分享的几款比较值得推荐的能与客户或企业之前协作的平台,如果你有更好的协作平台可以推荐,欢迎在评论区讨论。

    1.8K20编辑于 2023-04-26
  • 5理由选择YashanDB作为企业数据平台

    当前企业数据库面临如何优化查询速度、保证数据一致性和高可用性以及支持海量数据和复杂业务场景等关键技术挑战。传统数据库架构往往难以兼顾高性能、可扩展性和稳定性。 为满足不断增长的业务需求,选择一个技术先进且全面的数据平台显得尤为重要。 先进的SQL优化器和执行引擎保障高效查询YashanDB SQL引擎包含解析、校验、优化和执行四阶段,优化器采用成本模型(CBO)进行智能计划生成,使用丰富的统计信息和动态调整技术精准评估执行计划代价 结论选择YashanDB作为企业数据平台,企业能够充分利用其灵活多样的部署方案、先进的存储引擎技术、高效SQL优化执行能力、完善的事务控制以及高可用灾备架构,实现数据管理的高性能、高可靠和高扩展。 通过应用本文所述技术原理和最佳实践,帮助企业打造稳定、高效、可持续发展的数据平台,保障关键业务的稳定运行与发展。

    14810编辑于 2025-11-14
  • 来自专栏人称T客

    移动应用开发平台5问题揭秘

    一旦原生代码生成便难以“整理“及难以定制个体应用 因为是机器生成代码,所以会产生过剩代码,使之难以管理与维护 这种机器生成码的表现也不佳,因为代码必须要被设备“消化” 不能增加“(特色功能)”(HTML5, 对于想要针对特定需求,安排内部人员定制与延展平台的企业而言,缺乏控制度与灵活度是一障碍。 应用更新换代速度快。企业内部开发人员多快可开发出五星级的应用? 应用前端(front end)貌似相当不错,那企业可放心地将该前端与定制的后端(backend)系统整合,以进行数据处理吗? 中间件层针对统一推送服务、数据加密、身份认证、应用版本管理等等提供了新颖的解决办法,使企业能够专注于打造下一个最棒的应用,而不必花时间来改造后端系统。然而通常,MADP供应商却让事情适得其反。 价格是企业衡量MADP的一因素。有些相当具有创意的定价方式往往让企业大吃一惊,因为这种定价含复杂的授权结构及隐藏的专业费用,会大大影响企业总成本。

    1.4K50发布于 2018-03-16
  • 来自专栏腾讯技术工程官方号的专栏

    腾讯数据平台部总监刘煜宏:这5产品平台,展示了腾讯大数据的核心能力

    腾讯技术工程事业群数据平台部刘煜宏受邀参加“腾讯慧聚”品牌的发布仪式,并向在场嘉宾介绍了“腾讯慧聚”的5产品平台。 ? 十年磨一剑,砺得梅花香。 据刘煜宏介绍,腾讯慧聚当前共包括五平台:Dmaster(大数据一站式平台)、Tbase(海量事务处理平台)、TDbank(实时接入平台)、Hermes(实时多维分析平台)、TDinsight(机器学习基础平台 这五平台除了Dmaster是一个一站式、覆盖全流程的平台外,其他四个平台各有侧重。这也是腾讯根据多年服务不同类型客户的经验,所挖掘出的不同需求。 作为实时接入平台,TDbank具有的“高灵活、高可用、高吞吐、低延时”的核心优势,可以从业务数据源获取数据分发给离线/在线处理平台,构建数据源和数据处理系统间的桥梁,将数据处理系统同业务侧的数据源解耦。 实时多维分析平台Hermes,是腾讯针对交互式海量数据分析需求自主研发的数据多维分析平台,是腾讯处理千亿级海量数据用户画像和多维分析的核心技术与经验的积累。

    5K90发布于 2018-01-30
  • 来自专栏机器学习与推荐算法

    SIGIR2024 | OpenP5: 模型推荐评测平台

    TLDR: 本文介绍了一个开源模型推荐评测平台OpenP5,旨在促进用于研究的基于模型生成式推荐系统的开发、训练和评估。 本文提出了一个开源平台OpenP5,旨在促进用于研究目的的基于模型的生成式推荐系统的开发、训练和评估。该平台在10个广泛认可的公共数据集上进行实验。 认识到物品ID在基于模型的推荐中的重要作用,我们还在OpenP5平台中纳入了三种物品索引方法:随机索引、顺序索引和协同索引。 该平台建立在Transformers库之上,便于为用户定制基于模型的推荐模型。 OpenP5拥有一系列功能,包括可扩展的数据处理、以任务为中心的优化、全面的数据集和检查点、高效加速和标准化评估,使其成为实现和评估基于模型推荐系统的工具。

    67510编辑于 2024-07-05
  • 来自专栏大数据知识

    数据5关键处理技术

    一)大数据面临的存储管理问题 ●存储规模数据的一个显著特征就是数据量大,起始计算量单位至少是PB,甚至会采用更大的单位EB或ZB,导致存储规模相当。 可能有些中小企业无法自己快速的获取自己的所需的数据进行分析,这就需要到了第三方的数据平台进行大数据分析。 4)数据挖掘:根据数据功能的类型和和数据的特点选择相应的算法,在净化和转换过的数据集上进行数据挖掘。 5)结果分析:对数据挖掘的结果进行解释和评价,转换成为能够最终被用户理解的知识。 5. 数据质量和数据管理 大数据分析离不开数据质量和数据管理,高质量的数据和有效的数据管理无论是在学术研究还是在商业应用领域都极其重要,各个领域都需要保证分析结果的真实性和价值性。 可能有些中小企业无法自己快速的获取自己的所需的数据进行分析,这就需要到了第三方的数据平台进行大数据分析。

    10.8K30发布于 2021-03-12
  • 来自专栏测试开发干货

    (简易)测试数据构造平台: 5 (首页部分)

    我们现在要做一个首页的前端部分,这个页面的内容主要是我们的工具列表,可以方便进入的用户直接选中工具来进入工具详情页。

    95120编辑于 2022-05-20
  • 数据集成平台,数字化转型过程中扮演的5关键角色

    下面是我们总结的数据集成平台在企业数字化转型过程中的五关键角色,揭示其如何赋能企业,引领数字化浪潮。1. 数据整合的超级枢纽数据集成平台是企业海量数据的超级枢纽。 实时数据流的加速器随着业务对实时性要求的不断提高,通过数据集成平台的实时数据流处理能力。 涉及技术:数据分析平台: 如Apache Spark,提供强大的数据处理和分析能力,支持复杂数据分析任务。 数据可视化工具: 利用Tableau、Power BI等工具,生成直观的数据报表和仪表板,帮助企业更好地理解数据。机器学习: 使用机器学习算法进行预测分析和模式识别,帮助企业发现潜在机会和风险。5. 通过多源数据整合、实时数据同步、数据治理、业务创新和智能应用等方面的技术支持,数据集成平台为企业提供了一个高效、可靠的数据管理和分析平台

    72410编辑于 2024-07-10
  • 来自专栏Spark学习技巧

    58数据平台架构演进-图

    3.4K20发布于 2018-06-22
  • 来自专栏Juicedata

    JuiceFS 在搜车数据平台的实践

    搜车已经搭建起比较完整的汽车产业互联网协同生态。 在这一生态中,不仅涵盖了搜车已经数字化的全国 90% 中大型二手车商、9000+ 家 4S 店和 70000+ 家新车二网,还包括搜车旗下车易拍、车行168、运车管家、布雷克索等具备较强产业链服务能力的公司 , 与搜车在新零售解决方案上达成深度战略合作的长城汽车、长安汽车、英菲尼迪等主机厂商,以及与中石油昆仑好客等产业链上下游的合作伙伴。 基于这样的生态布局,搜车数字化了汽车流通链条上的每个环节,进而为整个行业赋能。 说到大数据,对于每个公司都不陌生。 大数据集群现状 搜车目前大数据集群分为离线计算集群和实时计算集群,离线计算基于 Hive 和 Spark,实时计算基于 Flink,这两类集群分别基于 HDP 和 CDH 两套管理方式。

    2.2K50编辑于 2021-12-10
  • 来自专栏开发小白知识库

    一文认识 低代码开发平台是什么与全球5低代码平台

    二、全球5低代码开发平台以下低代码开发平台都是多年入围Gartner低代码魔力象限的产品,本节按移动友好度、流程编排与合规治理、生态与集成能力、总体拥有成本(TCO)进行介绍。 适配建议:预算充足且追求复杂UI/高性能与平台化治理的组织合适;中小团队需评估TCO。5)Appian定位与优势:源自BPM/CaseManagement,流程编排、规则与治理见长,适配合规密集行业。 三、国际5强简明对比平台核心强项移动友好治理与合规生态/集成TCO粗感受ZohoCreator一体化+移动端快速落地强(离线、拍照、定位)内建权限/审计/灰度丰富连接器+Zoho生态友好PowerApps365 估算变更频率与人力替代:低代码能把后端与全栈人月替换为平台开发与业务配置。合规与数据主权:是否支持环境分离、地区化部署、数据留存策略与审计导出。 六、5强低代码平台与国内低代码平台对比维度国际五强(Zoho/PowerApps/Mendix/OutSystems/Appian)国内主流平台(钉钉/飞书/企微生态及厂商)生态与集成国际SaaS与通用协议强本土协同与财税

    1.2K10编辑于 2025-11-11
  • 来自专栏杨飞@益术

    Android数据存储实现的5方式

    第一种: 使用SharedPreferences存储数据 SharedPreferences是Android平台上一个轻量级的存储类,主要是保存一些常用的配置比如窗口状态,一般在Activity中 重载窗口状态onSaveInstanceState保存一般使用SharedPreferences完成,它提供了Android平台常规的Long长 整形、Int整形、String字符串型的保存。 特点: 面向资源有限的设备, 没有服务器进程, 所有数据存放在同一文件中跨平台, 可自由复制。 SQLite 内部结构: ? 例如: db.execSQL(“INSERT INTO widgets (name, inventory)”+ “VALUES (‘Sprocket’, 5)”); 另一种方法是使用 SQLiteDatabase 定义你要返回给客户端的数据列名。如果你正在使用Android数据库,则数据列的使用方式就和你以往所熟悉的其他数据库一样。但是,你必须为其定义一个叫_id的列,它用来表示每条记录的唯一性。 5.

    4.3K20发布于 2019-02-21
  • 来自专栏Java学习网

    Android数据存储实现的5方式

    Android数据存储实现的5方式 数据存储在开发中是使用最频繁的,在这里主要介绍Android平台中实现数据存储的5种方式,更加系统详细的介绍了5种存储的方法和异同。 第一种: 使用SharedPreferences存储数据 SharedPreferences是Android平台上一个轻量级的存储类,主要是保存一些常用的配置比如窗口状态,一般在Activity中 重载窗口状态 特点: 面向资源有限的设备, 没有服务器进程, 所有数据存放在同一文件中跨平台, 可自由复制。 SQLite 内部结构: ? 存储一个修改过的数据库到设备上,使用 adb push 命令。 一个最方便的 SQLite 客户端是 FireFox SQLite Manager 扩展,它可以跨所有平台使用。 如果你正在使用Android数据库,则数据列的使用方式就和你以往所熟悉的其他数据库一样。但是,你必须为其定义一个叫_id的列,它用来表示每条记录的唯一性。 5.

    8K90发布于 2018-02-26
  • 来自专栏CDA数据分析师

    译文 | 新兴大数据企业的5挑战!

    大约75%的组织表示,他们已经在先进大数据设施上投入了大量资金或者在未来几年会投入大量资金。同时,一批新兴大数据企业如雨后春笋般破土而出,以此满足企业客户不断增长的市场需求。 这里是当今新兴大数据企业面临的5挑战: 1.人才匮乏 大数据是一个增长中的市场。六成的企业决策者都预计本年度会在大数据项目上投入更多资金,只有5%认为会有所减少。 对大数据本身及其发展潜力的过度宣传,让很多企业盲目跟风,不管这些大数据到底能不能满足自己的实际需求,他们这样做,只是因为流行。 更复杂的一个事实是,大数据平台本身上就很复杂。 5.激烈竞争 2015年,大数据的全球消费预计将达到1250亿,初创公司不必再走向大数据的路途上感到孤单,因为如SAP,微软和IBM这样的企业也要面临残酷的竞争。 这里的教训:建立一个成功的大数据业务是不是为懦弱者准备的。但是,如果你为上面描述的五挑战做好准备,那么,你就可以在大数据领域未来的发展过程中大显身手。

    81350发布于 2018-02-23
  • 来自专栏灯塔大数据

    趋势 | 大数据存储领域5突破技术

    从2011年,纽约的startup公司已经成长为开发者服务的第二云部署平台,为包括亚马逊、谷歌和微软在内的很多大型公司提供简单的、可升级的SSD云服务平台。 2016年,我们期待云服务领域的扩张性发展,从SaaS(软件服务)到PaaS(平台服务),SDN(软件定义网络)和DBaaS(数据库服务)。 GPS、蓝牙和Wi-Fi都是标准配置,下一波自动驾驶和电动汽车方面的创新之处在于汽车并不仅仅是交通工具,而是移动的数据中心,与云平台能够连接。 只能机器人显然非常吸引人,部分是因为它们在人性化和专业设置方面具有非常的应用潜力。 基于以上发展趋势,我们不难想见情绪之于我们的移动装置与冷冰冰的数据是同等重要的。 5数据简化 大数据可以提供我们前所未有的洞察力,而利用这些数据的关键在于解读和分析。

    2.6K60发布于 2018-04-10
  • 来自专栏AIOT

    在Jetson上玩转模型Day16:NanoLLM开发平台(5):视觉数据库分析助手

    为了让大家更进一步感受到NonoLLM库的强大,本文要使用一个集成多模态模型并加上浏览器互动界面的nano_llm.agents.video_query智能体,不仅可以显示输入源的相关信息,还能动态调整输出 输出部分就直接将识别的内容在浏览器中的画面上显示,最后还能结合前面的nanodb数据库项目,提供RAG检索的功能,适用性非常之高。 现在我们依旧使用Efficient-Large-Model/VILA1.5-3b多模态模型来进行演示。 还不够的,nano_llm.agents.video_query智能体还能集成前面nanodb的数据查找的功能,让我们将能力扩展到与现有图片进行比对,快速找出符合度高于要求的图片。 例如,我们在前面的nanodb项目中,使用/data/my_dataset/training2017数据集创建矢量数据库,存放在/data/my_dataset/nanodb下的config.json、

    30710编辑于 2024-12-03
  • 来自专栏GPUS开发者

    在Jetson上玩转模型Day16:NanoLLM开发平台(5):视觉数据库分析助手

    为了让大家更进一步感受到NonoLLM库的强大,本文要使用一个集成多模态模型并加上浏览器互动界面的nano_llm.agents.video_query智能体,不仅可以显示输入源的相关信息,还能动态调整输出 输出部分就直接将识别的内容在浏览器中的画面上显示,最后还能结合前面的nanodb数据库项目,提供RAG检索的功能,适用性非常之高。 现在我们依旧使用Efficient-Large-Model/VILA1.5-3b多模态模型来进行演示。 还不够的,nano_llm.agents.video_query智能体还能集成前面nanodb的数据查找的功能,让我们将能力扩展到与现有图片进行比对,快速找出符合度高于要求的图片。 例如,我们在前面的nanodb项目中,使用/data/my_dataset/training2017数据集创建矢量数据库,存放在/data/my_dataset/nanodb下的config.json、

    45110编辑于 2024-12-05
领券