首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Apache Doris

    Apache Doris 2025 Roadmap:构建 GenAI 时代实时高效统一数据底座

    2025 年,Apache Doris 社区将秉承“以场景驱动创新” 的核心理念,持续深耕三大核心场景的关键能力,并对大模型 GenAI 场景的融合应用进行重点投入,为智能时代构建实时、高效、统一数据底座 Doris 2025 Roadmap2025 年,社区将秉承“以场景驱动创新” 的核心理念,持续深耕三大核心场景的关键能力,并对大模型 GenAI 场景的融合应用进行重点投入,为智能时代构建更加实时、高效、统一数据底座 后续计划将把所有内部任务(如 Schema Change、Compaction 和统计信息收集)纳入统一的资源管理框架,并统一管理这些任务在资源受限情况下的行为,包括取消和排队等操作。 湖仓一体在 2025 年,社区将重点推进开放湖仓生态的建设,打造统一的分析入口,以高效便捷地实现湖仓数据处理与分析,全面提升用户体验。 届时,Doris 将从高效分析引擎扩展为高效的分析和混合检索引擎,成为智能时代实时、高效、统一数据底座

    80500编辑于 2025-04-03
  • 来自专栏Apache Doris

    Apache Doris 4.1:面向 AI & Search 的统一数据存储与检索底座

    它不只是新增某几个功能,而是围绕 AI 应用落地过程中最核心的几类问题,给出了更完整、更统一的解决方案: 如何低成本存储海量 AI 数据 如何把结构化过滤、全文检索、向量检索统一在一个系统里 如何承载百万 SQL 和统一存储体系中。 物化阈值控制:用 variant_doc_materialization_min_rows 控制物化阈值,低于阈值的数据延迟处理,统一在 compaction 阶段完成。 04 更完整的一体化湖仓能力 4.1 在数据湖方向实现了重要升级,从格式支持、查询性能到生态兼容性,全面增强 Doris 作为统一湖仓分析引擎的能力。 从向量检索、长上下文存储,到混合检索与统一分析能力,Doris 正在逐步构建更完整的数据处理闭环。

    78310编辑于 2026-04-24
  • 构建AI时代统一数据底座:腾讯云向量湖加速多模态数据价值释放

    应对AI数据管理效率与性能瓶颈 传统数据湖架构面临多模态数据管理挑战:数据分散于不同系统导致ETL流程复杂、时效性差;数据修改与模式变更困难;跨系统版本一致性难以维护。 实施向量化数据架构升级 腾讯云提出向量湖解决方案,基于Iceberg和Lance双引擎架构实现多模态数据统一管理: Iceberg向量表集成LSH索引技术,支持实时增量构建索引,保证索引与数据可见性一致 ,延迟控制在毫秒级 统一存储原始数据与向量表示,减少50%数据冗余存储 某金融客户智能投研平台实践 某头部证券公司在腾讯云向量湖基础上构建智能投研系统,整合研报、新闻、财报、音频会议记录等多源数据。 通过统一向量化处理,实现跨模态语义检索,研究员查询效率提升3倍,模型训练数据准备时间从小时级降至分钟级,异常交易识别准确率提升40%。 腾讯云向量湖支持原生多模态数据管理,提供统一数据服务TBS,实现数据资产图谱构建,已在金融、电商、医疗等行业落地验证。

    17810编辑于 2026-04-27
  • 破解AI数据规模限制:面向Agent的统一存储底座与降本实践

    二、 重构底层逻辑:发布Agent原生的三层协同存储架构 为解决上述冲突,腾讯云创新性地重构了数据底座,推出为Agent设计的存储新方案——Agent Storage。 该架构通过统一接入实现存算一体与智能驱动,自上而下划分为三层: 应用层:支撑Agent搭建、多模态检索与企业知识库。 智能层:负责内容理解与索引、向量化处理以及文档与媒体加工。 该机制在存储底座与业务应用之间建立了用户粒度的管理能力。 五、 夯实AI基础设施:构建统一的多模态数据管理引擎 Agent Storage 不仅是单一的存储产品,而是嵌入整个 AI Agent 生态(涵盖Runtime环境、Memory长期记忆、TokenHub 模型接入、安全与日志监控)的统一底座

    23210编辑于 2026-05-26
  • 重构Agent时代统一数据底座:突破多模态存储性能与成本瓶颈

    部署智能体原生架构与多模态管理引擎 针对AI时代“从简单存到能理解”的需求,腾讯云重新定义了Agent Storage方案,构建了“统一接入·三层协同”的数据底座(包含应用、智能、存储三层),提供以下针对性技术模块 落地腾讯网盘与协同办公全场景统一管理 腾讯网盘基于该存储底座完成了架构升级,实现了个人、企业、团队全场景覆盖以及公有云/独立部署等环境适配。 用户可通过自然语言直接检索文档、图片、视频等多模态类型数据,在海量 Agent 数据中快速定位并提取所需内容,实现统一存储、统一配额与统一管理。 确立智能体基础设施生态核心底座站位 在完整的 AI Agent 生态位中(涵盖 Runtime、Memory、TokenHub、AI安全及日志监控),底座的先进性决定了上层应用的上限。 腾讯云存储方案的技术确定性在于: 标准化与无缝对接: 提供标准化的 Agent API,打破数据孤岛,实现多模态数据统一接入与大模型的无缝对接。

    1500编辑于 2026-06-11
  • 构建统一数据底座与智能政务平台,提升政府服务效率与安全性

    破解数据孤岛与治理难题 政府机构在数字化转型中面临数据分散、系统独立导致的“信息烟囱”问题。 例如,深圳市政务服务平台需管理211亿条数据,覆盖超2000万人口和300万法人,日均数据交换量超2000万条,但存在数据标准不统一、治理能力薄弱及技术架构滞后等瓶颈。 部署分布式数据库与智能平台 腾讯云为深圳市政务服务平台提供TDSQL分布式数据库(45个节点),支撑高并发场景,并基于腾讯大数据TBDS与WeData构建多租户数据治理工具。 实现数据整合与业务效率提升 深圳市政务平台已接入30余家单位,汇聚超600亿条数据,存储量达918TB,支撑150个主题库建设,并发布800余项数据资源服务。 “通过腾讯云TDSQL分布式数据库,我们构建了金融级可靠、高可用的数据底座,有效支撑全市核心业务系统。”

    29510编辑于 2026-04-11
  • 两轮车圆柱电池模组PACK线数据采集架构:从协议混乱到统一数据底座

    采用边缘网关作为数据接入的统一入口。 网关侧需要支持主流工业协议的解析:下行采集侧包括Profinet、EtherNet/IP、ModbusTCP、CANopen、OPCUA,上行输出侧统一转换为MQTToverTLS。 建议边缘层采用容器化部署方式,将协议适配、数据清洗、数据转发解耦为独立的微服务,便于后续引入新的数据预处理能力。第三,从一开始就建立数据质量度量体系。 很多PACK线的数据采集项目失败,不是因为技术选型不对,而是上线后没人维护数据质量。数据缺失、时间戳错乱、设备ID不一致等问题会迅速腐蚀数据价值。 各位在做产线MES或数据采集架构设计时,焊接波形这类高频数据保存多久?遇到协议转换问题时,是倾向于统一设备选型还是做协议适配层?欢迎留言讨论。

    15710编辑于 2026-05-25
  • 腾讯云数据底座演进:构建统一语义层与极致弹性架构,驱动 50%+ 资源降本

    第一章:突破人机协同信任瓶颈与海量数据资源错配困境 随着海量数据的爆炸式增长,企业在向智能化与云原生架构转型的过程中,面临着数据消费层与底层基础设施层的双重战略困境: 智能分析的“巴别塔困境”: 在数据应用端 传统云数据库资源浪费与扩容滞后: 在底层架构端,传统云数据库存算一体,容易产生资源碎片。 第二章:重构统一数据语义引擎与存算分离弹性架构 针对上述痛点,腾讯云专家团队(包含主讲人虎兴龙、腾讯云数据库产品经理邓昕瑞、腾讯云数据库高级产品经理扶婕)提出从语义层到数据底座的针对性技术解决方案: 部署 WeData Unity Semantics 统一语义层: 作为连接底层数据与业务用户的桥梁,通过 Data Context Engineering(数据语义工程)构建人与机器都能理解的数据资产 第五章:夯实高确定性的智能数据生态底座 在开源流行度稳居前列的市场环境下,腾讯云凭借技术积淀构建了兼具性能与生态连接力的数据底座

    10310编辑于 2026-05-29
  • 来自专栏凯哥讲故事系列

    DataOps:数据中台的必备底座

    前言 数据中台的崛起代表了企业数字化转型从流程驱动走向数据驱动,从数字化走向智能化。而DataOps则是数据中台区别于传统企业数据架构的核心差异,是建设数据中台的必备底座能力。 ,从而能够更好的产生数据创新和增进协作 提升数据数据服务的可复用性 优化数据质量 构建一个统一的,标准化的,同源的数据协作平台 为了更直观的体现有了DataOps和没有DataOps的区别,下图的对比是一个很好理解的方式 从数据源直接实时获取数据,然后进入数据湖,通过流式数据处理,实时数据仓库,规模化的自动数据处理过程等工具构建分析数据管理闭环,最终输出多元化的数据服务。 上图是典型的数据价值链过程,而DataOps就是支撑着整个全生命周期的底座,成功的DataOps体系有四个特质:CAUTA。 全面/Universal 作为企业全域数据底座,DataOps要全面的支持所有的场景和数据,如下图所示例,列示出了常用的30种数据源和40种目标数据。 ? 可以分解的更加细致: ?

    8.9K37发布于 2020-07-09
  • 大模型智能体时代重铸制造业数据底座统一命名空间硬核解耦ITOT

    制造业AI规模化应用的实践案例:统一命名空间、数据核心与智能体走向未来第四次工业革命的核心驱动力是人工智能。 它作为统一数据的目的地和全球规模分析与AI的引擎,是UNS架构的思想和认知功能。 8 跨IT/OT宏观孤岛的融合:从边缘到全球的数据核心消息代理擅长在边缘和工厂层面统一数据,而Snowflake则擅长在全球规模上将这种统一数据与ERP、SCM和CRM等所有其他企业数据源进行整合。 9 AI/ML全生命周期的内化:数据治理与计算的统一Snowflake不仅是数据仓库,它还是整个AI和机器学习(ML)生命周期的端到端平台。 工厂的统一数据核心不再仅仅是模型的训练语料,而是作为动态的、可检索的知识层,实时注入到LLM的推理过程中。

    61600编辑于 2025-10-27
  • 来自专栏IT创事记

    创新数据底座:智能制造的“圣杯”

    进行仿真计算需要处理大量的实时数据,对系统的计算和数据吞吐能力都有极高的要求。既有的数据基础设施很难满足以汽车研发为代表的新增需求,创新的数据底座成为智能制造时代被寄予厚望的“圣杯”。 仿真平台只是创新数据底座的冰山一角。 华为构建的创新数据基础设施,将成为国内制造企业数字化转型坚实的数据底座,其示范效应影响深远。 其采用华为分布式文件存储系统,可以横向扩容,满足不断升级的需要;同时用统一的资源池去解决系统和业务的共用存储问题,并基于内存的数据缓存技术提升数据吞吐效率。 存储产品的高歌猛进,为华为创新数据基础设施提供了充足的底气;与更多懂行业、懂业务、懂技术的合作伙伴携手同行,则是华为构建制造业等行业数据底座的生态保障。

    55620编辑于 2022-08-30
  • HarmonyOS Next数据底座向量数据库介绍

    背景今年HDC在展厅遇见了HarmonyOS 数据底座的架构师,介绍了基于数据底座实现端侧能力的智能小助手,听着很吸引人,HarmonyOS将端侧AI做到了系统层,给开发者创造了无限可能。 向量数据库概述向量数据库是一种支持存储、管理和检索向量数据数据库系统,同时兼容传统的关系型数据处理能力。 从API version 18开始,向量数据库正式支持通过标准化接口实现数据持久化,为开发者提供了可靠的数据存储解决方案。 结果集采用惰性加载策略,只有在实际访问数据时才会从存储层加载,有效降低了内存消耗。向量数据表示floatvector是向量数据库的核心数据类型,用于表示高维向量数据数据类型与约束支持的数据类型向量数据库支持丰富的字段类型,满足多样化的数据存储需求:类型描述是否支持NULL空值是INTEGER整形是DOUBLE浮点类型是TEXT字符串类型是BLOB二进制类型是FLOATVECTOR

    38110编辑于 2025-07-06
  • 来自专栏多系统用户权限管理

    【KPaaS】统一权限管理如何保障安全?——企业数字化治理的安全底座

    这些看似“管理上的小瑕疵”,却往往成为企业数据泄露、业务越权、审计不合规的根源。企业迫切需要一种机制,能够在多系统、多角色、多场景的复杂环境中,统一身份管理、集中权限控制、确保授权可追溯与可审计。 员工岗位调整后,旧权限未及时回收,新权限又被追加叠加,导致权限膨胀,甚至出现跨部门访问敏感数据的情况。这种“权限漂移”在长期运行后,会严重侵蚀企业的数据安全边界。 无论是“跨系统协作”还是“多租户运营”,都能确保数据和操作在授权范围内独立安全。 一个科学的权限体系,既能保障数据安全,又能提升协作效率,让企业在高速发展的同时保持稳健的安全底线。 而在这一过程中,IAM 用户中心正以其开放架构、强集成力和审计可视化能力,为企业构建起一套统一、安全、可控的权限管理体系,让权限治理真正成为数字化运营的坚实底座

    38921编辑于 2025-12-04
  • 来自专栏量子位

    都在卷大模型底座,云计算一哥决定给底座底座

    为什么需要大模型底座? 由表及里,大概有两层原因驱动。 首先是直接原因,行业需求。 生成式AI将会形成一个新市场,如今已是行业公认的趋势。 那么亚马逊云科技的动作,则是给出了一种新范式,将多种大模型囊括在一起,放在一个大平台底座上,让用户的可选择性提升,同时发挥他们云厂商本身的优势,让用户的调用和定制化过程门槛更低、效率更高,并在安全性做出保障 更深层次的原因在于,给大模型加底座,能够更进一步降本增效,这本身就符合市场和行业的发展要求。 而除了大模型底座,在近期或许还会衍生出一大批“新兴物种”。比如当下软件应用在争先恐后接入Chatbot,就有企业推出相应服务帮软件应用接入大模型能力。 可见在当下这个时刻,怎么把握机遇非常关键。 其中,比如光数据这一环就分为数据提供商和数据服务商,光数据提供商就包括提供通用数据、垂直数据、特定业务下的标注数据、符合法规的审核数据等等。

    39910编辑于 2023-05-06
  • 来自专栏知识分享

    WIFI底座

    自己贴片的51+WIFI的开发板终于到了。。还是贴片的好看 美中不足的是需要改一个电阻的阻值。。还有就是由于自己的8266和51单片机一块断电上电,所以如果用的USB线的质量不好就会出现 下载不了程序

    1.3K40发布于 2018-06-01
  • 来自专栏机器之心

    覆盖200+服务场景,阿里「通义」大模型系列打造国内首个AI统一底座

    为了实现大模型的融会贯通,阿里达摩院在国内率先构建 AI 统一底座,在业界首次实现模态表示、任务表示、模型结构的统一。 阿里达摩院构建 AI 统一底座 M6-OFA 模型实现架构、模态和任务统一 通义统一底座统一学习范式的实现背后离不开阿里达摩院的多模态统一底座模型 M6-OFA,相关研究被 ICML 2022 接收, 、RefCOCO + 和 RefCOCOg 三个数据集均取得最优表现,以及在视觉推理任务的数据集 SNLI-VE 上取得第一。 通义统一底座的另一组成部分「模块化设计」正是借鉴了这种运行机制。 基于统一底座打造层次化模型系列 大模型最终是要实现落地,满足各行各业的应用需求。因此,阿里达摩院基于其 AI 统一底座构建了通用模型与专业模型协同的层次化人工智能体系。

    2.1K30编辑于 2022-09-06
  • 数据平台数据底座能力构建技术指南

    摘要 本文旨在解析大数据平台的数据底座能力,探讨其核心价值、典型场景、关键挑战,并提供详细的操作指南。同时,对比分析通用方案与腾讯云方案的差异,并提供场景化案例以展示腾讯云产品的优势。 技术解析 核心价值与典型场景 大数据平台的数据底座能力,指的是构建企业级数据仓库和数据资产管理的能力。这一能力的核心价值在于: 性能提升:与传统数仓/大数据解决方案相比,性能提升10~100倍。 构建企业级数据仓库 原理说明:企业级数据仓库构建需要从异构数据源导入数据,通过大数据组件进行数据开发、任务编排和运维,最终通过数据导出或API服务应用数据。 结论 大数据平台的数据底座能力是企业数字化转型的关键。腾讯云提供的WeData、COS和BI工具等产品,能够帮助企业在性能、成本和数据治理方面取得显著优势。 通过上述操作指南和增强方案的对比,企业可以根据自身需求选择合适的技术方案,实现数据底座能力的构建和优化。

    61310编辑于 2025-07-28
  • 来自专栏大数据&分布式

    统一数据数据血缘

    背景介绍 数据血缘(Data Lineage):是数据治理中元数据管理领域下的一个子范畴,是数据的溯源过程,获得数据产生链路,发现数据的关联关系,目的是解决"数据的哲学三问":我是谁,我从哪里来,我到哪里去 Calcite也可支持数据血缘解析,由于Calcite主要针对统一的SQL方言,对原生多方言支持较弱,因此会有很多工作量在于扩展原生的SQL方言,该实现可参考 Linkedin Coral 处理。 ,对应的数据支持保存在关系数据库中。 血缘解析应用流程如下: 生产数据:上层数据地图、数据开发等功能在SQL和任务过程中,主动push给元数据应用层,元数据应用层基于固定消息格式将对应的数据生产到消息中间件; 消费数据:血缘服务定时从消息中间件消费数据进行处理 总结 数据血缘是数据治理的重要应用之一,通过血缘信息可清晰识别出表之间的依赖关系,追踪数据的来源和流向过程。数据血缘对于数据质量管理、合规性以及数据安全都有重要的作用。

    5.5K98编辑于 2024-05-11
  • 来自专栏Java架构师进阶

    springboot 统一异常处理(包含统一数据校验)

    1、统一异常处理的优势 在开发中,我们是否遇到过如下两种奇葩现象: (1)只要没有成功,不管什么原因,前端界面给出提示:服务端错误/异常。 哪怕是数据校验不过,也这样提示(嗯,反正先把锅甩出去再说,具体什么原因我才不在乎呢,老子就是这么聪明); 如果想学习Java工程化、高性能及分布式、深入浅出。 那么异常统一处理有什么好处呢? 提高用户体验; 业务逻辑和异常处理逻辑解耦; 对异常进行分类统一处理,减少冗余代码; 便于代码风格统一,并且更优雅(比如参数校验的时候,得写很多if else,并且不同的人写法不一致); 2、统一异常处理的实现 2.2 统一异常处理 java异常详解 首先,定义自己的异常类,随便起个名字哈,MyException.java @Data public class MyException extends Exception

    1.3K41发布于 2019-04-09
  • 来自专栏化羽学Java

    1、统一数据返回

    1、统一数据返回 使用逆向工程来进行测试,实体,mapper等省略; 1.1 直接使用 RequestResoult 1.1.1 RequestResoult 请求结果返回实体 //统一返回 实体 类 RequestResult<T> { //状态码 private String code; //状态说明,对code的说明 private String msg; //接口数据 模糊查询 edocEntryExample.createCriteria().andSummaryLike("%" + summary + "%"); //调用持久层 查询数据 */ EDOC_DATABASE_ERROR("401", "数据库异常"), /** * 数据库异常 */ EDOC_SYSTEM_ERROR ) //指定对该自定义异常类 进行处理 @ResponseBody //指定返回的数据 为 json类型 public RequestResult<?

    1K20编辑于 2022-10-31
领券