集群的生产级操作需要许多组件 ,用户通常没有足够的技术能力;问题之二,是尽管 Kubernetes可以在多种类型的基础架构上运行,但多架构同时存在导致云原生平台的底层基础设施(即支持 Kubernetes 集群的计算、存储和网络资源 存储资源盘活系统(Storage Resource Reutilization System, SRRS)。SRRS 可以在存储层面解决上述问题。 SRRS 是一款纯用户态的绿色软件,只有150MB左右的安装包,不需要ROOT权限就可以安装在任何Linux操作系统上,不独占硬盘、操作系统,以2GB内存把各服务器中分散的磁盘整合成高性能的存储资源池, 通过分布式双控制器架构保证了低延迟、高可用、易拓展;支持x86、ARM、龙芯等异构、非对称服务器混合部署,通过功能全面完善的控制台、命令行与API来统一调度管理所有存储设备;通过强大的兼容性和硬件异构性充分利用全部存储资源 SRRS 与 Kubernetes一样,可在多种类型的基础设施上运行,向上提供标准的 iSCSI 接口,完全适配 Kubernetes 的 容器存储接口 CSI 。
2022年末,生成式对话型人工智能ChatGPT和AI生成图片应用Midjourney问世,1个月内获取过亿用户。尽管根据用户使用后的的反馈,它们的表现还不能堪称完美,但已经是令大众惊喜的程度了。 ChatGPT和Midjourney背后的公司是OpenAI,成立于2015年,由Elon Musk和Sam Altman等个人和组织创建,旨在推进和促进人工智能领域的研究。 目前主流的解决方法是硬件存储阵列或分布式存储。 存储资源盘活系统是高性能的。存储资源盘活系统采用分布式双控制器架构,像传统硬件存储阵列一样提供低延迟和高可用性,像传统分布式存储一样提供高可扩展性和高吞吐量。 在AI的时代来临之前,存储资源盘活系统可以为其构建坚固、灵活的存储底座。
既有的数据基础设施很难满足以汽车研发为代表的新增需求,创新的数据底座成为智能制造时代被寄予厚望的“圣杯”。 仿真平台只是创新数据底座的冰山一角。 走出智能制造的深水区、实现向制造业强国的跃迁,需要更多行业领头羊率先垂范。华为构建的创新数据基础设施,将成为国内制造企业数字化转型坚实的数据底座,其示范效应影响深远。 核心业务场景的新挑战 作为高价值数据的重要载体,存储是创新数据基础设施的核心角色,也是智能制造完成升级不可或缺的动力。 存储产品的高歌猛进,为华为创新数据基础设施提供了充足的底气;与更多懂行业、懂业务、懂技术的合作伙伴携手同行,则是华为构建制造业等行业数据底座的生态保障。
2025年7-8月,全球人工智能领域在技术突破、产业落地、政策治理等方面迎来密集进展。 一、技术突破:多模态与智能体能力再创新高1. ,通过“多智能体蜂群协作空间”汇聚超5万个L3智能体,用户可通过自然语言指令搭建专属智能体。 (来源:妖眼看世界)五、国际合作:中国倡议成立世界人工智能合作组织7月26日,在2025世界人工智能大会(WAIC)上,中国政府倡议成立世界人工智能合作组织,总部拟设在上海,旨在推动技术共享、标准共建和发展中国家能力建设 (来源:小姚)总结:技术突破与治理平衡成核心命题2025年7-8月,AI领域呈现“技术跃迁-资本涌入-政策规范”三重共振:生成式视频、多模态模型等技术逼近实用化,Runway、Luma等企业估值爆发式增长
“西部数据的策略:从11碟HDD出发,重塑AI存储底座。 大数据产业创新服务媒体 ——聚焦数据 · 改变商业 让我们来试想这样一个场景:凌晨3点,某大模型云服务平台的日志系统依然在高速写入。 2025年,大模型和智能体进入商用部署的新阶段,“一企一模型”“一行一垂类”的趋势拉开,随之而来的,是以PB乃至EB为单位的数据暴涨。 西部数据的策略: 从11碟HDD出发,重塑AI存储底座 编者认为,AI时代对HDD提出了两个新要求:更大的容量,更长的周期。这不仅仅是一次性的性能突破,更是一次关于“长期信赖”关系的重构。 这是对客户的长期关系战略——构建“存储信赖路径”,帮助客户把其数据底座变成护城河。 每一个多模态模型的推理调用、每一个Agent系统的上下文记录,每一次大语言模型的“记忆保存”,都是对存储底座的“微小索取”。
2024年,智能驾驶市场火热,无论是造车新势力还是老牌车企纷纷发力智能驾驶,他们深知,新能源汽车的下半场已到,再不发力智能驾驶,可能真的有些来不及了。 车企不断加码单车智能的同时,政府也在稳步的推进车路协同。智能驾驶领域一直处在新技术广泛应用和验证的前沿,让我们一起探索智能驾驶的发展将给我们带来哪些启示。 至此,车路云智能网联有了更为具象化的全局展现,车、路、边缘云、区域云及各交通管理平台,共同构建了一个高度智能化的交通管理系统。 这种智能网联的实现,不仅仅是技术上的突破,更是对未来网络发展趋势的生动体现。我们可以透过智能车路协同的智能网联需求,探索未来网络的需求变化。 未来的交通网络将能够支持更加智能、高效、安全的交通管理,为智能驾驶和车路协同技术的发展提供坚实的基础。
而且鉴于这是百度智能云存储的核心底座,需要自主可控并提供给最佳的用户体验。最终我们决定面向百度沧海·存储的元数据场景,自主研发一套类 Spanner 架构的分布式事务数据库作为元数据底座。 5 百度智能云的云存储元数据底座 TafDB TafDB 是面向元数据场景设计的一个分布式数据库系统。 作者简介 曹彪 百度智能云云存储高级架构师、云存储元数据底座技术负责人 2014 年加入百度后一直从事基础架构领域研发,先后负责了百度小批量实时计算平台以及百度智能云元数据存储平台,带领团队从 0 到 1 打造了百度智能云云存储的元数据底座 TafDB,并在对象存储、文件系统大规模上线,现任百度智能云云存储部高级架构师、元数据底座 TafDB 技术负责人。 阴智辉 百度智能云高级研发工程师 TafDB 核心研发 2019 年华中科技大学硕士毕业后加入百度智能云云存储部,至今一直致力于建设云存储元数据底座 TafDB。
数据湖概念一经提出,便受到了广泛关注,人们发现此概念代表了一种新的数据存储理念,海量异构数据统一存储可以很好地解决企业数据孤岛问题,方便企业数据管理与应用。 面对海量数据的存储以及结构化数据、文本、二进制(图片、音频、视频)等数据的存储应用,传统架构的离线数据仓库越来越 “力不从心”。 根据维基的定义,数据湖是一个以原始格式 (通常是对象块或文件) 存储数的系统或存储库。数据湖通常是所有企业数据的单一存储,用于报告、可视化、高级分析和机器学习等任务。 异构数据源数据通过 ChunJun 同步到数据湖平台,历史数据存储 Iceberg 湖内,可以提供更高效的查询同时具备廉价存储。 多种底层存储湖仓平台支持 HDFS、S3、OSS、MInio 等多种底层存储,灵活满足客户不同数据存储需求。
目前 JuiceFS 作为存储底座服务于整个机器学习平台,不仅提高了对混合多云架构的适应性,还大幅提升了数据处理效率。 存算分离:鉴于单盘存储容量的上限,我们需要采用存储与计算分离的架构来确保整体存储容量的充足性。这种架构不仅能够应对存储容量需求的增长,还能够提高系统的灵活性和可扩展性。 JuiceFS 依托于公有云对象存储,不仅成本低廉,还能提供几乎无限的存储容量,最大限度地发挥云存储的优势;其性能主要依赖于对象存储和元数据引擎。 03 基于 JuiceFS 的存储底座设计 元数据引擎架构设计 JuiceFS 采用的是元数据和数据分离的架构。对于元数据引擎的选型,我们考虑了三个方案。 发布颠覆性个人智能系统Apple Intelligence,并彻底改革Siri AI “奸商”的崛起
作者:吴怀宇 2023年6月14日,欧洲议会全体会议表决通过了《人工智能法案》授权草案,标志着该法案将进入欧盟立法严格监管人工智能技术应用的最终谈判阶段。 该法案的建议是通过引进监管沙盒机制来实现,即:在人工智能系统入市或投入使用前,对人工智能系统进行开发、测试和验证以降低风险。 为了给人工智能立法,国外学术界先后出现了蒙特利尔宣言、多伦多宣言等多个人工智能宣言,欧盟《人工智能法案》正是在这些宣言的基础上发展而来。而因为国情的差异,中国当然不可能“在别家的地基上盖自家的房子”。 在这轮全球人工智能治理的热潮中,中国(包括北京等城市)应该加紧颁布具有自身文化属性和特色的《人工智能法案》,但请一定不要忘记,“理性、开放、和谐、人文”才应该是这部“以人为本”的法案最坚实的底座,这才是体现人类文明面对强机器智能的挑战仍然可以长盛不衰的根本力量所在 在人工智能学术圈和产业界有20多年的资深从业经历,曾获“科学中国人年度人物”称号、中国发明创业成果奖(一等奖,中国发明协会颁发)、吴文俊人工智能科技进步奖(中国智能科学技术最高奖,中国人工智能学会颁发)
但如果选择智能分层存储,就无需关注数据访问热度,由对象存储服务来监测数据访问频率,即可将数据智能地在冷热访问层之间转换,且无需数据取回费用,在不损害户访问体验的同时,有效降低存储成本。 智能分层存储优势 无需关注数据访问模式,智能转换存储层 只需为数据指定对象存储类型,即可应用智能分层存储特性。 低频数据无需取回,秒变高频数据 智能分层存储是文件对象级别的存储类型,COS会智能监控每一个处于该存储类型的对象,当检测到某对象的访问热度降低时,会自动将数据转换至低频存储,如果该对象若干时间后重新被人访问 数据自动沉降,存储成本更优 通过监测数据访问频率,自动化管理数据访问层,智能分层存储类型还参与对象存储生命周期流程,用户可以按需将智能分层存储沉降到归档存储中,进一步降低数据在云端的存储成本。 同城容灾MAZ架构已同步智能分层存储类型,数据设计可靠性可达12个9,业务设计可用性可达99.995%。 通过数据冷热分层存储,智能分层能够帮助用户在存储成本和读写性能之间寻找平衡点。
在系列连载《智能时代下的高端存储》首期文章里,回顾了高端存储自诞生以来风起云涌的三十年里脱颖而出的各大厂商的发展。 而在日新月异的当下,涌出了很多质疑声:智能时代,是否还有高端存储的概念?对这个问题,高端存储有自己的“追求”和“坚持”。 关于“智能时代,是否还有高端存储的概念”这一疑问,从不同角度出发得到的答案不尽相同。究其原因则主要在于随着5G、云计算、人工智能和第四次工业革命的深入发展,产业环境和IT技术均已今非昔比。 新时代赋予了高端存储新的定义和使命,智能时代下的高端存储已然与过去的概念不尽相同。 那么,当今高端存储的“变”与“不变”是如何体现的? 这期我们从技术和场景层面一同探讨了新时代高端存储的定义。下期,我们将带领大家一同从高端存储适用的应用场景去看它是如何赋能行业,用独一无二的特性普惠智能时代。
AI 时代,数据库已成为智能 Agent、RAG 系统、大模型应用和 AI 可观测平台 的基础设施。它不仅要能存结构化数据,更要能承载长上下文、向量、全文、Trace、事件流等新型数据。 原生支持 100MB JSON 文档存储 在长上下文、多轮对话、RAG 和 AI Agent 等场景中,将完整交互生命周期作为单个文档存储,已成为实际需求。 聚合扩展优化:先缩数据,再做多维聚合 通过智能识别最细粒度聚合组及其聚合率,在满足条件时,将执行方式从“多组并行聚合”调整为:先完成最细粒度聚合,大幅缩减数据规模,再基于结果计算其他聚合组,从而显著降低计算延迟 对象存储成本优化:在高频导入场景下,通过节点级请求合并,减少对象存储请求次数及小文件数量,整体成本最高可降低 90%。 在宽表与明细查询场景中,体现为更低存储占用与更优冷读性能。
云计算的下半场:资源是底座,智能才是灵魂作者:Echo_Wish(一个一直在云里“搬砖”,却越搬越兴奋的老朋友)兄弟姐妹们,我们今天聊一个我憋了很久、也越来越确信的观点:云计算的上半场,是“资源的竞争” CPU、存储、网络、虚机、容器,谁更稳定、谁更便宜、谁更弹性,谁就能在市场混得更好。但现在情况变了。 3.智能API:云变成懂业务的“超级外包团队”以前的云服务API:创建虚机调用存储提交任务上传数据未来的云服务API:帮我预测未来一周的用户量帮我生成一个自动化营销计划帮我分析哪个SKU该补货帮我自动审核运维变更帮我自动调优数据库索引简单打个比方 4.智能数据:从“存数据”到“理解数据”以前:数据库数据湖对象存储数仓这些都是“存东西”。 (未来)│├──────────────────┤├────────────────────────────┤│买服务器││提供智能决策与自动化││买对象存储││业务预测、自动调优、自动治理││买数据库实例
开放网络硬件平台:释放 VPP + DPDK 潜能厂商利用 VPP + DPDK 技术,在基于通用处理器(如 Marvell ARM, Intel x86)的开放硬件平台上,打造出极具竞争力的网络产品:智能网关平台基于 智能网卡 基于高性能 DPU 芯片,提供 PCIe Gen3.0/4.0 接口,支持 100Gbps 多功能业务处理 (网络/计算/存储卸载)。显著释放服务器主 CPU 资源。
CANN × ROS 2:为智能机器人打造实时 AI 推理底座 在自动驾驶小车、巡检机器人、服务机械臂等场景中,机器人需要在毫秒级时间内完成: 多摄像头目标检测 激光雷达点云分割 语音指令理解 路径规划决策 结语:让机器人真正“看得清、听得懂、反应快” CANN 与 ROS 2 的结合,不是简单的“加速器插件”,而是重构了机器人智能的底层执行范式。 它让复杂的多模态 AI 模型,能在低功耗嵌入式平台上实时运行,为具身智能落地扫清最后一道障碍。 相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库
应对智能汽车数据洪流与算力瓶颈 随着自动驾驶级别提升至L4,单车数据产生量激增至1.6TB/小时(来源:腾讯云技术图表),智能汽车行业面临数据体量指数级增长带来的三大挑战:数据采集传输需健壮网络、100PB +量级数据存储需求(来源:自动驾驶案例)、海量数据高效处理与标注效率。 提升缓存效率与集群OPS能力10倍(来源:GooseFS性能图表);COS对象存储提供12个9的数据可靠性,单集群支持百EB级文件管理,形成统一数据湖底座。 某自动驾驶公司实现百PB数据高效训练 该客户面临100PB+数据存储压力与训练效率瓶颈。 腾讯云技术领先性支撑智能出行升级 腾讯云智算底座获Gartner生成式AI基础设施亚太厂商未来潜力第一(来源:Gartner 2025报告),其技术优势体现在三方面:硬件层采用星脉网络(3.2Tbps
课程收官|FastAPI+LangChain 从零搭建智能招聘系统:重塑 AI 时代的工程底座随着最后一份基于大模型自动生成的深度候选人评估报告的成功输出,本次“FastAPI+LangChain 从零搭建智能招聘系统 我们系统拆解了如何将 LangChain 的链式调用无缝接入 FastAPI 的异步路由中,实现了从 HTTP 请求接收到大模型推理调度的全链路非阻塞通信,为高吞吐的招聘业务打下了坚实的性能底座。 学员们深入实操了文档的切分策略,摒弃了粗暴的定长切分,采用基于语义边界的智能分割,确保个人经历与项目背景的完整性。 智能体自治:从规则匹配到工具驱动的动态评估传统招聘系统只能做关键字的布尔运算,而大模型赋予了系统动态评估的能力。课程的进阶阶段,我们将招聘系统从被动的检索工具,升级为具备自主决策能力的智能体。 结语:做 AI 时代的业务架构重构者从零到一搭建智能招聘系统的收官,不仅是项目代码的提交,更是工程思维的重塑。
人工智能在存储优化中的革命性应用:智能存储的未来在信息技术快速发展的今天,数据存储和管理已经成为企业运维中的重要课题。 存储资源利用率低:存储资源分配不合理,导致资源浪费。数据安全和可靠性问题:数据的安全性和可靠性受到威胁。人工智能在存储优化中的应用人工智能技术的发展,为存储优化提供了新的方法和工具。 智能数据分层存储不同类型的数据对存储速度和成本有不同的需求。AI可以通过分析数据的访问频率和重要性,将数据自动分层存储。 一家大型电商企业在引入AI存储优化方案后,通过智能数据压缩和分层存储技术,大幅度降低了数据存储成本,提高了数据访问速度。 结语人工智能在存储优化中的应用,为我们展示了一个智能存储的未来。通过不断的发展和优化,AI将为企业的数据存储和管理带来更大的价值和效益。
存储+智能组合: 从单纯的存储底座(COS)演进为包含数据处理(数据万象CI)、高性能加速(GooseFS)及智能媒资管理(SMH)的一站式解决方案。 功能框架 底座层(COS): 提供高可靠、低成本的基础存储,支持热温冷数据分层。 加速层(GooseFS): 分布式缓存服务,解决COS在大数据和AI场景下的性能瓶颈。 处理层(CI数据万象): 提供图片、音视频、文档的全品类媒体处理、内容审核与智能检索。 应用层(SMH智能媒资托管/企业网盘): 提供开箱即用的PaaS/SaaS能力,支持快速搭建相册、网盘等应用。 产品优势 全生命周期管理: 支持标准、低频、智能分层、归档、深度归档五种存储类型。智能分层可根据访问模式自动转换,降低冷数据成本。 文件去重:基于SHA256自研Full Hash,支持跨租户、跨账号去重,节约存储空间。 边转边播:仅存储1份原始文件,按需转码,播放体验提升,存储与转码成本大幅下降。 4.