集群的生产级操作需要许多组件 ,用户通常没有足够的技术能力;问题之二,是尽管 Kubernetes可以在多种类型的基础架构上运行,但多架构同时存在导致云原生平台的底层基础设施(即支持 Kubernetes 集群的计算、存储和网络资源 存储资源盘活系统(Storage Resource Reutilization System, SRRS)。SRRS 可以在存储层面解决上述问题。 SRRS 是一款纯用户态的绿色软件,只有150MB左右的安装包,不需要ROOT权限就可以安装在任何Linux操作系统上,不独占硬盘、操作系统,以2GB内存把各服务器中分散的磁盘整合成高性能的存储资源池, 通过分布式双控制器架构保证了低延迟、高可用、易拓展;支持x86、ARM、龙芯等异构、非对称服务器混合部署,通过功能全面完善的控制台、命令行与API来统一调度管理所有存储设备;通过强大的兼容性和硬件异构性充分利用全部存储资源 SRRS 与 Kubernetes一样,可在多种类型的基础设施上运行,向上提供标准的 iSCSI 接口,完全适配 Kubernetes 的 容器存储接口 CSI 。
既有的数据基础设施很难满足以汽车研发为代表的新增需求,创新的数据底座成为智能制造时代被寄予厚望的“圣杯”。 仿真平台只是创新数据底座的冰山一角。 预计到2025年,数字化、网络化、智能化制造企业占比将分别达到70%、30%、10%。 华为公司副总裁、数据存储与机器视觉产品线总裁周跃峰 显而易见,制造业正在加速迈向数字化转型的深水区。 走出智能制造的深水区、实现向制造业强国的跃迁,需要更多行业领头羊率先垂范。华为构建的创新数据基础设施,将成为国内制造企业数字化转型坚实的数据底座,其示范效应影响深远。 存储产品的高歌猛进,为华为创新数据基础设施提供了充足的底气;与更多懂行业、懂业务、懂技术的合作伙伴携手同行,则是华为构建制造业等行业数据底座的生态保障。
2022年末,生成式对话型人工智能ChatGPT和AI生成图片应用Midjourney问世,1个月内获取过亿用户。尽管根据用户使用后的的反馈,它们的表现还不能堪称完美,但已经是令大众惊喜的程度了。 ChatGPT和Midjourney背后的公司是OpenAI,成立于2015年,由Elon Musk和Sam Altman等个人和组织创建,旨在推进和促进人工智能领域的研究。 目前主流的解决方法是硬件存储阵列或分布式存储。 存储资源盘活系统是高性能的。存储资源盘活系统采用分布式双控制器架构,像传统硬件存储阵列一样提供低延迟和高可用性,像传统分布式存储一样提供高可扩展性和高吞吐量。 在AI的时代来临之前,存储资源盘活系统可以为其构建坚固、灵活的存储底座。
“西部数据的策略:从11碟HDD出发,重塑AI存储底座。 大数据产业创新服务媒体 ——聚焦数据 · 改变商业 让我们来试想这样一个场景:凌晨3点,某大模型云服务平台的日志系统依然在高速写入。 西部数据在2024年10月推出的Ultrastar™ DC HC690数据中心硬盘是一项适合的选择。 2025年,大模型和智能体进入商用部署的新阶段,“一企一模型”“一行一垂类”的趋势拉开,随之而来的,是以PB乃至EB为单位的数据暴涨。 这是对客户的长期关系战略——构建“存储信赖路径”,帮助客户把其数据底座变成护城河。 每一个多模态模型的推理调用、每一个Agent系统的上下文记录,每一次大语言模型的“记忆保存”,都是对存储底座的“微小索取”。
2024年,智能驾驶市场火热,无论是造车新势力还是老牌车企纷纷发力智能驾驶,他们深知,新能源汽车的下半场已到,再不发力智能驾驶,可能真的有些来不及了。 车企不断加码单车智能的同时,政府也在稳步的推进车路协同。智能驾驶领域一直处在新技术广泛应用和验证的前沿,让我们一起探索智能驾驶的发展将给我们带来哪些启示。 至此,车路云智能网联有了更为具象化的全局展现,车、路、边缘云、区域云及各交通管理平台,共同构建了一个高度智能化的交通管理系统。 这种智能网联的实现,不仅仅是技术上的突破,更是对未来网络发展趋势的生动体现。我们可以透过智能车路协同的智能网联需求,探索未来网络的需求变化。 未来的交通网络将能够支持更加智能、高效、安全的交通管理,为智能驾驶和车路协同技术的发展提供坚实的基础。
而且鉴于这是百度智能云存储的核心底座,需要自主可控并提供给最佳的用户体验。最终我们决定面向百度沧海·存储的元数据场景,自主研发一套类 Spanner 架构的分布式事务数据库作为元数据底座。 5 百度智能云的云存储元数据底座 TafDB TafDB 是面向元数据场景设计的一个分布式数据库系统。 作者简介 曹彪 百度智能云云存储高级架构师、云存储元数据底座技术负责人 2014 年加入百度后一直从事基础架构领域研发,先后负责了百度小批量实时计算平台以及百度智能云元数据存储平台,带领团队从 0 到 1 打造了百度智能云云存储的元数据底座 TafDB,并在对象存储、文件系统大规模上线,现任百度智能云云存储部高级架构师、元数据底座 TafDB 技术负责人。 阴智辉 百度智能云高级研发工程师 TafDB 核心研发 2019 年华中科技大学硕士毕业后加入百度智能云云存储部,至今一直致力于建设云存储元数据底座 TafDB。
数据湖的起源,应该追溯到 2010 年 10 月。 根据维基的定义,数据湖是一个以原始格式 (通常是对象块或文件) 存储数的系统或存储库。数据湖通常是所有企业数据的单一存储,用于报告、可视化、高级分析和机器学习等任务。 同时也可对已有表 hive 结构进行快速扫描,一键生成湖表信息,节省 10x 倍数据的传输时间和 50% 磁盘空间。 多种底层存储湖仓平台支持 HDFS、S3、OSS、MInio 等多种底层存储,灵活满足客户不同数据存储需求。 对比数据同步入湖,可以节省 10x 倍数据的传输时间。数据文件治理创建数据文件治理任务模板,支持小文件合并、快照清理、孤儿文件清理等数据文件治理任务,支持立即支持、预约治理、周期治理多种数据治理方式。
作者:吴怀宇 2023年6月14日,欧洲议会全体会议表决通过了《人工智能法案》授权草案,标志着该法案将进入欧盟立法严格监管人工智能技术应用的最终谈判阶段。 该法案的建议是通过引进监管沙盒机制来实现,即:在人工智能系统入市或投入使用前,对人工智能系统进行开发、测试和验证以降低风险。 为了给人工智能立法,国外学术界先后出现了蒙特利尔宣言、多伦多宣言等多个人工智能宣言,欧盟《人工智能法案》正是在这些宣言的基础上发展而来。而因为国情的差异,中国当然不可能“在别家的地基上盖自家的房子”。 在这轮全球人工智能治理的热潮中,中国(包括北京等城市)应该加紧颁布具有自身文化属性和特色的《人工智能法案》,但请一定不要忘记,“理性、开放、和谐、人文”才应该是这部“以人为本”的法案最坚实的底座,这才是体现人类文明面对强机器智能的挑战仍然可以长盛不衰的根本力量所在 在人工智能学术圈和产业界有20多年的资深从业经历,曾获“科学中国人年度人物”称号、中国发明创业成果奖(一等奖,中国发明协会颁发)、吴文俊人工智能科技进步奖(中国智能科学技术最高奖,中国人工智能学会颁发)
目前 JuiceFS 作为存储底座服务于整个机器学习平台,不仅提高了对混合多云架构的适应性,还大幅提升了数据处理效率。 该存储平台已支持多个场景,例如,模型加载时间从超过 10 分钟缩短至 30 秒以内,提升 20 多倍,大幅提高了资源利用效率。 JuiceFS 依托于公有云对象存储,不仅成本低廉,还能提供几乎无限的存储容量,最大限度地发挥云存储的优势;其性能主要依赖于对象存储和元数据引擎。 03 基于 JuiceFS 的存储底座设计 元数据引擎架构设计 JuiceFS 采用的是元数据和数据分离的架构。对于元数据引擎的选型,我们考虑了三个方案。 发布颠覆性个人智能系统Apple Intelligence,并彻底改革Siri AI “奸商”的崛起
IoT最佳存储系统 由于对象存储的无限扩展架构和持久的性质,它非常适合处理通过IoT文件积累的PB级的非结构化数据。对于云的主要选择,对象存储可以用于私有、公有和混合云平台。 通过将被动数据迁移到较低的存储层,混合云平台可以清理急需的存储空间,否则可能会被很少访问的数据浪费。 对象存储网关可能不适用数据迁移 简化数据向对象存储的迁移,网关看起是一种方法,但它却不是最好的方法。尽管网关可以在数据迁移中减少存储的消费,但实际上,相比于其它的数据迁移项目,它的步骤没有那么少。 使用标准文件或块接口,对象存储网关仍然需要32到34个人工步骤来迁移文件和存储块。 伴随着劳动密集型流程,对象存储网关可能会让你将数据保护过程复杂化。 分层和快照是需要考虑的两个功能,以及服务提供商与存储组合供应商密切合作关系。 对DRaaS要求更多 评估DRaaS供应商时,请确定数据的存储方式。
在系列连载《智能时代下的高端存储》首期文章里,回顾了高端存储自诞生以来风起云涌的三十年里脱颖而出的各大厂商的发展。 关于“智能时代,是否还有高端存储的概念”这一疑问,从不同角度出发得到的答案不尽相同。究其原因则主要在于随着5G、云计算、人工智能和第四次工业革命的深入发展,产业环境和IT技术均已今非昔比。 WENDT于2014年7月18日发表的定义高端存储的文章“10 Characteristics That Help to Define Today’s High End Storage Arrays”为例 ,一起回顾下定义高端存储的经典10条标准,哪些仍适用于当下,又有哪些“推陈出新”的概念。 10.跨越两个或更多数据中心的非破坏运营(Non-disruptive operations) 这一条可以通俗理解为基于容灾的方案和技术,实现存储运维运营过程对业务无影响,以及出现异常情况能快速恢复业务
但如果选择智能分层存储,就无需关注数据访问热度,由对象存储服务来监测数据访问频率,即可将数据智能地在冷热访问层之间转换,且无需数据取回费用,在不损害户访问体验的同时,有效降低存储成本。 智能分层存储优势 无需关注数据访问模式,智能转换存储层 只需为数据指定对象存储类型,即可应用智能分层存储特性。 低频数据无需取回,秒变高频数据 智能分层存储是文件对象级别的存储类型,COS会智能监控每一个处于该存储类型的对象,当检测到某对象的访问热度降低时,会自动将数据转换至低频存储,如果该对象若干时间后重新被人访问 数据自动沉降,存储成本更优 通过监测数据访问频率,自动化管理数据访问层,智能分层存储类型还参与对象存储生命周期流程,用户可以按需将智能分层存储沉降到归档存储中,进一步降低数据在云端的存储成本。 同城容灾MAZ架构已同步智能分层存储类型,数据设计可靠性可达12个9,业务设计可用性可达99.995%。 通过数据冷热分层存储,智能分层能够帮助用户在存储成本和读写性能之间寻找平衡点。
AI 时代,数据库已成为智能 Agent、RAG 系统、大模型应用和 AI 可观测平台 的基础设施。它不仅要能存结构化数据,更要能承载长上下文、向量、全文、Trace、事件流等新型数据。 适用于超宽表、大量 VARIANT 子列、对象存储冷启动敏感、随机读较多的 AI 和车联网半结构化数据场景。 以一张包含 7,000 列、10,000 个 Segment 的超宽表为例。 聚合扩展优化:先缩数据,再做多维聚合 通过智能识别最细粒度聚合组及其聚合率,在满足条件时,将执行方式从“多组并行聚合”调整为:先完成最细粒度聚合,大幅缩减数据规模,再基于结果计算其他聚合组,从而显著降低计算延迟 基准测试集上,整体性能提升超过 10%。超过 1/5 的测试用例改进幅度超过 20%,最大改进幅度为 160%,最大回退低于 5%。 3. 复杂查询场景下整体性能提升超过 10%。 参考文档:https://doris.apache.org/docs/4.x/query-acceleration/condition-cache 5.
在前几期,我们提到了,在云计算时代,由于对存储IO及吞吐的要求迅速增加,传统SAN存储难以满足需求,基于标准x86节点的分布式存储成为了主流。 开源分布式存储的代表是Ceph。 Ceph本质上是对象存储(后面会讲到),以image的形式提供RBD块,在KVM的QEMU中安装RBD块驱动,将RBD块直接挂载给虚拟机。 出于这点考虑,工程师们在服务器上安装了两块硬盘,通过RAID卡,让来自系统的IO被复制到两块硬盘,令两块硬盘存储的内容完全一致。当一块硬盘损坏或被意外拔出时,另一块硬盘还能够读出完整的数据。 因此,在分布式存储中,通常使用多副本机制,最常见的是三副本: 如图,PG落到主OSD后,主OSD所在的Node会将内容复制到另外两个副本对应的OSD节点,并最终落盘。
2.1 存储过程调试的基本概念 2.1.1 调试存储过程的目的 调试存储过程的目的包括: 查找和修复错误:识别和解决存储过程中的逻辑错误或运行时错误。 验证逻辑:确保存储过程的业务逻辑正确无误。 2.2.2 使用“Step Into”进行存储过程调试 Step Into:使用“Step Into”(F10)命令可以进入存储过程或函数的内部,逐行执行,这有助于调试嵌套的存储过程或函数调用。 - 阿里云开发者社区 链接 《SQL-触发器(trigger)的详解以及代码演示》- CSDN博客 链接 《25.3.1 触发器语法和示例》- MySQL 8.0 参考手册 链接 《不可不知的10个数据库安全最佳实践 本文相关文章推荐: 1.MySQL存储过程基础(1/10) 2.创建第一个MySQL存储过程(2/10) 3.使用条件语句编写存储过程(3/10) 4.循环结构在存储过程中的应用(4/10) 5.错误处理在存储过程中的重要性 (5/10) 6.存储过程中的游标使用(6/10) 7.存储过程中的事务管理(7/10) 8.优化存储过程的性能(8/10) 9.存储过程安全性博客大纲(9/10) 10.高级存储过程技巧(10/10
课程收官|FastAPI+LangChain 从零搭建智能招聘系统:重塑 AI 时代的工程底座随着最后一份基于大模型自动生成的深度候选人评估报告的成功输出,本次“FastAPI+LangChain 从零搭建智能招聘系统 我们系统拆解了如何将 LangChain 的链式调用无缝接入 FastAPI 的异步路由中,实现了从 HTTP 请求接收到大模型推理调度的全链路非阻塞通信,为高吞吐的招聘业务打下了坚实的性能底座。 学员们深入实操了文档的切分策略,摒弃了粗暴的定长切分,采用基于语义边界的智能分割,确保个人经历与项目背景的完整性。 智能体自治:从规则匹配到工具驱动的动态评估传统招聘系统只能做关键字的布尔运算,而大模型赋予了系统动态评估的能力。课程的进阶阶段,我们将招聘系统从被动的检索工具,升级为具备自主决策能力的智能体。 结语:做 AI 时代的业务架构重构者从零到一搭建智能招聘系统的收官,不仅是项目代码的提交,更是工程思维的重塑。
云计算的下半场:资源是底座,智能才是灵魂作者:Echo_Wish(一个一直在云里“搬砖”,却越搬越兴奋的老朋友)兄弟姐妹们,我们今天聊一个我憋了很久、也越来越确信的观点:云计算的上半场,是“资源的竞争” CPU、存储、网络、虚机、容器,谁更稳定、谁更便宜、谁更弹性,谁就能在市场混得更好。但现在情况变了。 4.智能数据:从“存数据”到“理解数据”以前:数据库数据湖对象存储数仓这些都是“存东西”。 自动清洗自动建模自动推理自动优化查询自动生成洞察报告甚至一个系统能自动给你总结业务趋势:展开代码语言:TXTAI代码解释本周用户增长13.5%,主要原因是:-新版推荐算法CTR提升22%-95后用户占比提升-周五投放活动带来30w新增企业再也不需要10 (未来)│├──────────────────┤├────────────────────────────┤│买服务器││提供智能决策与自动化││买对象存储││业务预测、自动调优、自动治理││买数据库实例
开放网络硬件平台:释放 VPP + DPDK 潜能厂商利用 VPP + DPDK 技术,在基于通用处理器(如 Marvell ARM, Intel x86)的开放硬件平台上,打造出极具竞争力的网络产品:智能网关平台基于 Marvell OCTEON 10 ARM Neoverse N2 (8核) 紧凑型设备。 相比非 VPP 方案的同等硬件,性能提升 10 倍以上,满足企业、城域网边缘、云边缘网关需求。 智能网卡 基于高性能 DPU 芯片,提供 PCIe Gen3.0/4.0 接口,支持 100Gbps 多功能业务处理 (网络/计算/存储卸载)。显著释放服务器主 CPU 资源。
距离Android 10系统正式发布已经过去大半年左右的时间了,你的应用程序已经对它进行适配了吗? 在Android 10众多的行为变更当中,有一点是非常值得引起我们重视的,那就是作用域存储。 本篇文章对作用域存储进行了比较全面的解析,相信看完之后你将能够轻松地完成Android 10作用域存储的适配升级。 而在作用域存储这个功能上面,恭喜大家,暂时确实是可以不用升级的。 目前Android 10系统对于作用域存储适配的要求还不是那么严格,毕竟之前传统外置存储空间的用法实在是太广泛了。 还有一个是图片存储的路径,不过这个值在Android 10和之前的系统版本中的处理方式不一样。 第三方SDK不支持作用域存储怎么办? 阅读完了本篇文章之后,相信你对Android 10作用域存储的用法和适配基本上都已经掌握了。
CANN × ROS 2:为智能机器人打造实时 AI 推理底座 在自动驾驶小车、巡检机器人、服务机械臂等场景中,机器人需要在毫秒级时间内完成: 多摄像头目标检测 激光雷达点云分割 语音指令理解 路径规划决策 发布检测结果 self.publisher = self.create_publisher( Detection2DArray, '/detections', 10 PointCloud2, '/lidar/points') ts = ApproximateTimeSynchronizer([image_sub, lidar_sub], 10 结语:让机器人真正“看得清、听得懂、反应快” CANN 与 ROS 2 的结合,不是简单的“加速器插件”,而是重构了机器人智能的底层执行范式。 它让复杂的多模态 AI 模型,能在低功耗嵌入式平台上实时运行,为具身智能落地扫清最后一道障碍。 相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库