首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI掘金志

    华为AI存储「求解」模型

    存储厂商谁能抢先解耦模型训练的痛点,谁就能占据高地,成为第一个吃螃蟹的人。 作者 | 南书 编辑 | 余快 比起模型前台的火热,人们的注意力很少关注到产业链上游。 今年5月底,GPU头部玩家 Nvidia 的市值突破万亿美金,昭示着模型这场火,首先蔓延至产业链上游,让企业吃到了第一波技术红利。 与数据相伴相生的存储器,在模型的推动下,也正迎来一次技术革命和市场跃迁。 站在微观角度,企业研发模型要经过以下几个阶段:数据归集、数据预处理、模型训练、推理应用,每个阶段都离不开存储。 在数据归集阶段,模型所需要的数据量大且种类繁多。 OceanStor A310 是一款深度学习数据湖存储产品,可以为企业训练模型提供从“数据归集、预处理到模型训练、推理”的存储支撑。

    49930编辑于 2023-08-26
  • 来自专栏人工智能极简应用

    【AI模型】Transformers模型库(十六):safetensors存储类型

    一、引言 这里的Transformers指的是huggingface开发的模型库,为huggingface上数以万计的预训练模型提供预测、训练等服务。 二、safetensors库 2.1 概述 safetensors是一个库,旨在安全地存储和加载机器学习模型的权重,特别是针对PyTorch模型。它通过加密和验证模型数据来增强安全性,防止数据篡改。 () # 保存模型到safetensors格式 save_file(model_state_dict, "model.safetensors") 对应的pytorch保存模型的方法 # 保存模型状态字典 .pth文件不同,它提供了额外的安全特性,特别是在模型的分发和共享方面 三、总结 本篇内容展示了如何使用safetensors库,主要功能旨在安全地存储和加载机器学习模型的权重,特别是针对PyTorch 模型

    4.4K10编辑于 2024-08-13
  • 这届存储,为模型而生!

    模型需要能打的算力和网络,还需要能打的存储。据测算,数据存储约占模型训练整体工程量的20-30%。随着更多AIGC的产生,这个比例还在继续提升。今天,更适合模型的云存储,来了! 腾讯云的最新云存储解决方案,主打三个关键点://更全面:覆盖模型数据采集与清洗、模型训练、模型推理和内容治理等全流程的数据处理。//更能打:模型数据清洗和训练耗时缩短一半。 - 模型训练环节:腾讯云高性能并行文件存储CFS Turbo,拥有四核心技术,让GPU不会闲下来——1、并行客户端:支持一个客户端同时和多个服务端通过N条链路传输,提升访问速率(好比仓库开了多扇门,客户自己从仓库取货 目前,80%的头部模型企业选择了这套云存储解决方案,包括右脑科技、百川智能、智谱、元象等明星模型企业。 此前,腾讯云已经推出了模型训练集群HCC、向量数据库、以及行业大模型服务MaaS等模型全链路云服务。模型将开创下一代云服务,我们也将继续为模型加速落地,铺好路,架好桥。

    71110编辑于 2024-04-08
  • 5模型Agent模式

    模型中的5种AI Agent模式在模型中,AI Agent(人工智能代理)模式是一种重要的应用方式,可以从以下几个方面来理解:1. 在模型的背景下,AI Agent 是基于大规模预训练模型(如 GPT 等)构建的智能代理,能够利用模型的语言理解和生成能力来完成复杂的任务。 智能性:它基于模型的强大语言理解能力,能够理解自然语言指令,并生成自然语言响应。这种智能性使其能够处理复杂的语言任务,如对话、写作、翻译等。 工作原理感知与理解:AI Agent 首先通过输入(如用户指令、环境数据等)感知外部信息,然后利用模型的语言理解能力解析这些信息,确定任务目标。 下面介绍5种常见的AI Agent模式:1.

    4.6K10编辑于 2025-05-07
  • 来自专栏腾讯云存储

    面向模型时代的云存储架构

    沙龙活动中腾讯云存储研发总监严俊明分享了《面向模型时代的云存储架构》的主题演讲。 据 OpenAI 研究显示,模型的智能程度与算力、参数规模呈正相关。训练模型所需的基础设施已达万卡级别,参数从亿级跃升至万亿级,模型存储带来巨大的机遇与挑战。 在模型采集、清洗、训练、推理、“智”理等环节,对存储基础设施提出规模、性能、稳定等多维度的要求。 其中,核心矛盾是模型的海量数据需求和极致性能需求之间的矛盾。 对此,严俊明表示,“模型存储的要求是既要、又要,既要海量低成本的存储引擎,同时又要很高的性能要求,然而企业实践的过程中,这两者往往很难兼顾。” 模型训练阶段,自研 GooseFS-X 高性能存储,提升模型预训练效率;在分发阶段,通过 GooseFS AZ 加速器来提升模型分发效率。 此外,腾讯云还提供一站式安全解决方案来保障数据内容安全。

    50510编辑于 2025-04-30
  • 来自专栏存储公众号:王知鱼

    IMPRESS:模型推理存储优化新突破

    全文概览 模型推理技术正广泛应用于聊天、搜索、代码生成等领域,但其高效运行面临关键挑战:用户提问常共享大量上下文知识,导致系统需频繁加载重复数据。 研究背景与问题 模型推理的挑战:共享上下文导致重复数据加载,SSD-I/O成性能瓶颈。 现有方案局限:内存容量不足、缓存策略忽视键值重要性。 2. 研究背景与问题意识 模型推理 模型推理有海量应用场景,目前已应用于多个领域: 聊天(Chat): ChatGPT 搜索(Search): Perplexity 代码(Code): Cursor 问答 预填充 KV 存储系统 共享的KV缓存数据能重复使用,并最终缩短模型推理过程的首Token响应时延。 Note FAST 25 很多论文都在讨论推理场景存储访问优化,其核心又集中在缓存管理机制,与早期大数据推荐系统的缓存管理相比,模型的热数据管理,呈现出更大范围的随机性,全部数据加载是不切实际的。

    1.3K10编辑于 2025-03-17
  • 来自专栏科技云报道

    AI模型疯长,存储扛住了吗?

    作为支撑模型的底座“三件”——算力、网络、存储,都在快速的迭代。 算力方面,英伟达用了两年的时间就将GPU从H100升级到了H200,让模型的训练性能提升了5倍。 存储方面,华为、阿里云、百度智能云、腾讯云等大厂,都相继推出了面向AI模型存储方案。 那么作为基础设施的三件之一的存储,在AI模型的场景下到底发生了哪些变化?又有哪些新的技术挑战? 如果存储性能不强,那么可能需要耗费大量时间才能完成一次训练,这就会严重制约模型的发展迭代。 事实上,不少企业在开发及实施模型应用过程中,已经开始意识到存储系统所面临的巨大挑战。 总的来说,随着AI模型的推进,数据存储出现了新的趋势。市场渴望更高性能、容量、低成本的存储产品,并加速模型各个环节的融合和效率提升。 而各大厂商也在通过技术创新不断满足模型各环节的需求,为企业实施模型降低门槛。 在AI模型的倒逼下,存储创新已在路上。

    60410编辑于 2024-04-18
  • 来自专栏云计算D1net

    存储成本分析的5技巧

    然而,企业应确保与向云端存储迁移相关的支出不会超过这项技术所带来的潜在价值。 仔细分析这些费用将有助于回答一个与许多企业有关的问题:“云存储的成本是多少?。” 为了便于说明,采用亚马逊云存储定价作为一个例子,因为这个公共云提供商并不隐瞒其价格。 每月存储的定价 云存储的价格通常取决于组织每月需要的千兆字节数。 (2)交易费用 根据不同的供应商的情况,还可能收取各种基于REST的存储请求(即交易),例如: •获取 •删除 •列表 •传输 •其他 亚马逊S3是将业务纳入云存储成本的供应商之一。 大量数据的传输需要相当的带宽,这就是为什么大多数供应商以付费方式提供这种服务的原因。 最重要的是,这个过程的费用并不低。取决于服务提供商,可能从几百美元到几千美元不等。 (5)专业厂商协助 在大多数情况下,云存储成本分析需要专门领域的专业知识,否则组织可能会忽视一些虽小却重要的情况。 根据实际情况,组织可能会增加一笔费用,并提高了数据迁移的总成本。

    1.6K80发布于 2018-03-28
  • 来自专栏BestSDK

    存储成本分析的5技巧

    然而,企业应确保与向云端存储迁移相关的支出不会超过这项技术所带来的潜在价值。   仔细分析这些费用将有助于回答一个与许多企业有关的问题:“云存储的成本是多少?。”    为了便于说明,采用亚马逊云存储定价作为一个例子,因为这个公共云提供商并不隐瞒其价格。   每月存储的定价   云存储的价格通常取决于组织每月需要的千兆字节数。 (2)交易费用   根据不同的供应商的情况,还可能收取各种基于REST的存储请求(即交易),例如:   · 获取   · 删除   · 列表   · 传输   · 其他   亚马逊S3是将业务纳入云存储成本的供应商之一 大量数据的传输需要相当的带宽,这就是为什么大多数供应商以付费方式提供这种服务的原因。   最重要的是,这个过程的费用并不低。取决于服务提供商,可能从几百美元到几千美元不等。    (5)专业厂商协助   在大多数情况下,云存储成本分析需要专门领域的专业知识,否则组织可能会忽视一些虽小却重要的情况。   根据实际情况,组织可能会增加一笔费用,并提高了数据迁移的总成本。

    2.1K70发布于 2018-03-02
  • 来自专栏灯塔大数据

    趋势 | 大数据存储领域5突破技术

    从2011年,纽约的startup公司已经成长为开发者服务的第二云部署平台,为包括亚马逊、谷歌和微软在内的很多大型公司提供简单的、可升级的SSD云服务平台。 随着动态域名服务的发展,一种更先进的机器学习中采用的算法基于复杂的非线性关系模型,也就是机器可以感知其周围的世界。 苹果的Siri和微软的Cortana就是这种全自主代理的先驱。 同时,共享驾驶App也在爆炸式增长,例如Uber打破了人们对于汽车所有权的传统看法,Lyft和通用汽车也斥资5亿美元研究如何破解自动驾驶汽车共享软件app的代码。 ? 图3:自动驾驶的智能汽车。 只能机器人显然非常吸引人,部分是因为它们在人性化和专业设置方面具有非常的应用潜力。 5 大数据简化 大数据可以提供我们前所未有的洞察力,而利用这些数据的关键在于解读和分析。

    2.7K60发布于 2018-04-10
  • 来自专栏杨飞@益术

    Android数据存储实现的5方式

    这个方法需要四个参数:上下文环境(例如,一个 Activity),数据库名字,一个可选的游标工厂(通常是 Null),一个代表你正在使用的数据库模型版本的整数。 3 onUpgrage() 方法,它需要三个参数,一个 SQLiteDatabase 对象,一个旧的版本号和一个新的版本号,这样你就可以清楚如何把一个数据库从旧的模型转变到新的模型。 例如: db.execSQL(“INSERT INTO widgets (name, inventory)”+ “VALUES (‘Sprocket’, 5)”); 另一种方法是使用 SQLiteDatabase 5. 第五种: 网络存储数据 前面介绍的几种存储都是将数据存储在本地设备上,除此之外,还有一种存储(获取)数据的方式,通过网络来实现数据的存储和获取。

    4.4K20发布于 2019-02-21
  • 来自专栏Java学习网

    Android数据存储实现的5方式

    Android数据存储实现的5方式 数据存储在开发中是使用最频繁的,在这里主要介绍Android平台中实现数据存储5种方式,更加系统详细的介绍了5存储的方法和异同。 openFileOutput(“itcast.txt”, Context.MODE_WORLD_READABLE + Context.MODE_WORLD_WRITEABLE); android有一套自己的安全模型 这个方法需要四个参数:上下文环境(例如,一个 Activity),数据库名字,一个可选的游标工厂(通常是 Null),一个代表你正在使用的数据库模型版本的整数。 3 onUpgrage() 方法,它需要三个参数,一个 SQLiteDatabase 对象,一个旧的版本号和一个新的版本号,这样你就可以清楚如何把一个数据库从旧的模型转变到新的模型5.

    8.2K90发布于 2018-02-26
  • 来自专栏Alter聊科技

    “烧钱”的模型,如何迈过存储这道坎?

    根据第一性原理,模型训练时算力利用率低的诱因是海量的小文件,传统存储系统无法高效地处理这些数据,导致加载速度缓慢。 模型训练的效率要达到极致,减少不必要的浪费,必须在数据上下功夫,准确地说,必须要在数据存储性能上进行创新。 03 数据存储进入到“模型时代”某种程度上说,模型训练催生的数据存储性能要求,不过是文件存储系统加速演变的一个侧面。 直到今天,文件存储的需求仍在不断更新,文件系统的创新也在持续发生,就像模型训练需求所折射出的演进方向。 无可否认的是,模型正在从前台的“火热”,转向整个产业链条的协同驱动,数据存储正是其中的关键一环。

    1.1K10编辑于 2023-08-30
  • 来自专栏啄木鸟软件测试

    模型测试:性能优化的5实战策略

    引言 随着ChatGLM、Qwen、DeepSeek及Llama系列语言模型在金融、政务、医疗等关键场景加速落地,模型测试已远超传统‘功能是否正确’的范畴——性能成为决定能否上线的核心瓶颈。 这些并非个例,而是模型测试进入深水区的典型信号:性能不是附加项,而是可信AI的第一道防线。 一、明确性能基线:拒绝‘拍脑袋’指标 模型性能测试首要误区是套用小模型标准。 二、分层注入式压测:从单卡到集群的穿透验证 传统压力测试常止步于API层,而模型性能瓶颈常藏于框架底层。 推荐采用‘四层注入法’: 1)API层:模拟真实用户请求分布(如80%短提示+15%中长提示+5%对抗性长上下文),避免均匀负载失真; 2)Engine层:直连vLLM/Triton推理引擎,注入不同 结语 模型性能测试的本质,是构建‘可测量、可归因、可演进’的效能反馈闭环。

    32310编辑于 2026-03-31
  • 来自专栏腾讯云存储

    数据湖存储模型中的应用

    9月5日,浪潮信息新产品“互联网+AIGC”行业巡展在深圳举行。 会中腾讯云高级产品经理林楠主要从模型的发展回顾、对存储系统的挑战以及腾讯云存储模型领域中的解决方案等三个角度出发,阐述存储系统在模型浪潮中可以做的事情。 为什么模型越来越大 对存储系统而言,通用型人工智能也属于应用的一种,那么了解模型的应用机制和核心需求对存储系统的设计也至关重要。 模型存储系统的挑战 回顾GPT3的论文可以发现,模型的整体框架中包括了数据的采集、清洗、预训练、微调、推理等多个阶段。 腾讯云存储模型领域中的解决方案 为了应对模型的技术需求,腾讯云在IaaS、PaaS和SaaS等不同产品方向均提供了多样的技术支持手段,主要体现为三个“快”: 数据读取快:GooseFS数据加速,提供高性能存储

    4.9K20编辑于 2023-11-01
  • 来自专栏前端自习课

    【HTML5】296- 重新复习 HTML55存储方式

    一、介绍 在 HTML5 规范之前,存储主要是用 cookies 。 由于存在这么多缺点,因此我们需要解决以下问题: 解决 4k 的大小问题; 解决请求头常带存储信息的问题; 解决关系型存储的问题; 跨浏览器; 三、五种存储方式 1. 本地存储 localstorage 存储方式: 以键值对( Key-Value)的方式存储,永久存储,永不失效,除非手动删除。 大小: 每个域名5M。 支持情况: ? 本地存储 sessionstorage HTML5 的本地存储 API 中的 localStorage 与 sessionStorage 在使用方法上是相同的,区别在于 sessionStorage 在关闭页面后即被清空 5. IndexedDB 索引数据库 (IndexedDB) API(作为 HTML5 的一部分)对创建具有丰富本地存储数据的数据密集型的离线 HTML5 Web 应用程序很有用。

    1.1K30发布于 2019-07-25
  • CFS Turbo 模型训练存储性能优化实践

    数据来源: 2024腾讯全球数字生态大会,主讲人:杨飞 第一章:模型训练引发的存储元数据瓶颈 随着模型技术演进,训练数据集规模呈现爆发式增长,存储系统面临严峻的元数据管理挑战。 第二章:构建新一代元数据引擎与智能预读机制 针对模型训练场景,CFS Turbo 采用了 新一代自适应条带化目录 技术与 智能预读策略 相结合的技术路径。 2.2 智能预读策略 (Intelligent Read-ahead Policy) 针对模型训练(以混元DiT为例)中涉及的大量数据整理与转换操作(如 os.listdir, glob, find 优化后表现 性能提升倍数 Readdir 性能 - - 提升 55% 100万文件返回速度 30秒 1.4秒 8.6倍 第四章:混元DiT训练场景验证 在腾讯自研的 混元DiT (HunyuanDiT) 模型训练实践中 实战验证: 方案已在腾讯 混元DiT 等千亿级模型训练场景中得到验证,具备处理 百亿级 目录与 亿级 文件的工程成熟度。

    11210编辑于 2026-05-30
  • 来自专栏PPV课数据科学社区

    【趋势】大数据和存储领域5突破技术

    从2011年,纽约的startup公司已经成长为开发者服务的第二云部署平台,为包括亚马逊、谷歌和微软在内的很多大型公司提供简单的、可升级的SSD云服务平台。 随着动态域名服务的发展,一种更先进的机器学习中采用的算法基于复杂的非线性关系模型,也就是机器可以感知其周围的世界。   苹果的Siri和微软的Cortana就是这种全自主代理的先驱。    同时,共享驾驶App也在爆炸式增长,例如Uber打破了人们对于汽车所有权的传统看法,Lyft和通用汽车也斥资5亿美元研究如何破解自动驾驶汽车共享软件app的代码。 图3:自动驾驶的智能汽车。    只能机器人显然非常吸引人,部分是因为它们在人性化和专业设置方面具有非常的应用潜力。 5、大数据简化   大数据可以提供我们前所未有的洞察力,而利用这些数据的关键在于解读和分析。   

    2.2K100发布于 2018-04-24
  • 模型微调】一文掌握5模型微调的方法

    (Prompt Tuning)在内的5种主流方法。 模型微调究竟是什么?直观上,模型微调即是指通过输入特定领域或任务的数据,并有选择性地调整模型参数的技术过程。 我们所讨论的5种微调方法,本质上都是对这个基础架构中自注意力机制与前馈神经网络等核心组件的参数进行优化的不同策略。 全面微调旨在更新模型的所有参数,虽能达到极高的性能上限,但计算成本和资源需求巨大。而参数高效微调则通过仅优化模型中的一小部分参数,在保持性能相当的同时,大幅降低了计算开销和存储需求。 5、提示调整-轻量级的参数优化提示调整(Prompt Tuning)是一种“润物细无声”的微调,不改变模型自身,而是通过优化输入提示词的嵌入表示来引导模型输出。

    4.1K40编辑于 2025-10-23
  • 来自专栏腾讯云存储

    高性能存储模型融合创新相关研究

    在2023年中国数据与存储峰会“AIGC+存储融合发展论坛”上,腾讯云存储高级产品经理熊建刚老师发表主题演讲,就高性能存储模型融合创新相关研究展开探讨,以及腾讯云存储的实践案例。 熊老师耕耘存储20年,在腾讯云从事云存储领域的高性能存储以及与模型融合创新方面的研究工作,致力于推动云技术和人工智能的创新与发展。 一、存储技术与人工智能相结合:为AI应用提供高效、可扩展的数据存储和处理基础 以ChatGPT为代表模型的参数呈现指数级增长,已超越人脑神经网络数量。 随着模型的发展,对数据湖诉求进一步加强。 第一,更高的可靠性和可用性,避免存储的故障到算力资源的浪费。 ,面向模型的加速网络;腾讯云端到端模型解决方案,适配算力按需的供给,高速供给数据资源。

    47710编辑于 2024-01-31
领券