搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏AI掘金志
华为AI存储「求解」大模型
存储厂商谁能抢先解耦大模型训练的痛点，谁就能占据高地，成为第一个吃螃蟹的人。作者 | 南书编辑 | 余快比起大模型前台的火热，人们的注意力很少关注到产业链上游。今年5月底，GPU头部玩家 Nvidia 的市值突破万亿美金，昭示着大模型这场火，首先蔓延至产业链上游，让企业吃到了第一波技术红利。与数据相伴相生的存储器，在大模型的推动下，也正迎来一次技术革命和市场跃迁。站在微观角度，企业研发大模型要经过以下几个阶段：数据归集、数据预处理、模型训练、推理应用，每个阶段都离不开存储。在数据归集阶段，大模型所需要的数据量大且种类繁多。 OceanStor A310 是一款深度学习数据湖存储产品，可以为企业训练大模型提供从“数据归集、预处理到模型训练、推理”的存储支撑。
49930编辑于 2023-08-26
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（十六）：safetensors存储类型
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。二、safetensors库 2.1 概述 safetensors是一个库，旨在安全地存储和加载机器学习模型的权重，特别是针对PyTorch模型。它通过加密和验证模型数据来增强安全性，防止数据篡改。 () # 保存模型到safetensors格式 save_file(model_state_dict, "model.safetensors") 对应的pytorch保存模型的方法 # 保存模型状态字典 .pth文件不同，它提供了额外的安全特性，特别是在模型的分发和共享方面三、总结本篇内容展示了如何使用safetensors库，主要功能旨在安全地存储和加载机器学习模型的权重，特别是针对PyTorch 模型。
4.4K10编辑于 2024-08-13
这届存储，为大模型而生！
大模型需要能打的算力和网络，还需要能打的存储。据测算，数据存储约占大模型训练整体工程量的20-30%。随着更多AIGC的产生，这个比例还在继续提升。今天，更适合大模型的云存储，来了！腾讯云的最新云存储解决方案，主打三个关键点：//更全面：覆盖大模型数据采集与清洗、模型训练、模型推理和内容治理等全流程的数据处理。//更能打：大模型数据清洗和训练耗时缩短一半。 - 模型训练环节：腾讯云高性能并行文件存储CFS Turbo，拥有四大核心技术，让GPU不会闲下来——1、并行客户端：支持一个客户端同时和多个服务端通过N条链路传输，提升访问速率（好比仓库开了多扇门，客户自己从仓库取货目前，80%的头部大模型企业选择了这套云存储解决方案，包括右脑科技、百川智能、智谱、元象等明星大模型企业。此前，腾讯云已经推出了大模型训练集群HCC、向量数据库、以及行业大模型服务MaaS等大模型全链路云服务。大模型将开创下一代云服务，我们也将继续为大模型加速落地，铺好路，架好桥。
71110编辑于 2024-04-08
5种大模型Agent模式
大模型中的5种AI Agent模式在大模型中，AI Agent（人工智能代理）模式是一种重要的应用方式，可以从以下几个方面来理解：1. 在大模型的背景下，AI Agent 是基于大规模预训练模型（如 GPT 等）构建的智能代理，能够利用模型的语言理解和生成能力来完成复杂的任务。智能性：它基于大模型的强大语言理解能力，能够理解自然语言指令，并生成自然语言响应。这种智能性使其能够处理复杂的语言任务，如对话、写作、翻译等。工作原理感知与理解：AI Agent 首先通过输入（如用户指令、环境数据等）感知外部信息，然后利用大模型的语言理解能力解析这些信息，确定任务目标。下面介绍5种常见的AI Agent模式：1.
4.6K10编辑于 2025-05-07
来自专栏腾讯云存储
面向大模型时代的云存储架构
沙龙活动中腾讯云存储研发总监严俊明分享了《面向大模型时代的云存储架构》的主题演讲。据 OpenAI 研究显示，大模型的智能程度与算力、参数规模呈正相关。训练大模型所需的基础设施已达万卡级别，参数从亿级跃升至万亿级，大模型为存储带来巨大的机遇与挑战。在大模型采集、清洗、训练、推理、“智”理等环节，对存储基础设施提出规模、性能、稳定等多维度的要求。其中，核心矛盾是大模型的海量数据需求和极致性能需求之间的矛盾。对此，严俊明表示，“大模型对存储的要求是既要、又要，既要海量低成本的存储引擎，同时又要很高的性能要求，然而企业实践的过程中，这两者往往很难兼顾。” 模型训练阶段，自研 GooseFS-X 高性能存储，提升大模型预训练效率；在分发阶段，通过 GooseFS AZ 加速器来提升大模型分发效率。此外，腾讯云还提供一站式安全解决方案来保障数据内容安全。
50510编辑于 2025-04-30
来自专栏存储公众号：王知鱼
IMPRESS：大模型推理存储优化新突破
全文概览大模型推理技术正广泛应用于聊天、搜索、代码生成等领域，但其高效运行面临关键挑战：用户提问常共享大量上下文知识，导致系统需频繁加载重复数据。研究背景与问题大模型推理的挑战：共享上下文导致重复数据加载，SSD-I/O成性能瓶颈。现有方案局限：内存容量不足、缓存策略忽视键值重要性。 2. 研究背景与问题意识大模型推理大模型推理有海量应用场景，目前已应用于多个领域：聊天（Chat）: ChatGPT 搜索（Search）: Perplexity 代码（Code）: Cursor 问答预填充 KV 存储系统共享的KV缓存数据能重复使用，并最终缩短模型推理过程的首Token响应时延。 Note FAST 25 很多论文都在讨论推理场景存储访问优化，其核心又集中在缓存管理机制，与早期大数据推荐系统的缓存管理相比，大模型的热数据管理，呈现出更大范围的随机性，全部数据加载是不切实际的。
1.3K10编辑于 2025-03-17
来自专栏科技云报道
AI大模型疯长，存储扛住了吗？
作为支撑大模型的底座“三大件”——算力、网络、存储，都在快速的迭代。算力方面，英伟达用了两年的时间就将GPU从H100升级到了H200，让模型的训练性能提升了5倍。存储方面，华为、阿里云、百度智能云、腾讯云等大厂，都相继推出了面向AI大模型的存储方案。那么作为基础设施的三大件之一的存储，在AI大模型的场景下到底发生了哪些变化？又有哪些新的技术挑战？如果存储性能不强，那么可能需要耗费大量时间才能完成一次训练，这就会严重制约大模型的发展迭代。事实上，不少企业在开发及实施大模型应用过程中，已经开始意识到存储系统所面临的巨大挑战。总的来说，随着AI大模型的推进，数据存储出现了新的趋势。市场渴望更高性能、大容量、低成本的存储产品，并加速大模型各个环节的融合和效率提升。而各大厂商也在通过技术创新不断满足大模型各环节的需求，为企业实施大模型降低门槛。在AI大模型的倒逼下，存储创新已在路上。
60410编辑于 2024-04-18
来自专栏云计算D1net
云存储成本分析的5大技巧
然而，企业应确保与向云端存储迁移相关的支出不会超过这项技术所带来的潜在价值。仔细分析这些费用将有助于回答一个与许多企业有关的问题：“云存储的成本是多少?。” 为了便于说明，采用亚马逊云存储定价作为一个例子，因为这个公共云提供商并不隐瞒其价格。每月存储的定价云存储的价格通常取决于组织每月需要的千兆字节数。 (2)交易费用根据不同的供应商的情况，还可能收取各种基于REST的存储请求(即交易)，例如： •获取 •删除 •列表 •传输 •其他亚马逊S3是将业务纳入云存储成本的供应商之一。大量数据的传输需要相当大的带宽，这就是为什么大多数供应商以付费方式提供这种服务的原因。最重要的是，这个过程的费用并不低。取决于服务提供商，可能从几百美元到几千美元不等。 (5)专业厂商协助在大多数情况下，云存储成本分析需要专门领域的专业知识，否则组织可能会忽视一些虽小却重要的情况。根据实际情况，组织可能会增加一大笔费用，并提高了数据迁移的总成本。
1.6K80发布于 2018-03-28
来自专栏BestSDK
云存储成本分析的5大技巧
然而，企业应确保与向云端存储迁移相关的支出不会超过这项技术所带来的潜在价值。　　仔细分析这些费用将有助于回答一个与许多企业有关的问题：“云存储的成本是多少？。” 　　为了便于说明，采用亚马逊云存储定价作为一个例子，因为这个公共云提供商并不隐瞒其价格。　　每月存储的定价　　云存储的价格通常取决于组织每月需要的千兆字节数。（2）交易费用　　根据不同的供应商的情况，还可能收取各种基于REST的存储请求（即交易），例如：　　· 获取　　· 删除　　· 列表　　· 传输　　· 其他　　亚马逊S3是将业务纳入云存储成本的供应商之一大量数据的传输需要相当大的带宽，这就是为什么大多数供应商以付费方式提供这种服务的原因。　　最重要的是，这个过程的费用并不低。取决于服务提供商，可能从几百美元到几千美元不等。　　（5）专业厂商协助　　在大多数情况下，云存储成本分析需要专门领域的专业知识，否则组织可能会忽视一些虽小却重要的情况。　　根据实际情况，组织可能会增加一大笔费用，并提高了数据迁移的总成本。
2.1K70发布于 2018-03-02
来自专栏灯塔大数据
趋势 | 大数据存储领域5大突破技术
从2011年，纽约的startup公司已经成长为开发者服务的第二大云部署平台，为包括亚马逊、谷歌和微软在内的很多大型公司提供简单的、可升级的SSD云服务平台。随着动态域名服务的发展，一种更先进的机器学习中采用的算法基于复杂的非线性关系模型，也就是机器可以感知其周围的世界。苹果的Siri和微软的Cortana就是这种全自主代理的先驱。同时，共享驾驶App也在爆炸式增长，例如Uber打破了人们对于汽车所有权的传统看法，Lyft和通用汽车也斥资5亿美元研究如何破解自动驾驶汽车共享软件app的代码。 ? 图3：自动驾驶的智能汽车。只能机器人显然非常吸引人，部分是因为它们在人性化和专业设置方面具有非常大的应用潜力。 5 大数据简化大数据可以提供我们前所未有的洞察力，而利用这些数据的关键在于解读和分析。
2.7K60发布于 2018-04-10
来自专栏杨飞@益术
Android数据存储实现的5大方式
这个方法需要四个参数：上下文环境（例如，一个 Activity），数据库名字，一个可选的游标工厂（通常是 Null），一个代表你正在使用的数据库模型版本的整数。 3 onUpgrage() 方法，它需要三个参数，一个 SQLiteDatabase 对象，一个旧的版本号和一个新的版本号，这样你就可以清楚如何把一个数据库从旧的模型转变到新的模型。例如： db.execSQL(“INSERT INTO widgets (name, inventory)”+ “VALUES (‘Sprocket’, 5)”); 另一种方法是使用 SQLiteDatabase 5. 第五种：网络存储数据前面介绍的几种存储都是将数据存储在本地设备上，除此之外，还有一种存储（获取）数据的方式，通过网络来实现数据的存储和获取。
4.4K20发布于 2019-02-21
来自专栏Java学习网
Android数据存储实现的5大方式
Android数据存储实现的5大方式数据存储在开发中是使用最频繁的，在这里主要介绍Android平台中实现数据存储的5种方式，更加系统详细的介绍了5种存储的方法和异同。 openFileOutput(“itcast.txt”, Context.MODE_WORLD_READABLE + Context.MODE_WORLD_WRITEABLE); android有一套自己的安全模型这个方法需要四个参数：上下文环境（例如，一个 Activity），数据库名字，一个可选的游标工厂（通常是 Null），一个代表你正在使用的数据库模型版本的整数。 3 onUpgrage() 方法，它需要三个参数，一个 SQLiteDatabase 对象，一个旧的版本号和一个新的版本号，这样你就可以清楚如何把一个数据库从旧的模型转变到新的模型。 5.
8.2K90发布于 2018-02-26
来自专栏Alter聊科技
“烧钱”的大模型，如何迈过存储这道坎？
根据第一性原理，大模型训练时算力利用率低的诱因是海量的小文件，传统存储系统无法高效地处理这些数据，导致加载速度缓慢。大模型训练的效率要达到极致，减少不必要的浪费，必须在数据上下功夫，准确地说，必须要在数据存储性能上进行创新。 03 数据存储进入到“大模型时代”某种程度上说，大模型训练催生的数据存储性能要求，不过是文件存储系统加速演变的一个侧面。直到今天，文件存储的需求仍在不断更新，文件系统的创新也在持续发生，就像大模型训练需求所折射出的演进方向。无可否认的是，大模型正在从前台的“火热”，转向整个产业链条的协同驱动，数据存储正是其中的关键一环。
1.1K10编辑于 2023-08-30
来自专栏啄木鸟软件测试
大模型测试：性能优化的5大实战策略
引言随着ChatGLM、Qwen、DeepSeek及Llama系列大语言模型在金融、政务、医疗等关键场景加速落地，模型测试已远超传统‘功能是否正确’的范畴——性能成为决定能否上线的核心瓶颈。这些并非个例，而是大模型测试进入深水区的典型信号：性能不是附加项，而是可信AI的第一道防线。一、明确性能基线：拒绝‘拍脑袋’指标大模型性能测试首要误区是套用小模型标准。二、分层注入式压测：从单卡到集群的穿透验证传统压力测试常止步于API层，而大模型性能瓶颈常藏于框架底层。推荐采用‘四层注入法’： 1）API层：模拟真实用户请求分布（如80%短提示+15%中长提示+5%对抗性长上下文），避免均匀负载失真； 2）Engine层：直连vLLM/Triton推理引擎，注入不同结语大模型性能测试的本质，是构建‘可测量、可归因、可演进’的效能反馈闭环。
32310编辑于 2026-03-31
来自专栏腾讯云存储
数据湖存储在大模型中的应用
9月5日，浪潮信息新产品“互联网+AIGC”行业巡展在深圳举行。会中腾讯云高级产品经理林楠主要从大模型的发展回顾、对存储系统的挑战以及腾讯云存储在大模型领域中的解决方案等三个角度出发，阐述存储系统在大模型浪潮中可以做的事情。为什么模型越来越大对存储系统而言，通用型人工智能也属于应用的一种，那么了解大模型的应用机制和核心需求对存储系统的设计也至关重要。大模型对存储系统的挑战回顾GPT3的论文可以发现，大模型的整体框架中包括了数据的采集、清洗、预训练、微调、推理等多个阶段。腾讯云存储在大模型领域中的解决方案为了应对大模型的技术需求，腾讯云在IaaS、PaaS和SaaS等不同产品方向均提供了多样的技术支持手段，主要体现为三个“快”：数据读取快：GooseFS数据加速，提供高性能存储
4.9K20编辑于 2023-11-01
来自专栏前端自习课
【HTML5】296- 重新复习 HTML5 的 5大存储方式
一、介绍在 HTML5 规范之前，存储主要是用 cookies 。由于存在这么多缺点，因此我们需要解决以下问题：解决 4k 的大小问题；解决请求头常带存储信息的问题；解决关系型存储的问题；跨浏览器；三、五种存储方式 1. 本地存储 localstorage 存储方式：以键值对( Key-Value)的方式存储，永久存储，永不失效，除非手动删除。大小：每个域名5M。支持情况： ? 本地存储 sessionstorage HTML5 的本地存储 API 中的 localStorage 与 sessionStorage 在使用方法上是相同的，区别在于 sessionStorage 在关闭页面后即被清空 5. IndexedDB 索引数据库 (IndexedDB) API（作为 HTML5 的一部分）对创建具有丰富本地存储数据的数据密集型的离线 HTML5 Web 应用程序很有用。
1.1K30发布于 2019-07-25
CFS Turbo 大模型训练存储性能优化实践
数据来源： 2024腾讯全球数字生态大会，主讲人：杨飞第一章：大模型训练引发的存储元数据瓶颈随着大模型技术演进，训练数据集规模呈现爆发式增长，存储系统面临严峻的元数据管理挑战。第二章：构建新一代元数据引擎与智能预读机制针对大模型训练场景，CFS Turbo 采用了新一代自适应条带化目录技术与智能预读策略相结合的技术路径。 2.2 智能预读策略 (Intelligent Read-ahead Policy) 针对大模型训练（以混元DiT为例）中涉及的大量数据整理与转换操作（如 os.listdir, glob, find 优化后表现性能提升倍数 Readdir 性能 - - 提升 55% 100万文件返回速度 30秒 1.4秒 8.6倍第四章：混元DiT训练场景验证在腾讯自研的混元DiT (HunyuanDiT) 大模型训练实践中实战验证：方案已在腾讯混元DiT 等千亿级大模型训练场景中得到验证，具备处理百亿级目录与亿级文件的工程成熟度。
11210编辑于 2026-05-30
来自专栏PPV课数据科学社区
【趋势】大数据和存储领域5大突破技术
从2011年，纽约的startup公司已经成长为开发者服务的第二大云部署平台，为包括亚马逊、谷歌和微软在内的很多大型公司提供简单的、可升级的SSD云服务平台。随着动态域名服务的发展，一种更先进的机器学习中采用的算法基于复杂的非线性关系模型，也就是机器可以感知其周围的世界。　　苹果的Siri和微软的Cortana就是这种全自主代理的先驱。　　同时，共享驾驶App也在爆炸式增长，例如Uber打破了人们对于汽车所有权的传统看法，Lyft和通用汽车也斥资5亿美元研究如何破解自动驾驶汽车共享软件app的代码。图3：自动驾驶的智能汽车。　　只能机器人显然非常吸引人，部分是因为它们在人性化和专业设置方面具有非常大的应用潜力。 5、大数据简化　　大数据可以提供我们前所未有的洞察力，而利用这些数据的关键在于解读和分析。　　
2.2K100发布于 2018-04-24
【大模型微调】一文掌握5种大模型微调的方法
（Prompt Tuning）在内的5种主流方法。大模型微调究竟是什么？直观上，大模型微调即是指通过输入特定领域或任务的数据，并有选择性地调整模型参数的技术过程。我们所讨论的5种微调方法，本质上都是对这个基础架构中自注意力机制与前馈神经网络等核心组件的参数进行优化的不同策略。全面微调旨在更新模型的所有参数，虽能达到极高的性能上限，但计算成本和资源需求巨大。而参数高效微调则通过仅优化模型中的一小部分参数，在保持性能相当的同时，大幅降低了计算开销和存储需求。 5、提示调整-轻量级的参数优化提示调整（Prompt Tuning）是一种“润物细无声”的微调，不改变模型自身，而是通过优化输入提示词的嵌入表示来引导模型输出。
4.1K40编辑于 2025-10-23
来自专栏腾讯云存储
高性能存储与大模型融合创新相关研究
在2023年中国数据与存储峰会“AIGC+存储融合发展论坛”上，腾讯云存储高级产品经理熊建刚老师发表主题演讲，就高性能存储和大模型融合创新相关研究展开探讨，以及腾讯云存储的实践案例。熊老师耕耘存储20年，在腾讯云从事云存储领域的高性能存储以及与大模型融合创新方面的研究工作，致力于推动云技术和人工智能的创新与发展。一、存储技术与人工智能相结合：为AI应用提供高效、可扩展的数据存储和处理基础以ChatGPT为代表大模型的参数呈现指数级增长，已超越人脑神经网络数量。随着大模型的发展，对数据湖诉求进一步加强。第一，更高的可靠性和可用性，避免存储的故障到算力资源的浪费。，面向大模型的加速网络；腾讯云端到端大模型解决方案，适配算力按需的供给，高速供给数据资源。
47710编辑于 2024-01-31

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

华为AI存储「求解」大模型

【AI大模型】Transformers大模型库（十六）：safetensors存储类型

这届存储，为大模型而生！

5种大模型Agent模式

面向大模型时代的云存储架构

IMPRESS：大模型推理存储优化新突破

AI大模型疯长，存储扛住了吗？

云存储成本分析的5大技巧

云存储成本分析的5大技巧

趋势 | 大数据存储领域5大突破技术

Android数据存储实现的5大方式

Android数据存储实现的5大方式

“烧钱”的大模型，如何迈过存储这道坎？

大模型测试：性能优化的5大实战策略

数据湖存储在大模型中的应用

【HTML5】296- 重新复习 HTML5 的 5大存储方式

CFS Turbo 大模型训练存储性能优化实践

【趋势】大数据和存储领域5大突破技术

【大模型微调】一文掌握5种大模型微调的方法

高性能存储与大模型融合创新相关研究

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐