搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏大模型应用
大模型应用：构建智能大模型运维体系：模型健康度监测系统实践.8
引言大型语言模型已成为各行各业的核心基础设施。从客户服务到内容创作，从代码生成到科学研究，大模型正深度融入企业的核心业务流程。传统的系统监控工具如Zabbix、Prometheus等虽然能监控基础硬件资源，但无法深入理解大模型服务的特殊行为模式，无法感知模型推理的内在质量，更无法预测服务性能的潜在风险。今天我们将以模型健康度监测系统为例，深度剖析现代大模型运维平台的设计理念、技术实现与创新亮点。通过详细的流程分析、架构解读和实践场景说明，为构建智能化的模型运维体系提供完整的实践参考和技术路线图。多层次监控体系系统构建我们采用了四层级的立体化监控架构，每一层都针对大模型服务的特定维度进行深度监控：系统资源层：基础硬件资源监控（CPU、内存、磁盘、网络），确保运行环境稳定模型运行层 ): """智能性能评分算法 - 基于大模型服务特性的专业评分体系""" score = 100 # 基准分数 # CPU性能 (权重: 25%) - 考虑到大模型推理对CPU
48843编辑于 2026-02-05
来自专栏token的技术分享
基于.NET8的AI大模型管理
此外，AIDotNet API还支持多种AI大模型，包括OpenAI、星火大模型、Claudia、智谱AI、Ollama、通义千问（阿里云）、AzureOpenAI以及腾讯混元大模型，满足了用户对各种AI 模型的需求。基于.NET Core 8实现使用EntityFrameworkCore对于数据库操作。基于MiniApis提供WebAPI服务。功能实现支持用户管理支持渠道管理支持token管理提供数据统计预览支持日志查看支持系统设置支持接入外部Chat链接支持支付宝购买账号余额 AI大模型支持列表 OpenAI （支持function ）星火大模型（支持function） Claudia 智谱AI Ollama 通义千问（阿里云） AzureOpenAI（支持function）腾讯混元大模型支持数据库 SqlServer 配置类型
43210编辑于 2024-05-28
来自专栏MavenTalk
开源社区大模型目前面临的8大瓶颈问题
但面对商业化的ClosedAI和OpenAI等语言模型，还存在一些瓶颈。数据量不足，预训练数据有限开源社区很难获得大规模高质量的数据集来进行模型预训练，导致其模型质量无法与业内巨头相提并论。数据量的不足直接限制了模型的表达能力和推理能力。算力资源有限，GPU/TPU数量相对较少开源社区几乎没有足够的GPU/TPU来训练超大规模的模型参数，很难进行长时间的预训练，无法匹敌巨头公司拥有的算力优势。算力的缺乏是开源模型质量提升的硬限制。商业化受限，收入有限，难以持续投入开源社区很难直接通过模型商业化来获得持续的财务支持，长期投入会面临资金短缺问题。模型泛化、可解释性与安全性等方面有待提高开源模型的可解释性和安全性还需要加强，部署时存在不确定性，这也是限制其应用的一个因素。
68230编辑于 2023-09-06
来自专栏老张的求知思考世界
全链路压测(8)：构建三大模型
梳理核心链路的一个重要目的是获得流量模型。但在全链路压测中，除了流量模型，业务模型和数据模型一样重要。这篇文章，为大家介绍如何构建这三大模型。下图是一个常见的电商双11大促时候的业务场景模型图，我以这个思维导图为例来做分析说明。峰值流量模型预估的流量模型要以峰值流量场景来预估，否则很可能由于错误的预估导致准备不足而致使大促期间线上出现问题。这不仅是一个技术和监控的问题，还要综合考虑本次大促期间业务目标以及业务转化率的因素。预估大促时的支付转化率为60%，则可得：大促峰值订单支付QPS为（200/40%）*60%*（200W/50W）=1200QPS。，确认以下信息：是否有热点数据相关的操作：比如说所有用户秒杀同一件商品；不同类型数据处理逻辑有差异时，需通过测试数据多样化提高性能测试代码覆盖率；缓存数据：要确认是否有缓存，缓存大小为多少（排除大key
1.6K30编辑于 2022-05-17
来自专栏MavenTalk
8家国产AI大模型开放使用，人手一个大模型的时代来临
什么是大模型先做个扫盲，AI大模型是“人工智能预训练大模型”的简称。语言模型是一种人工智能模型，它被训练成理解和生成人类语言。这8家分别是谁百度（文心一言）抖音（云雀大模型）智谱AI（GLM大模型）中科院（紫东太初大模型）百川智能（百川大模型）商汤（日日新大模型） MiniMax（ABAB大模型）上海人工智能实验室（书生通用大模型）书生通用大模型与云雀大模型我确实是第一次听说，国内大模型再现当年百团「团购」大战的身影，截至2023年7月,中国累计已经有130个大模型问世。 MiniMax（ABAB大模型） https://www.sensetime.com/ 商汤（日日新大模型） https://intern-ai.org.cn 上海人工智能实验室（书生通用大模型）至于这8家的AI大模型的能力如何，交给你来评判吧。不过至今为止，依旧是无人能挑战ChatGPT的霸主地位。祝你早日用上AI大模型，帮助自己提升工作、生活、学习效率。
3.3K40编辑于 2023-09-06
来自专栏创作是最好的自我投资
通用大模型VS垂直大模型
在人工智能这个充满无限可能的领域内，通用大模型和垂直大模型各有千秋。就我个人而言，在二者之间的选择上，并不存在偏向某一方的倾向。我觉得应当依据实际应用场景的具体需求，来挑选最为契合的大模型。通用大模型通用大模型，乃是旨在应对多种任务与数据类型的庞然大物级人工智能模型。在知识覆盖的广度方面，通用大模型无疑具有明显的优势。当我们对于当下所需模型所涉及的精确专业领域的界限感到模糊不清时，选择通用大模型无疑是一种明智之举。垂直大模型接下来谈谈垂直大模型。然而，由于垂直大模型的训练内容聚焦于当前行业，其涉猎的范围更集中，数据针对性更强，所以在提供专业咨询时往往更加精准、细致，这也正是垂直大模型的独特价值所在。因此，对于通用大模型或者垂直大模型，更倾向于哪一方不取决于个人想法，而是取决于用户需要。
87501编辑于 2024-12-30
来自专栏小洁叫你mysql
【AI大模型】训练Al大模型
大模型超越AI 目前所指的大模型，是“大规模深度学习模型”的简称，指具有大量参数和复杂结构的机器学习模型，可以处理大规模的数据和复杂的问题，多应用于自然语言处理、计算机视觉、语音识别等领域。本文将探讨大模型的概念、训练技术和应用领域，以及与大模型相关的挑战和未来发展方向。大模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数，而大模型则可能拥有数亿或数十亿个参数。训练大模型的挑战训练大模型需要应对一系列挑战，包括：以下是与大模型相关的一些代码示例：计算资源需求： import tensorflow as tf # 指定使用GPU进行训练 with tf.device 更智能的模型压缩技术：模型压缩和加速技术将继续发展，以减小大模型的计算和存储开销。更好的计算平台支持：为了支持训练和部署大模型，计算平台将继续改进，提供更强大的计算资源和工具。
1.7K30编辑于 2023-10-10
来自专栏大模型应用
大模型应用：大模型量化：INT4与INT8核心差异、选型指南及代码实现.53
一、引言大模型的量化我们前期也探讨了基础概念和实践原理，针对CPU的量化流程做了通俗易懂的基础说明，但实际应用场景往往是需要GPU的落地实践，随着大模型参数规模突破千亿级别，存储大、显存高压缩比的直观数学说明：INT8压缩比：32位 → 8位，压缩率75%，只有原始的1/4大小INT4压缩比：32位 → 4位，压缩率87.5%，仅有原始的1/8大小实际存储示例：原始10亿参数模型（FP32 "# 测试提示词PROMPT = "请简要介绍大模型INT4和INT8量化的核心区别"# 计算模型显存占用的工具函数def calculate_model_memory_usage(model): 五、总结简单而言，大模型INT8和INT4量化，本质就是给笨重的高精度模型减减肥，让它又小又快，还能在普通设备上跑。总的来说，量化不是瞎压缩，是用一点点精度损失，换存储、显存减半甚至减八成，推理速度还能快 2~5 倍，让原本只能在高端GPU上跑的大模型，在普通环境也能轻松用起来，是大模型落地的关键技巧。
1.3K55编辑于 2026-03-23
来自专栏自然语言处理(NLP)论文速递
ICLR2024 | 分享 8篇Spotlight论文，涉及多模态大模型、大模型优化、RLHF等热门话题！
今天给大家整理了8篇值得阅读的Spotlights论文，其中主要涉及多模态大模型、Transformer多头注意力、上下文预训练、安全RLHF、LLM指令微调、大模型数据隐私、生成流网络等热门方向。多模态大模型框架 https://openreview.net/attachment? 对不同规模和类型的大模型进行的大量实验表明，现有的大模型仍然缺乏事实知识，并且存在各种虚假相关性。本文认为这是实现可信人工智能的关键瓶颈。数据集 Pinocchio 和我们的代码将公开。该技术在提高中等规模的大模型性能方面显示出特别的优势，有时甚至可以与更大的模型变体相媲美。本文提出了两个问题： 1、指令调整模型对指令的特定短语有多敏感？ 2、如何使它们对这种自然语言变化更加鲁棒？我们证明这种方法持续提高了指令调整模型的稳健性。大模型数据隐私 https://openreview.net/attachment?
3.4K10编辑于 2024-01-20
来自专栏学习
开源大模型与闭源大模型
在人工智能（AI）和机器学习（ML）的快速发展过程中，大模型（Large Models）已经成为推动技术进步的重要力量。当前，业界存在两种主要的大模型开发模式：开源大模型和闭源大模型。一、开源大模型开源大模型是指开发者将模型的代码和训练数据公开，使得任何人都可以访问、修改和使用这些资源。二、闭源大模型闭源大模型是指模型的代码和数据不对外公开，通常由商业公司开发和维护。代表性的闭源大模型包括OpenAI的GPT-3和Google的BERT。三、开源大模型与闭源大模型的对比 1.透明性与可控性：开源大模型的透明性更高，任何人都可以查看和验证其代码和数据，确保模型的行为符合预期。这对于学术研究和技术验证非常重要。闭源大模型通过控制代码和数据的访问，能够更好地保护用户隐私和数据安全，降低被恶意利用的风险。五、总结开源大模型和闭源大模型各有优缺点，适合不同的应用场景和需求。
2K10编辑于 2024-10-09
来自专栏运维开发故事
探索AI+k8s：如何使用Deepseek大模型增强k8s-dashboard
基于 AMIS 构建，并通过 kom 作为 Kubernetes API 客户端，k8m 内置了 Qwen2.5-Coder-7B 模型交互能力，同时支持接入您自己的私有化大模型，比如deepseek模型 "sk-xxxxxxx") -m, --chatgpt-model string 大模型的自定义模型名称 (default "Qwen/Qwen2.5-7B-Instruct OPENAI_API_URL "" 大模型的 API URL OPENAI_MODEL Qwen/Qwen2.5-7B-Instruct 大模型的默认模型名称，如需DeepSeek，请设置为deepseek-ai AI诊断报告呈上，有没有感觉很酷～ 4.4 AI智检智检功能主要是引用了k8s_gpt工具中预置的规则使用大模型，进行集群的智能巡检，目前平台支持集群，节点，部署，有状态集，容器组，svc，ingress 无论是需要快速查看集群状态，还是解决复杂的配置和运行问题，k8m 都能为开发者和运维团队提供可靠支持。同时，它兼容本地化大模型部署，有效解决了数据安全和访问效率问题，为企业提供更高的自主性。
90110编辑于 2025-03-27
来自专栏IT从业者张某某
大模型与大模型的幻觉问题
参考大模型中的涌现 OpenAI 科学家：幻觉是大模型与生俱来的特性，而非缺陷大模型「幻觉」，看这一篇就够了｜哈工大华为出品大模型什么是大模型大语言模型（LLM）是基于海量文本数据训练的深度学习模型大模型的模型发展如下图涌现参考：大模型中的涌现什么是涌现？先从蚂蚁开始说起。蚂蚁是自然界中一种个体非常简单，但是群体能力非常强大的生物。什么是大模型中的涌现？在较小的模型中不出现，而在较大的模型中出现的能力，称为涌现。我们看这张图片，它包含8张子图。分别在是八个不同的子任务下测试大模型的few-shot的能力。如何解决大模型的「幻觉」问题？方向一：什么是大模型「幻觉」大模型出现幻觉，简而言之就是“胡说八道”。用文中的话来讲，是指模型生成的内容与现实世界事实或用户输入不一致的现象。只有大模型助手存在幻觉问题。方向二：造成大模型「幻觉」的原因那么致使大模型产生幻觉的原因都有哪些？
2K11编辑于 2024-01-04
来自专栏数据派THU
原创 | 大模型扫盲系列——初识大模型
为了提高模型的性能，研究者们不断尝试增加模型的参数数量，从而诞生了大模型这一概念。本文将从大模型的原理、训练过程、prompt和相关应用介绍等方面进行分析，帮助读者初步了解大模型。为了提高模型的性能，研究者们不断尝试增加模型的参数数量，从而诞生了大模型这一概念。本文讨论的大模型将以平时指向比较多的大语言模型为例来进行相关介绍。训练三步骤初步认识了大模型长什么样了，接下来一起来看看如何训练出一个大模型。除这些外还包括算法优化、隐私和数据安全以及模型可解释性等方面的研究和应用，每天还有很多大模型的应用正在不断涌现，大模型在未来仍然有很大的发展潜力，国内的优秀大模型代表例如百度文心大模型也正在搭建全系统产业化的大模型全景大模型挑战大模型也存在一些现实挑战： 1.数据安全隐患：一方面大模型训练需要大量的数据支持，但很多数据涉及到机密以及个人隐私问题，如客户信息、交易数据等。
21.4K29编辑于 2023-11-22
别再“为了大模型而大模型”了
最近这两年，在很多公司里，大模型成了一种奇妙的存在。它不像一个技术工具，更像是一只突然闯进会议室的大象。领导一拍桌子： “我们也要上大模型！” 业务同事一听： “我们这个流程能不能加个大模型？” 但现在有些项目会直接说： “让大模型来判断吧。” 乍一听很高级，仔细一想很浪费。大模型当然能判断，但它不一定最适合判断。大模型天然消耗昂贵的GPU和电力，成本更高；大模型的参数量巨大，运算速度更慢；大模型基于语言的概率给出答案，结果不稳定，大模型内核原理对业务就是一个黑盒，无法说明，解释更困难；出了错还不好定位，你只能靠经验去猜不需要梳理业务流程了，大模型会自己理解；不需要总结专家经验了，大模型会自己推理；不需要定义评价标准了，大模型会自己判断；不需要建设知识库了，大模型会自己知道。七、别把大模型当神仙，要把它当同事我一直觉得，企业用大模型最健康的心态，不是“请神”，而是“招人”。
18711编辑于 2026-06-01
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。 LoRA是一种用于微调大型语言模型的轻量级方法，它通过添加低秩矩阵到预训练模型的权重上来实现适应性调整，从而在不显著增加模型大小的情况下提升特定任务的性能。 task_type: 指定任务类型，如'CAUSAL_LM'，以确保LoRA适应正确应用到模型的相应部分。 get_peft_model(model, config) print_trainable_parameters(model) 三、总结本文简要介绍LoraConfig的配置参数情况，具体的机遇peft对大模型进行微调后面单独开一页详细讲解
1K10编辑于 2024-08-13
来自专栏流川疯编写程序的艺术
《书生大模型实战营第3期》基础岛第2关：8G 显存玩转书生大模型 Demo
模型。 LMDeploy 部署 InternLM-XComposer2-VL-1.8B 模型 InternLM-XComposer2 是一款基于 InternLM2 的视觉语言大模型，其擅长自由形式的文本图像合成和理解 LMDeploy 部署 InternVL2-2B 模型 InternVL2 是上海人工智能实验室推出的新一代视觉-语言多模态大模型，是首个综合性能媲美国际闭源商业模型的开源多模态大模型。 InternVL2 系列从千亿大模型到端侧小模型全覆盖，通专融合，支持多种模态。后台等了三分多钟还是没有结果，我也不太看明白log 啥意思其他学习内容参考文献大模型实战营地址 https://openxlab.org.cn/models/InternLM/subject
46810编辑于 2024-08-11
来自专栏AIGC 先锋科技
Eir-8B 专为医学领域打造的先进大语言模型！
为此，作者引入了Eir-8B，这是一个起初基于LLaMA 3.1 Instruct-8B进行修改的8亿参数模型[5]。模型合并 Fine-tuning之后，作者采用了一种模型合并策略将LaMA-3.1-8B-instruct模型与fine-tuned模型合并。 4 Evaluation 为了评估Eir模型（Enhanced IR Model）的潜力，作者开发了两种变体：专门针对阅读电子健康记录（EHR）数据的Eir-8B模型 [Eir-8B，专门用于文本分类任务 Eir-8B-prob]，以及关注问题回答任务的Eir-8B-prob模型。而Eir-8B模型在得分上比Typhoon-v1.5x-8B-instruct 高2.8%，比GPT-3.5 Turbo 1106 高5.3%。
55910编辑于 2024-09-29
来自专栏IT从业者张某某
大语言模型-1.2-大模型技术基础
简介 1.2 大模型技术基础大语言模型预训练阶段会得到base model，本质上就是一个互联网文本模拟器，这个阶段需要上万台服务器训练几个月的时间，这个生成的模型可以认为是互联网的有损压缩。构建一个大语言模型大语言模型预训练（Pre-training）使用与下游任务无关的大规模数据进行模型参数的初始训练 ➢ 基于Transformer解码器架构，进行下一个词预测 ➢ 数据数量、数据质量都非常关键人类对齐（Human Alignment） ➢ 将大语言模型与人类的期望、需求以及价值观对齐 ➢ 基于人类反馈的强化学习对齐方法（RLHF）大模型的研发已经成为一项系统工程扩展定律（ Scaling Law) ➢ 通过扩展参数规模、数据规模和计算算力，大语言模型的能力会出现显著提升 ➢ 扩展定律在本次大模型浪潮中起到了重要作用大语言模型采用了与小型预训练语言模型相似的神经网络结构，从而获得更可靠的答案涌现能力与扩展定律的关系 ➢ 涌现能力和扩展定律是两种描述规模效应的度量方法大模型核心技术 ➢ 规模扩展：扩展定律奠定了早期大模型的技术路线，产生了巨大的性能提升
65210编辑于 2025-03-15
来自专栏机器学习入门
【AI大模型】LLM主流开源大模型介绍
学习目标了解LLM主流开源大模型. 掌握ChatGLM、LLaMA、Bloom等基础大模型的原理 LLM主流大模型类别随着ChatGPT迅速火爆，引发了大模型的时代变革，国内外各大公司也快速跟进生成式AI市场，近百款大模型发布及应用目前，市面上已经开源了各种类型的大语言模型，本章节我们主要介绍其中的三大类： ChatGLM-6B：衍生的大模型（wenda、ChatSQL等） LLaMA：衍生的大模型（Alpaca、Vicuna 显存（推理）最低GPU显存（高效参数微调） FP16(无量化) 13GB 14GB INT8 10GB 9GB INT4 6GB 7GB 2.5 模型特点优点：较低的部署门槛： INT4 精度下 BLOOM模型 BLOOM系列模型是由 Hugging Face公司的BigScience 团队训练的大语言模型。
1.4K10编辑于 2024-09-24
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（十二）：Evaluate模型评估
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。本文重点介绍Evaluate模型评估。二、Evaluate模型评估 2.1 概述 Transformers库中的evaluate API主要用于评估模型在特定数据集上的性能。下面是一个使用Python和Transformers库进行模型评估的基本步骤，假设你已经有了一个预训练模型和相应的数据集处理器。评估结果将包含各种指标，如准确率，具体指标还要取决于你的模型。
1.2K10编辑于 2024-08-13

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

大模型应用：构建智能大模型运维体系：模型健康度监测系统实践.8

基于.NET8的AI大模型管理

开源社区大模型目前面临的8大瓶颈问题

全链路压测(8)：构建三大模型

8家国产AI大模型开放使用，人手一个大模型的时代来临

通用大模型VS垂直大模型

【AI大模型】训练Al大模型

大模型应用：大模型量化：INT4与INT8核心差异、选型指南及代码实现.53

ICLR2024 | 分享 8篇Spotlight论文，涉及多模态大模型、大模型优化、RLHF等热门话题！

开源大模型与闭源大模型

探索AI+k8s：如何使用Deepseek大模型增强k8s-dashboard

大模型与大模型的幻觉问题

原创 | 大模型扫盲系列——初识大模型

别再“为了大模型而大模型”了

【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig

《书生大模型实战营第3期》基础岛第2关：8G 显存玩转书生大模型 Demo

Eir-8B 专为医学领域打造的先进大语言模型！

大语言模型-1.2-大模型技术基础

【AI大模型】LLM主流开源大模型介绍

【AI大模型】Transformers大模型库（十二）：Evaluate模型评估

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

大模型应用：构建智能大模型运维体系：模型健康度监测系统实践.8

基于.NET8的AI大模型管理

开源社区大模型目前面临的8大瓶颈问题

全链路压测(8)：构建三大模型

8家国产AI大模型开放使用，人手一个大模型的时代来临

通用大模型VS垂直大模型

【AI大模型】训练Al大模型

大模型应用：大模型量化：INT4与INT8核心差异、选型指南及代码实现.53

ICLR2024 | 分享 8篇Spotlight论文，涉及多模态大模型、大模型优化、RLHF等热门话题！

开源大模型与闭源大模型

探索AI+k8s：如何使用Deepseek大模型增强k8s-dashboard

大模型与大模型的幻觉问题

原创 | 大模型扫盲系列——初识大模型

别再“为了大模型而大模型”了

【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig

《书生大模型实战营第3期》基础岛 第2关 ：8G 显存玩转书生大模型 Demo

Eir-8B 专为医学领域打造的先进大语言模型 ！

大语言模型-1.2-大模型技术基础

【AI大模型】LLM主流开源大模型介绍

【AI大模型】Transformers大模型库（十二）：Evaluate模型评估

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

《书生大模型实战营第3期》基础岛第2关：8G 显存玩转书生大模型 Demo

Eir-8B 专为医学领域打造的先进大语言模型！