搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏大模型应用
大模型应用：大模型的词元化处理详解：BPE、WordPiece、Unigram.11
引言词元化（Tokenization）是大模型预处理的核心步骤，将连续文本切分为模型可理解的最小语义单元（Token），这些词元可以是单词、子词或字符。 11. 对新文本进行分词（使用最长匹配策略）。注意：在WordPiece中，通常使用一个语言模型来评估合并后的似然变化，但这里我们使用对数似然增益的公式作为合并标准。6. 生成候选Token（例如所有单字、双字、多字组合，或者通过其他方式生成一个大词表）3. 构建初始大词表4. 训练Unigram语言模型（即计算每个词元的概率）5. 删除困惑度上升最小的词元（即对模型影响最小的词元）8. 更新词表，并重新计算每个词元的概率（重新训练语言模型）9. 重复步骤5-8直到词表大小达标10. 生成最终词表11. 六、总结词元化是大模型理解文本的基础预处理步骤，核心是将中文文本切分为有语义的最小单元（Token）。
24510编辑于 2026-02-08
来自专栏帅云霓的技术小屋
大模型与AI底层技术揭秘 (11) 变形记
有一天，小H在吃完午饭回到办公室，旁边几位同学在打《王者荣耀》，并且在挑拨匹配到的一对情侣队友分手。
34010编辑于 2023-11-27
来自专栏数据结构与算法
11:大整数减法
11:大整数减法查看提交统计提问总时间限制: 1000ms 内存限制: 65536kB描述求两个大的正整数相减的差。输入共2行，第1行是被减数a，第2行是减数b(a > b)。 char a[10001]; 6 char b[10001]; 7 int a1[10001]; 8 int b1[10001]; 9 int c[10001]; 10 int main() 11
1.4K100发布于 2018-04-11
来自专栏创作是最好的自我投资
通用大模型VS垂直大模型
在人工智能这个充满无限可能的领域内，通用大模型和垂直大模型各有千秋。就我个人而言，在二者之间的选择上，并不存在偏向某一方的倾向。我觉得应当依据实际应用场景的具体需求，来挑选最为契合的大模型。通用大模型通用大模型，乃是旨在应对多种任务与数据类型的庞然大物级人工智能模型。在知识覆盖的广度方面，通用大模型无疑具有明显的优势。当我们对于当下所需模型所涉及的精确专业领域的界限感到模糊不清时，选择通用大模型无疑是一种明智之举。垂直大模型接下来谈谈垂直大模型。然而，由于垂直大模型的训练内容聚焦于当前行业，其涉猎的范围更集中，数据针对性更强，所以在提供专业咨询时往往更加精准、细致，这也正是垂直大模型的独特价值所在。因此，对于通用大模型或者垂直大模型，更倾向于哪一方不取决于个人想法，而是取决于用户需要。
71401编辑于 2024-12-30
来自专栏小洁叫你mysql
【AI大模型】训练Al大模型
大模型超越AI 目前所指的大模型，是“大规模深度学习模型”的简称，指具有大量参数和复杂结构的机器学习模型，可以处理大规模的数据和复杂的问题，多应用于自然语言处理、计算机视觉、语音识别等领域。本文将探讨大模型的概念、训练技术和应用领域，以及与大模型相关的挑战和未来发展方向。大模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数，而大模型则可能拥有数亿或数十亿个参数。训练大模型的挑战训练大模型需要应对一系列挑战，包括：以下是与大模型相关的一些代码示例：计算资源需求： import tensorflow as tf # 指定使用GPU进行训练 with tf.device 更智能的模型压缩技术：模型压缩和加速技术将继续发展，以减小大模型的计算和存储开销。更好的计算平台支持：为了支持训练和部署大模型，计算平台将继续改进，提供更强大的计算资源和工具。
1.5K30编辑于 2023-10-10
来自专栏AIOT
在Jetson上玩转大模型Day11：SAM2应用
见面文章中提到Google研究院所提出的ViT（Vision Transofmers）技术，将机器视觉与大语言模型结合成多模态的应用，为机器视觉领域开创新的纪元，于是在这个基础之上又发展出许多新的技术，该模型也可以根据用户具体诉求，选择分割某个物体或某个区域，使控制更加精准。该模型首先将图像转换为图像嵌入，从而允许从提示中高效地生成高质量的掩模。为模型提供了一个简单的接口用于提示模型，允许用户首先使用set_image方法设置图像，该方法计算必要的图像嵌入。该模型可以将点和框提示以及之前预测迭代的掩码作为输入。在帧上添加点击（或框）以获取和细化掩码（时空掩码）在整个视频中传播点击（或框）以获得掩码同时分割和跟踪多个目标現在就可以開始好好跟隨每個ipynb裏面所提供的指示，開始輕鬆學習SAM2有趣並且強大的功能
82710编辑于 2024-11-08
来自专栏机器之心
IDC最新报告，7大维度11家大模型厂商比拼，唯一全优是谁？
近日，全球领先的国际数据公司（IDC）最新发布的大模型实测报告《中国大模型市场主流产品评估，2024》从基础能力到应用能力 7 大维度对 11 家大模型厂商的 16 款市场主流产品进行实测。在 IDC 列出的厂商里，有很多我们熟悉的公司，国外厂商如 OpenAI；国内厂商包括阿里、商汤、科大讯飞、百川、智谱、昆仑万维等 11 家大模型厂商的 16 款产品参与了本次评估。基于上述两方面的设计，文心大模型已经发展出基础模型应用、智能体模式应用、多模态应用等多种创新应用模式，真正地把大模型能力转化成了生产力的提升。例如在行业落地上，百度智能云推出千帆大模型平台，以一站式企业级大模型开发及服务运行平台服务大众。一直到这波大模型浪潮，百度率先推出国产大模型产品，并不断迭代技术、推进落地应用。而经过一年半的「百模大战」，大模型进入了拼落地应用的阶段。
85610编辑于 2024-06-17
来自专栏AIGC大模型应用
AI大模型企业应用实战(11)-Document Loader文件加载器机制
loader机制让大模型具备实时学习的能力：0 Loader机制案例环境准备：import osos.environ["OPENAI_API_KEY"] = "sk-javaedge"os.environ
47400编辑于 2024-08-16
来自专栏学习
开源大模型与闭源大模型
在人工智能（AI）和机器学习（ML）的快速发展过程中，大模型（Large Models）已经成为推动技术进步的重要力量。当前，业界存在两种主要的大模型开发模式：开源大模型和闭源大模型。一、开源大模型开源大模型是指开发者将模型的代码和训练数据公开，使得任何人都可以访问、修改和使用这些资源。二、闭源大模型闭源大模型是指模型的代码和数据不对外公开，通常由商业公司开发和维护。代表性的闭源大模型包括OpenAI的GPT-3和Google的BERT。三、开源大模型与闭源大模型的对比 1.透明性与可控性：开源大模型的透明性更高，任何人都可以查看和验证其代码和数据，确保模型的行为符合预期。这对于学术研究和技术验证非常重要。闭源大模型通过控制代码和数据的访问，能够更好地保护用户隐私和数据安全，降低被恶意利用的风险。五、总结开源大模型和闭源大模型各有优缺点，适合不同的应用场景和需求。
1.5K10编辑于 2024-10-09
来自专栏数据派THU
原创 | 大模型扫盲系列——初识大模型
为了提高模型的性能，研究者们不断尝试增加模型的参数数量，从而诞生了大模型这一概念。本文将从大模型的原理、训练过程、prompt和相关应用介绍等方面进行分析，帮助读者初步了解大模型。为了提高模型的性能，研究者们不断尝试增加模型的参数数量，从而诞生了大模型这一概念。本文讨论的大模型将以平时指向比较多的大语言模型为例来进行相关介绍。训练三步骤初步认识了大模型长什么样了，接下来一起来看看如何训练出一个大模型。除这些外还包括算法优化、隐私和数据安全以及模型可解释性等方面的研究和应用，每天还有很多大模型的应用正在不断涌现，大模型在未来仍然有很大的发展潜力，国内的优秀大模型代表例如百度文心大模型也正在搭建全系统产业化的大模型全景大模型挑战大模型也存在一些现实挑战： 1.数据安全隐患：一方面大模型训练需要大量的数据支持，但很多数据涉及到机密以及个人隐私问题，如客户信息、交易数据等。
21.1K29编辑于 2023-11-22
来自专栏IT从业者张某某
大模型与大模型的幻觉问题
参考大模型中的涌现 OpenAI 科学家：幻觉是大模型与生俱来的特性，而非缺陷大模型「幻觉」，看这一篇就够了｜哈工大华为出品大模型什么是大模型大语言模型（LLM）是基于海量文本数据训练的深度学习模型大模型的模型发展如下图涌现参考：大模型中的涌现什么是涌现？先从蚂蚁开始说起。蚂蚁是自然界中一种个体非常简单，但是群体能力非常强大的生物。如何解决大模型的「幻觉」问题？方向一：什么是大模型「幻觉」大模型出现幻觉，简而言之就是“胡说八道”。用文中的话来讲，是指模型生成的内容与现实世界事实或用户输入不一致的现象。 OpenAI 科学家 Andrej Karpathy关于大模型幻觉在 Karpathy 看来：从某种意义上说，大语言模型的全部工作恰恰就是制造幻觉，大模型就是「造梦机」。只有大模型助手存在幻觉问题。方向二：造成大模型「幻觉」的原因那么致使大模型产生幻觉的原因都有哪些？
1.7K11编辑于 2024-01-04
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。 LoRA是一种用于微调大型语言模型的轻量级方法，它通过添加低秩矩阵到预训练模型的权重上来实现适应性调整，从而在不显著增加模型大小的情况下提升特定任务的性能。 task_type: 指定任务类型，如'CAUSAL_LM'，以确保LoRA适应正确应用到模型的相应部分。 get_peft_model(model, config) print_trainable_parameters(model) 三、总结本文简要介绍LoraConfig的配置参数情况，具体的机遇peft对大模型进行微调后面单独开一页详细讲解
90710编辑于 2024-08-13
来自专栏AI科技评论
山海大模型发布：11年的积累，云知声如何翻越“山海”
5月24日，云知声发布的大模型，名字“山海”就是从中而来。踏平“山海”，黄伟和云知声在大模型之路上求索，正带着人工智能走向2.0时代。 1 山海大模型怎样在同类赛道里脱颖而出？而云知声对待大模型，不仅要“山海”在这些“基础课”中达到及格，更要让它能够在B端落地生根，产生实际的价值。而这些能力，不只源于大模型自身的能力。另一方面，在过去的11年里，深耕 To B 的云知声，也积累了大量行业的 Know How，以及核心高质量的训练数据。诚然，大模型的发展路径不止一种，目前见到成果的路径，是如GPT采用的一样——更大的模型规模+更多的数据参数，做泛化大模型，再进行行业调优。 5月24日，云知声山海大模型暨成果发布会在北京举办，现场实测山海大模型十大核心能力，并发布一系列面向不同行业需求的产品应用。北京金隅智造工场的发布会现场，台下座无虚席，现场宾客盈门。
55120编辑于 2023-08-08
来自专栏ClearSeve
C++11内存模型
最近看了极客时间——《现代C++实战三十讲》中的内存模型与Atomic一节，感觉对C++的内存模型理解还不是很清楚，看了后面的参考文献以及看了一些好的博客，算是基本了解了，根据参考文献整合一下。 Thread-1: Thread-2: x = 100; // A std::cout << x; // B C++11 C++11的内存模型共有6种，分四类。其中一致性的减弱会伴随着性能的增强。参考链接【1】C++11中的内存模型上篇 – 内存模型基础【2】C++11中的内存模型下篇 – C++11支持的几种内存模型【3】理解 C++ 的 Memory Order 【4】如何理解 C++ 11 的六种 memory order 【5】《现代C++实战三十讲》中的内存模型与Atomic
97630编辑于 2022-02-11
来自专栏IT从业者张某某
大语言模型-1.2-大模型技术基础
简介 1.2 大模型技术基础大语言模型预训练阶段会得到base model，本质上就是一个互联网文本模拟器，这个阶段需要上万台服务器训练几个月的时间，这个生成的模型可以认为是互联网的有损压缩。构建一个大语言模型大语言模型预训练（Pre-training）使用与下游任务无关的大规模数据进行模型参数的初始训练 ➢ 基于Transformer解码器架构，进行下一个词预测 ➢ 数据数量、数据质量都非常关键人类对齐（Human Alignment） ➢ 将大语言模型与人类的期望、需求以及价值观对齐 ➢ 基于人类反馈的强化学习对齐方法（RLHF）大模型的研发已经成为一项系统工程扩展定律（ Scaling Law) ➢ 通过扩展参数规模、数据规模和计算算力，大语言模型的能力会出现显著提升 ➢ 扩展定律在本次大模型浪潮中起到了重要作用大语言模型采用了与小型预训练语言模型相似的神经网络结构，从而获得更可靠的答案涌现能力与扩展定律的关系 ➢ 涌现能力和扩展定律是两种描述规模效应的度量方法大模型核心技术 ➢ 规模扩展：扩展定律奠定了早期大模型的技术路线，产生了巨大的性能提升
46010编辑于 2025-03-15
来自专栏机器学习入门
【AI大模型】LLM主流开源大模型介绍
学习目标了解LLM主流开源大模型. 掌握ChatGLM、LLaMA、Bloom等基础大模型的原理 LLM主流大模型类别随着ChatGPT迅速火爆，引发了大模型的时代变革，国内外各大公司也快速跟进生成式AI市场，近百款大模型发布及应用目前，市面上已经开源了各种类型的大语言模型，本章节我们主要介绍其中的三大类： ChatGLM-6B：衍生的大模型（wenda、ChatSQL等） LLaMA：衍生的大模型（Alpaca、Vicuna BLOOM模型 BLOOM系列模型是由 Hugging Face公司的BigScience 团队训练的大语言模型。小结本小节主要介绍了LLM主流的开源大模型，对不同模型架构、训练目标、优缺点进行了分析和总结。
1.1K10编辑于 2024-09-24
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（十二）：Evaluate模型评估
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。本文重点介绍Evaluate模型评估。二、Evaluate模型评估 2.1 概述 Transformers库中的evaluate API主要用于评估模型在特定数据集上的性能。下面是一个使用Python和Transformers库进行模型评估的基本步骤，假设你已经有了一个预训练模型和相应的数据集处理器。评估结果将包含各种指标，如准确率，具体指标还要取决于你的模型。
99310编辑于 2024-08-13
来自专栏muller的测试分享
MetaLlama大模型
llama 大模型介绍我们介绍 LLaMA，这是一个基础语言模型的集合，参数范围从 7B 到 65B。我们在数万亿个Token上训练我们的模型，并表明可以专门使用公开可用的数据集来训练最先进的模型，而无需诉诸专有的和无法访问的数据集。特别是，LLaMA-13B 在大多数基准测试中都优于 GPT-3 (175B)，llama2 大模型介绍我们开发并发布了 Llama 2，这是一组经过预训练和微调的大型语言模型 (LLM)，其参数规模从我们经过微调的大语言模型（称为 Llama 2-Chat）针对对话用例进行了优化。 //huggingface.co/meta-llama/Llama-2-7bhttps://huggingface.co/docs/transformers/model_doc/llamallama 大语言模型提供的主要模型列表
41710编辑于 2024-09-02
来自专栏AI
大模型微调
# 大模型微调的主流方式、核心区别与底层原理微调（Fine-tuning）的核心底层共性：基于预训练模型的知识迁移，冻结预训练模型的大部分通用特征参数，仅针对具体任务优化少量参数/引入轻量模块/设计提示特征核心特点优点：任务适配性最强，能充分挖掘任务数据的特征，效果理论上最优；缺点：算力/数据需求极高（需千万级以上任务数据，大模型全量微调需上百张GPU）、易过拟合、模型存储成本高（一个任务一个模型）、核心特点：效果接近全量微调，是工业级大模型的主流选择，参数量仍控制在5%以内。特点：少样本适配（百/千级样本），效果优于硬提示，无推理延迟，适合超大规模大模型。；避免全量/部分微调：针对Transformer大模型的两段式端到端架构，全量/部分微调的算力成本极高，且多任务适配时模型存储成本不可接受。
18810编辑于 2026-02-09
来自专栏muller的测试分享
mixtral大模型
简介Mixtral 是一种具有开放权重的高质量稀疏专家混合模型 (SMoE)。根据 Apache 2.0 许可。它是最强大的开放权重模型，具有宽松的许可证，也是成本/性能权衡方面的最佳模型。特别是，它在大多数标准基准测试中匹配或优于 GPT3.5。Mixtral 的特点可以优雅地处理 32k 令牌的上下文。请为google编写web自动化测试用例，使用pytest page object设计模式，断言使用hamcrest') debug(r)总结Mixtral 是一种具有开放权重的高质量稀疏专家混合模型
21010编辑于 2024-10-16

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

大模型应用：大模型的词元化处理详解：BPE、WordPiece、Unigram.11

大模型与AI底层技术揭秘 (11) 变形记

11:大整数减法

通用大模型VS垂直大模型

【AI大模型】训练Al大模型

在Jetson上玩转大模型Day11：SAM2应用

IDC最新报告，7大维度11家大模型厂商比拼，唯一全优是谁？

AI大模型企业应用实战(11)-Document Loader文件加载器机制

开源大模型与闭源大模型

原创 | 大模型扫盲系列——初识大模型

大模型与大模型的幻觉问题

【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig

山海大模型发布：11年的积累，云知声如何翻越“山海”

C++11内存模型

大语言模型-1.2-大模型技术基础

【AI大模型】LLM主流开源大模型介绍

【AI大模型】Transformers大模型库（十二）：Evaluate模型评估

MetaLlama大模型

大模型微调

mixtral大模型

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐