搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏韩曙亮的移动开发专栏
【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型在线离线使用 )
首先 , 安装 Ollama 软件 , 到 https://ollama.com/ 下载安装 ; 然后 , 运行 ollama run llama3 命令 , 即可开始使用 Llama3 大模型 ; 一、Meta Llama 3 大模型安装 1、Llama 3 大模型简介 Llama 3 大模型是 Meta 公司发布的大模型 , Meta 公司就是 Facebook ; Llama 3 大模型 Llama3 大模型 ; 下载的模型放在了 C:\Users\用户名.ollama 目录中 , 在我的电脑上的路径是 C:\Users\octop.ollama ; 这个模型很大 , 有 4.7 G 安装完成后的效果 for help) 二、Meta Llama 3 大模型使用 1、Llama 3 大模型在线使用在命令行中 , 可以直接进行对话 , 下面是对话内容 : D:\Llama>ollama run llama3 for help) 2、Llama 3 大模型离线使用 Llama 3 大模型联网时 , 可以访问云端服务 , 可以生成更加丰富的文本 ; Llama 3 大模型在断网后也可以使用 , 下面是断开网络后
1.7K12编辑于 2024-08-09
来自专栏小洁叫你mysql
【AI大模型】训练Al大模型
大模型超越AI 目前所指的大模型，是“大规模深度学习模型”的简称，指具有大量参数和复杂结构的机器学习模型，可以处理大规模的数据和复杂的问题，多应用于自然语言处理、计算机视觉、语音识别等领域。本文将探讨大模型的概念、训练技术和应用领域，以及与大模型相关的挑战和未来发展方向。大模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数，而大模型则可能拥有数亿或数十亿个参数。训练大模型的挑战训练大模型需要应对一系列挑战，包括：以下是与大模型相关的一些代码示例：计算资源需求： import tensorflow as tf # 指定使用GPU进行训练 with tf.device 更智能的模型压缩技术：模型压缩和加速技术将继续发展，以减小大模型的计算和存储开销。更好的计算平台支持：为了支持训练和部署大模型，计算平台将继续改进，提供更强大的计算资源和工具。
1.5K30编辑于 2023-10-10
来自专栏量子位
AI的大模型时代 ≠ 只有大模型的AI时代
从这个规律来看，大语言模型（简称LLM）出现后虽然霸占了所有与AI相关的关键词，吸引了所有人的注意力，但这并不代表“LLM之前无AI”。所以，AI不是只有大模型。AI的大模型时代也 ≠ 只有大模型的AI时代。成熟的AI，早就已经上岗了或许你还不敢相信，现在哪怕小小的快递背后，都已经有AI技术在加持了。然而，这些仅仅是已经成熟上岗的AI技术在英特尔®️ 平台得到的优化，英特尔的能力还远不止如此。这就要说回大模型了。因此，英特尔就祭出了一款增强型的“减（量）重（化）神（工）器（具）”，可以让一个十亿参数的大语言模型瘦身3/4，增强其准确性，还能有效地提升大模型在英特尔®️ 平台上的推理性能。更多《英特尔平台上的行业AI实战与大模型优化》相关内容，可扫描下方海报中的二维码获取。点击原文链接，阅读英特尔《最“in”大模型》专栏的所有文章。 — 完 —
65010编辑于 2023-09-27
来自专栏司钰秘籍
AI大模型学习
在当前技术环境下，AI大模型学习不仅要求研究者具备深厚的数学基础和编程能力，还需要对特定领域的业务场景有深入的了解。通过不断优化模型结构和算法，AI大模型学习能够不断提升模型的准确性和效率，为人类生活和工作带来更多便利。 AI大模型学习的理论基础数学基础：线性代数：AI 大模型中大量使用向量和矩阵运算，如矩阵乘法、向量点积等，用于表示和操作数据。 AI大模型在特定领域的应用在自然语言处理领域，AI 大模型如 GPT-3 被广泛应用于文本生成、机器翻译、问答系统等。此外，模型的性能也受到计算资源、数据质量和算法优化等因素的影响 AI大模型学习的伦理与社会影响 AI 大模型学习确实带来了一些伦理和社会问题，我们需要认真对待： 1.
65710编辑于 2024-04-04
来自专栏人工智能领域
AI大模型学习
AI大模型学习在当前技术环境下，AI大模型学习不仅要求研究者具备深厚的数学基础和编程能力，还需要对特定领域的业务场景有深入的了解。方向一：AI大模型学习的理论基础 AI 大模型学习的理论基础涉及深度学习、神经网络、优化算法等多个方面。 ———————————————— 方向二：AI大模型的训练与优化 AI 大模型学习的理论基础涉及深度学习、神经网络、优化算法等多个方面。 ———————————————— 方向三：AI大模型在特定领域的应用 AI大模型的训练与优化是深度学习领域中至关重要的一部分。 ———————————————— 方向四：AI大模型学习的伦理与社会影响 AI大模型学习的伦理与社会影响是一个备受关注的话题，以下是一些关于这个方向的重要内容：数据隐私：AI大模型需要大量的数据来训练
64110编辑于 2024-12-18
零基础学AI大模型之读懂AI大模型
大模型知识，因此希望可以通过自己学习然后以写文章的形式向大家同样想零基础学习大模型的同学进行互相交流，欢迎大家在评论区打出自己的疑问或者本文不正确的地方，我们一起学习零基础学AI大模型之读懂AI大模型甚至企业里说的“开发大模型”，真的是从头造一个“大脑”吗？今天就用通俗的语言，把AI大模型的核心逻辑、能力边界和落地场景讲透，最后再给大家一份主流模型的选择指南。一、什么是AI大模型？这时候，AI智能体（Agent）才是大模型的“落地形态”。企业真正要开发的是AI智能体：大模型的“升级版” 所谓“AI智能体（Agent）”，是给大模型加上“手脚”“记忆”和“规划能力”，让它从“聊天工具”变成“能干活的助手”。：AI大模型的核心不是“越复杂越好”，而是“越实用越好” 看完这些，你会发现：AI大模型的本质是“用海量规律解决问题”，而它的落地关键是“智能体”——把“语言能力”变成“执行能力”。
1.2K20编辑于 2025-12-22
来自专栏机器学习入门
【AI大模型】LLM主流开源大模型介绍
学习目标了解LLM主流开源大模型. 掌握ChatGLM、LLaMA、Bloom等基础大模型的原理 LLM主流大模型类别随着ChatGPT迅速火爆，引发了大模型的时代变革，国内外各大公司也快速跟进生成式AI市场，近百款大模型发布及应用目前，市面上已经开源了各种类型的大语言模型，本章节我们主要介绍其中的三大类： ChatGLM-6B：衍生的大模型（wenda、ChatSQL等） LLaMA：衍生的大模型（Alpaca、Vicuna 闻达：大型语言模型调用平台，基于 ChatGLM-6B 实现了类 ChatPDF 功能 LLaMA模型 LLaMA（Large Language Model Meta AI），由 Meta AI 于2023 BLOOM模型 BLOOM系列模型是由 Hugging Face公司的BigScience 团队训练的大语言模型。
1.2K10编辑于 2024-09-24
来自专栏算法一只狗
Grok3大模型是「地表最强」的AI吗？
首先看看具体的跑分情况，整体的Grok3模型在数学领域AIME、科学领域GPQA和代码测试上，都超越了其他模型。编程 (Coding LCB Oct-Feb)领域上： Grok-3（57分）明显领先其他大模型其他模型得分在 34-41 之间，相比数学和科学测试，差距较小。而且，从整体的Grok 3跑出的模型整体分数来看，是首个超过 1400 分的模型啊！果然，马斯克吹过的牛都会实现，自家的Grok3在这个分数榜单上确实是史上最强模型。在发布会上还有一张图展示了目前Grok3发展的速度。乍一看你会觉得Grok系列大模型的发展有点过快，好像从23年到现在一下子就追上了GPT-4o模型了。走的还是大力出奇迹的大模型训练路子。而对比起GPT-4o和DeepSeek-V3用的GPU数量，Grok3的训练简直是土豪级别的用法的。
41010编辑于 2025-03-18
零基础学AI大模型之AI大模型常见概念
零基础学AI大模型之SpringAI 前情摘要： 1、零基础学AI大模型之读懂AI大模型 2、零基础学AI大模型之从0到1调用大模型API 3、零基础学AI大模型之SpringAI 零基础学AI 大模型之AI大模型常见概念一、先搞懂：什么是AI大模型？ AI大模型（AI Models）本质是具备大规模参数、能模拟人类认知功能的信息处理算法——它不仅能“读懂”输入（比如文本、语音、图像），还能“生成”符合需求的输出（比如对话、图片、代码），核心优势是“泛化能力强二、AI大模型的6个核心概念如果把AI大模型比作“智能大脑”，下面这些概念就是它的“神经中枢”——决定了它“怎么思考”“怎么干活”“怎么不犯错”。 1. 令牌（Tokens）：大模型的“语言最小单位” 你可能听过“ChatGPT3只能处理4K内容”，这里的“4K”指的就是令牌（Tokens）——大模型处理语言的基本单位，相当于人类说话的“词语片段”。
45210编辑于 2025-12-22
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。 LoRA是一种用于微调大型语言模型的轻量级方法，它通过添加低秩矩阵到预训练模型的权重上来实现适应性调整，从而在不显著增加模型大小的情况下提升特定任务的性能。 task_type: 指定任务类型，如'CAUSAL_LM'，以确保LoRA适应正确应用到模型的相应部分。 get_peft_model(model, config) print_trainable_parameters(model) 三、总结本文简要介绍LoraConfig的配置参数情况，具体的机遇peft对大模型进行微调后面单独开一页详细讲解
95110编辑于 2024-08-13
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（二）：AutoModelForCausalLM
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。 2.2 主要功能这个类是基于`AutoModel`的，它能够根据指定的模型名称或路径自动加载相应的模型架构。这里使用了Auto自动模型，transformers包括管道pipeline、自动模型auto以及具体模型三种模型实例化方法，如果同时有配套的分词工具（Tokenizer），需要使用同名调度。管道(Pipline)方式：高度集成的使用方式，几行代码就可以实现一个NLP任务自动模型(AutoModel)方式:自动载入并使用BERT等模型具体模型方式：在使用时需要明确具体的模型，并按照特定参数进行调试同时，列举了管道模型、自动模型、具体模型等三种transformers预训练大模型实例化方法。期待大家三连。
2.9K11编辑于 2024-08-13
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（四）：AutoTokenizer
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。这意味着，当你知道模型的名称时，你可以使用AutoTokenizer自动获取与该模型匹配的分词器，而不需要了解分词器的具体实现细节。 2.2 主要特点模型兼容性：通过模型名称自动匹配合适的分词器，支持BERT、RoBERTa、Albert、DistilBERT、T5等众多模型。灵活性：对于新发布的模型，只要其分词器在Hugging Face模型库中可用，AutoTokenizer.from_pretrained就能加载。这意味着，当知道模型的名称时，可以使用AutoTokenizer自动获取与该模型匹配的分词器。
1.8K10编辑于 2024-08-13
来自专栏muller的测试分享
智谱 AI 大模型
简介智谱是清华大学技术成果转化公司中英双语千亿级大模型 GLM-130B对话模型 ChatGLM开源模型 ChatGLM-6BAI 提效助手智谱清言高效率代码模型 CodeGeeX多模态理解模型 CogVLM 文生图模型 CogView文生视频模型 CogVideo文生视频大模型开放平台大模型体验中心编程调用# pip install zhipuai 请先在终端进行安装from zhipuai import temperature= 0.95, max_tokens=1024, stream=True)for trunk in response: print(trunk)总结国内开源大模型的领先者，大模型领域的经典成功商业案例
53510编辑于 2024-10-28
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（一）：Tokenizer
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。 Transformers 提供了数以千计的预训练模型，支持 100 多种语言的文本分类、信息抽取、问答、摘要、翻译、文本生成。它的宗旨是让最先进的 NLP 技术人人易用。 Transformers 提供了便于快速下载和使用的API，让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。本文重点介绍Tokenizer类。 3. **编码**：将tokens转换为数字ID，这些ID是模型的输入。每个token在词汇表中有一个唯一的ID。 4.
1.7K12编辑于 2024-08-13
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（十二）：Evaluate模型评估
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。本文重点介绍Evaluate模型评估。二、Evaluate模型评估 2.1 概述 Transformers库中的evaluate API主要用于评估模型在特定数据集上的性能。下面是一个使用Python和Transformers库进行模型评估的基本步骤，假设你已经有了一个预训练模型和相应的数据集处理器。 AutoModelForSequenceClassification.from_pretrained(model_name) tokenizer = AutoTokenizer.from_pretrained(model_name) 2.2.3 步骤3:
1K10编辑于 2024-08-13
来自专栏开源项目搭建
简单3步部署本地国产大模型DeepSeek大模型
简单3步部署本地国产大模型DeepSeek大模型DeepSeek是最近非常火的开源大模型，国产大模型 DeepSeek 凭借其优异的性能和对硬件资源的友好性，受到了众多开发者的关注。本文将介绍如何通过简单 3 步在本地部署 DeepSeek 大模型，让你能够轻松体验这一强大的 AI 工具。引发伦理监管讨论：国际社会对AI伦理问题关注度提升，数据安全、隐私保护和内容监管等问题成为焦点，促使各国制定更严格的AI大模型监管政策。 deepseek-r1的哪个版本的大模型？它支持各种LLM，包括Llama 3、Mistral和Gemma。提供了类似OpenAI的API接口和聊天界面,可以非常方便地部署最新版本的GPT模型并通过接口使用。
6.3K33编辑于 2025-02-06
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（十三）：Datasets库
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。 Transformers 提供了数以千计的预训练模型，支持 100 多种语言的文本分类、信息抽取、问答、摘要、翻译、文本生成。它的宗旨是让最先进的 NLP 技术人人易用。 Transformers 提供了便于快速下载和使用的API，让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。 2.2.3 步骤3: 查看数据集查看数据集的结构和前几条数据： print(dataset['train'][:5]) 2.2.4 步骤4: 数据预处理通常需要对数据进行预处理，比如使用Transformers
72710编辑于 2024-08-13
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（十五）：timm库
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。 Transformers 提供了便于快速下载和使用的API，让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。本文重点介绍Hugging Face的timm库用法二、timm库 2.1 概述 Hugging Face的timm库是一个用于计算机视觉的模型库，它提供了大量预训练的图像识别模型，以高效、易用为特点 timm库提供了很多模型，例如EfficientNet，ResNet等，这里以EfficientNet为例。
1.5K11编辑于 2024-08-13
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（十四）：Datasets Viewer
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。 Transformers 提供了数以千计的预训练模型，支持 100 多种语言的文本分类、信息抽取、问答、摘要、翻译、文本生成。它的宗旨是让最先进的 NLP 技术人人易用。 Transformers 提供了便于快速下载和使用的API，让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。
43910编辑于 2024-08-13
来自专栏机器学习入门
【AI大模型】ChatGPT模型原理介绍（下）
下图为不同模型之间训练参数的对比: 1.1 GPT-3模型架构实际上GPT-3 不是一个单一的模型, 而是一个模型系列. 系列中的每个模型都有不同数量的可训练参数. 需要一个相关任务大的数据集, 而且需要对其进行标注当一个样本没有出现在数据分布的时候, 泛化性不见得比小模型要好下图显示了 GPT-3 三种情景学习方法: zero-shot learning 原始的 GPT-3 就是非一致模型, 类似GPT-3 的大型语言模型都是基于来自互联网的大量文本数据进行训练, 能够生成类似人类的文本, 但它们可能并不总是产生符合人类期望的输出. Environment（环境）: 整个游戏的大背景就是环境；超级玛丽中Agent、地面、柱子组成了整个环境. 如何让AI实现自动打游戏？第一步: 通过强化学习（机器学习方法）学出Policy函数, 该步骤目的是用Policy函数来控制Agent.
64210编辑于 2024-09-18

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型在线离线使用 )

【AI大模型】训练Al大模型

AI的大模型时代 ≠ 只有大模型的AI时代

AI大模型学习

AI大模型学习

零基础学AI大模型之读懂AI大模型

【AI大模型】LLM主流开源大模型介绍

Grok3大模型是「地表最强」的AI吗？

零基础学AI大模型之AI大模型常见概念

【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig

【AI大模型】Transformers大模型库（二）：AutoModelForCausalLM

【AI大模型】Transformers大模型库（四）：AutoTokenizer

智谱 AI 大模型

【AI大模型】Transformers大模型库（一）：Tokenizer

【AI大模型】Transformers大模型库（十二）：Evaluate模型评估

简单3步部署本地国产大模型DeepSeek大模型

【AI大模型】Transformers大模型库（十三）：Datasets库

【AI大模型】Transformers大模型库（十五）：timm库

【AI大模型】Transformers大模型库（十四）：Datasets Viewer

【AI大模型】ChatGPT模型原理介绍（下）

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型 在线 离线 使用 )

【AI大模型】训练Al大模型

AI的大模型时代 ≠ 只有大模型的AI时代

AI大模型学习

AI大模型学习

零基础学AI大模型之读懂AI大模型

【AI大模型】LLM主流开源大模型介绍

Grok3大模型是「地表最强」的AI吗？

零基础学AI大模型之AI大模型常见概念

【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig

【AI大模型】Transformers大模型库（二）：AutoModelForCausalLM

【AI大模型】Transformers大模型库（四）：AutoTokenizer

智谱 AI 大模型

【AI大模型】Transformers大模型库（一）：Tokenizer

【AI大模型】Transformers大模型库（十二）：Evaluate模型评估

简单3步部署本地国产大模型DeepSeek大模型

【AI大模型】Transformers大模型库（十三）：Datasets库

【AI大模型】Transformers大模型库（十五）：timm库

【AI大模型】Transformers大模型库（十四）：Datasets Viewer

【AI大模型】ChatGPT模型原理介绍（下）

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型在线离线使用 )