搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏韩曙亮的移动开发专栏
【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型在线离线使用 )
首先 , 安装 Ollama 软件 , 到 https://ollama.com/ 下载安装 ; 然后 , 运行 ollama run llama3 命令 , 即可开始使用 Llama3 大模型 ; 一、Meta Llama 3 大模型安装 1、Llama 3 大模型简介 Llama 3 大模型是 Meta 公司发布的大模型 , Meta 公司就是 Facebook ; Llama 3 大模型 Llama3 大模型 ; 下载的模型放在了 C:\Users\用户名.ollama 目录中 , 在我的电脑上的路径是 C:\Users\octop.ollama ; 这个模型很大 , 有 4.7 G 安装完成后的效果 for help) 二、Meta Llama 3 大模型使用 1、Llama 3 大模型在线使用在命令行中 , 可以直接进行对话 , 下面是对话内容 : D:\Llama>ollama run llama3 for help) 2、Llama 3 大模型离线使用 Llama 3 大模型联网时 , 可以访问云端服务 , 可以生成更加丰富的文本 ; Llama 3 大模型在断网后也可以使用 , 下面是断开网络后
1.9K12编辑于 2024-08-09
来自专栏开源项目搭建
简单3步部署本地国产大模型DeepSeek大模型
简单3步部署本地国产大模型DeepSeek大模型DeepSeek是最近非常火的开源大模型，国产大模型 DeepSeek 凭借其优异的性能和对硬件资源的友好性，受到了众多开发者的关注。本文将介绍如何通过简单 3 步在本地部署 DeepSeek 大模型，让你能够轻松体验这一强大的 AI 工具。 deepseek-r1的哪个版本的大模型？它支持各种LLM，包括Llama 3、Mistral和Gemma。提供了类似OpenAI的API接口和聊天界面,可以非常方便地部署最新版本的GPT模型并通过接口使用。理论上就安装完成了，可以只在命令行中使用大模型了。修改路径文件保存路径可以不用改，如果C盘空间不够用，建议修改。
6.8K33编辑于 2025-02-06
来自专栏Soul Joy Hub
【大模型AIGC系列课程 3-2】国产开源大模型：ChatGLM
GLM https://arxiv.org/pdf/2103.10360.pdf GLM是General Language Model的缩写，是一种通用的语言模型预训练框架。这个图示说明了GLM预训练的过程，具体解释如下： a) 原始文本：给定一个原始文本，例如[x1, x2, x3, x4, x5, x6]。在这个例子中，我们随机选择了两个连续的词片段[x3]和[x5, x6]作为样本。 b) 替换和洗牌：在Part A中，我们将被选择的词片段替换为[M]（表示遮盖）。在这个例子中，我们将[x3]和[x5, x6]洗牌为[x5, x6]和[x3]。 c) 自回归生成：GLM使用自回归的方式生成Part B。在生成过程中，模型可以根据之前生成的词片段和Part A中的上下文来预测下一个词片段。 d) 自注意力掩码：为了限制模型的注意力范围，
88420编辑于 2023-08-28
来自专栏openclaw系列
OpenClaw怎么换大模型？3步免费切换各种大模型配置教程
一句话总结：OpenClaw 本身不内置任何大模型，而是通过灵活的配置机制对接各类模型服务。更换模型只需三步：选择目标模型获取 API Key、在配置文件中添加模型提供商、重启网关生效。但很多人忽略了一个关键问题：OpenClaw 本身不包含任何 AI 模型。就像一台性能再强的电脑，没有操作系统也无法工作。OpenClaw 的“大脑”完全来自你接入的大模型。第一章：核心原理——OpenClaw 如何对接大模型？1.1 为什么需要更换模型？OpenClaw 的核心价值在于“连接”——连接大模型的思考能力与电脑的真实操作权限。 2.1 腾讯元宝模型配置（推荐中文场景）腾讯元宝基于混元大模型，提供强大的中文理解和多模态能力，2026 年推出免费额度方案，大幅降低使用门槛。 Q3：本地模型响应太慢怎么办？
24.6K54编辑于 2026-03-28
来自专栏大模型成长之路
【大模型学习 | DeepSeek-V3原理】
DeepSeek-V3 Technical Report DeepSeek-V3 的基本框架还是 Transformer。另外，V3 模型是通过将预测多token作为训练目标。本文主要是对DeepSeek-V3的模型框架以及训练目标进行讨论。什么是负载平衡？ 2️⃣ DeepSeekMoE 在Transformer架构中的FFN层，V3模型采用了MoE进行替换，使用更细粒度的专家，并将一些专家隔离为共享专家。 ✅ Yes ✅ 无偏置目前的模型权重已开源： https://huggingface.co/deepseek-ai/DeepSeek-V3-Base 者由于设备限制无法对 V3模型进行体验。
1.6K21编辑于 2025-07-25
3SemanticKernel使用非ChatGPT大模型
SK 目前提供了多个AI 提供商的Connector，但仅OpenAI 和Azure OpenAI 两种Connector（连接器）属于正式可用状态，国内开发者而言并不能访问国外大模型，因此如何使用国内大模型好在，SK 在设计时也考虑了这个问题，接下来就来以智谱AI大模型为例来解密答案。使用代理，诸如OneApi 自行实现 Connectors 注册智谱大模型北京智谱华章科技有限公司（简称“智谱AI”）致力于打造新一代认知智能大模型，专注于做大模型的中国创新。打造了AIGC模型及产品矩阵，包括通用大模型、超拟人大模型、图像大模型、向量大模型等，并且支持使用您的私有数据对模型进行微调。 ; response.Display(); 使用OneApi 对接流行大模型 OneApi 是一个GitHub 开源项目，帮助开发者通过标准的 OpenAI API 格式访问所有的大模型。
9210编辑于 2026-06-17
来自专栏AI工程落地
大语言模型--Llama3新特性
更大的词表使得模型涵盖的语言更多、更加通用 Attention层--MultiHeadAttention算子 Llama3 8B和70B都使用了分组查询注意力机制(GQA)，4个Query共享一对Key 减少了计算量，同时保持了模型的性能。值是500000.0（Llama2用的是默认值10000.0）上下文窗口中的最大Tokens从 4096增加到 8192 数据类型 Llama2开源的参数是float16格式的，但Llama3开源的参数都是依赖软件包 transformers包升级到4.40.0以上模型版本 2024年4月21号初版 Llama3 8B的HellaSwag分数：acc 0.6039、acc_norm 0.776 2024年5月14号第二版 Llama3 8B的HellaSwag分数：acc_norm 0.822
39610编辑于 2024-05-29
来自专栏啄木鸟软件测试
多模态大模型技术原理与实战(3)
在阿里巴巴达摩院发布的《2023 土大科技趋势》中，实现文本-图像-语音-视频“大统一”的多模态预训练大模型占据榜首。 ·CLIP模型：CLIP模型是OpenAI在2021 年推出的文本-图像多模态预训练大模型。证明了“多模态预训练大模型零样本推理”这种模式的可行性。 o解决图像多模态问题有3种传统的思路，分别是使用单编码器模型、双编码器模型、编码器-解码器模型。 ·单编码器模型指的是整个架构中只存在一个图像编码器的模型。大模型+多模态的3种实现方法 1，以LLM 为核心，调用其他多模态组件 2023年5月，微软亚洲研究院(MSRA)联合浙江大学发布了HuggingGPT。 3.视觉问答任务视觉问答任务指的是根据图像或视频中描述的内容进行回答、体现了多楼态大模型的自然语言理解和推理能力。这个城市拥有哪些著名大学？上海是中国著名的现代化城市，拥有多所知名大学。
1.3K20编辑于 2024-09-10
来自专栏贾志刚-OpenCV学堂
DINOv3视觉基础大模型正式发布！
Meta 宣布发布 DINOv3，这是一个前沿的自监督视觉基础模型，在广泛的计算机视觉任务中实现了前所未有的性能。随着 DINOv3 的发布，我们在密集任务上显著超过了弱监督模型，通过最佳类别的 WSL 模型的相对性能来展示（b）。我们还使用在自然图像（c）和航拍图像（d）上训练的 DINOv3 生成了特征的 PCA 图。 DINOv3 通过采用全面的模型套件来扩展自监督学习的应用范围，以满足不同的用例需求。 DINOv3模型家族通过 DINOv3，我们显著改善了密集特征图的退化问题，这要归功于 Gram anchoring。随着 SSL 导致的训练模型规模扩大，结果是显着的性能提升。在这项工作中，我们成功地训练了一个包含 70 亿参数的 DINO 模型。由于如此大的模型需要大量的资源来运行，我们应用蒸馏技术将其知识压缩成更小的变体。
84210编辑于 2026-04-02
来自专栏自然语言处理(NLP)论文速递
港大 | 发布 “点云” 大模型：PointLLM，旨在实现大模型在3D对象上的应用！
这些模型已成为多功能工具，可以充当通用接口来执行一系列复杂任务。然而，在文本任务上的应用只是大语言模型（LLMs）应用众多应用场景中的一个。提出了PointLLM，其模型效果如下图所示：如上图：PointLLM是一种能够理解物体的彩色点云的多模态大语言模型。它能够感知对象类型、几何结构和外观，而无需考虑模糊的深度、遮挡或视点依赖性。然而，构建能够理解物体点云的多模态大模型，存在三个特别关键的问题：1)缺乏模型训练数据；2)构建合适的模型架构；3)缺乏全面的评估标准和方法。模型架构如下图所示：对于PointLLM模型训练采用两阶段策略：点云编码器和大语言模型之间的潜在空间进行初始对齐，然后对统一模型进行指令调整。这种方法确保了3D点云的几何和外观信息与语言模型的语言功能的有效融合。「最后，基准和评估」作者建立了两个不同的基准：生成3D对象分类和3D对象描述，并配有多样化的评估框架，以评估模型对点云的理解。
3.3K20编辑于 2023-09-14
来自专栏创作是最好的自我投资
通用大模型VS垂直大模型
在人工智能这个充满无限可能的领域内，通用大模型和垂直大模型各有千秋。就我个人而言，在二者之间的选择上，并不存在偏向某一方的倾向。我觉得应当依据实际应用场景的具体需求，来挑选最为契合的大模型。通用大模型通用大模型，乃是旨在应对多种任务与数据类型的庞然大物级人工智能模型。在知识覆盖的广度方面，通用大模型无疑具有明显的优势。当我们对于当下所需模型所涉及的精确专业领域的界限感到模糊不清时，选择通用大模型无疑是一种明智之举。垂直大模型接下来谈谈垂直大模型。然而，由于垂直大模型的训练内容聚焦于当前行业，其涉猎的范围更集中，数据针对性更强，所以在提供专业咨询时往往更加精准、细致，这也正是垂直大模型的独特价值所在。因此，对于通用大模型或者垂直大模型，更倾向于哪一方不取决于个人想法，而是取决于用户需要。
87501编辑于 2024-12-30
来自专栏小洁叫你mysql
【AI大模型】训练Al大模型
大模型超越AI 目前所指的大模型，是“大规模深度学习模型”的简称，指具有大量参数和复杂结构的机器学习模型，可以处理大规模的数据和复杂的问题，多应用于自然语言处理、计算机视觉、语音识别等领域。本文将探讨大模型的概念、训练技术和应用领域，以及与大模型相关的挑战和未来发展方向。大模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数，而大模型则可能拥有数亿或数十亿个参数。训练大模型的挑战训练大模型需要应对一系列挑战，包括：以下是与大模型相关的一些代码示例：计算资源需求： import tensorflow as tf # 指定使用GPU进行训练 with tf.device 更智能的模型压缩技术：模型压缩和加速技术将继续发展，以减小大模型的计算和存储开销。更好的计算平台支持：为了支持训练和部署大模型，计算平台将继续改进，提供更强大的计算资源和工具。
1.7K30编辑于 2023-10-10
来自专栏接地气学堂
3大基础模型，搞掂互联网产品分析
今天就系统地讲解一下，互联网产品有哪些类型，以及每一类的基础分析模型。 01 互联网产品3大类型互联网产品有很多分类方式，但站在：“产品是干什么的”角度，就只有3大类：交易型产品：以促成一笔商品/服务交易为目标。内容型产品：以提供视频/文字内容给用户看为目标。 03 3大基本分析模型了解了产品分类与产品主指标，可以更进一步看基本分析模型。第一类：交易型产品漏斗模型。交易型产品目标就是提升交易，只是不同的路径促成交易效率不一样，因此漏斗模型是非常适合的（如下图）： ? 如果是站外直接引流，则是纯粹的漏斗模型，考察每个漏斗转化率即可。第二类：内容型产品的分群模型。内容型产品理论上也能用类似的漏斗模型，观察用户是否愿意完成一次内容浏览，以及内容浏览后是否有转发、点赞、买货等行为（如下图）。 ?
68220发布于 2021-07-23
国产大模型选型指南：避开这3个坑
国产大模型选型指南：避开这3个坑这篇文章写给正在做AI应用落地、面临国产大模型选型困惑的你。我见过太多团队，花了几周时间测试各种模型，最后发现成本超预算、效果不匹配，甚至被API计费坑了。但现在，国产大模型生态已经爆发了——通义千问API、文心一言API、豆包大模型API、讯飞星火API，还有DeepSeek-V3、Qwen-Max等，每个模型都有自己的强项和短板。比如，文心一言API在中文长文本上很强，但代码生成不如DeepSeek-V3；Gemini 2.5 Pro处理多模态不错，但价格高。使用大模型路由工具，你可以根据任务类型自动切换模型。我遇到过一个客户，他们在智能写作API场景下，用了某国产大模型，月消耗超过10万token，但后来切换到DeepSeek-V3，成本降了一半。还有个小技巧：利用模型网关来缓存重复查询。总结：选国产大模型的三个原则 1. 按场景匹配，别跟风。通义千问API适合中文长文本，DeepSeek-V3适合代码，豆包大模型适合多模态。2. 先测试再付费。
9800编辑于 2026-07-04
来自专栏AI
最强开源大模型Llama 3发布！
最强开源大模型Llama 3发布！我们看下重点：今天，我们介绍Meta Llama 3，这是我们最先进的开源大型语言模型的下一代。我们对Llama 3的目标通过Llama 3，我们致力于构建与当今最优秀的专有模型相媲美的最佳开源模型。今天发布的基于文本的模型是Llama 3模型系列的首批模型。我们未来的目标是使Llama 3具备多语言和多模态能力，具有更长的上下文，并持续提升核心LLM功能，如推理和编码的整体性能。我们的训练数据集比Llama 2使用的大七倍，其中包含四倍的代码。为了准备即将到来的多语言用例，超过5%的Llama 3预训练数据集包含覆盖30多种语言的高质量非英语数据。 Llama 3的8B和70B模型标志着我们计划为Llama 3发布的开始。而且还有更多的内容即将推出。我们最大的模型超过了400B参数，虽然这些模型仍在训练中，但我们的团队对它们的发展趋势感到兴奋。
1.3K10编辑于 2024-04-25
来自专栏腾讯开源的专栏
腾讯混元宣布大语言模型和3D模型正式开源！
腾讯混元大模型正在加快开源步伐‍ 11月5日，腾讯混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”正式开源，支持企业及开发者精调、部署等不同场景的使用需求其中，腾讯混元Large是目前开源领域参数规模最大、效果最好的MoE模型，而腾讯混元3D生成大模型则是业界首个同时支持文字、图像生成3D的开源大模型。业界首个同时支持文字、图像生成3D的开源大模型腾讯混元3D生成大模型首批开源模型包含轻量版和标准版，轻量版仅需10s即可生成高质量3D资产，目前已在技术社区公开发布，包含模型权重、推理代码、模型算法等完整模型该模型具有强大泛化能力和可控性，可重建各类尺度物体，大到建筑，小到工具花草。经过定性、定量多个维度的评估，腾讯混元3D生成大模型的生成质量已达到开源模型的先进水平。其中，腾讯地图基于腾讯混元3D大模型，发布了自定义3D导航车标功能，支持用户创作个性化的 3D 导航车标，相比传统的3D车标重建方案，速度提升了91%。
2K20编辑于 2025-02-05
来自专栏学习
开源大模型与闭源大模型
3.教育和学习资源：开源模型为学生和研究人员提供了宝贵的学习资源。他们可以通过实践来理解模型的内部工作原理，进行实验和探索，从而推动教育和研究的发展。二、闭源大模型闭源大模型是指模型的代码和数据不对外公开，通常由商业公司开发和维护。代表性的闭源大模型包括OpenAI的GPT-3和Google的BERT。 3.成本和准入门槛：闭源模型通常通过付费API提供服务，对于个人开发者和小型企业来说，成本可能较高。闭源大模型则主要依靠公司内部的研发团队进行创新，虽然可能速度较慢，但通常更具商业应用的针对性和稳定性。例如，OpenAI的GPT-3通过付费API提供强大的商业服务。 3.资源共享与独占优势：开源大模型在资源共享方面表现突出，任何人都可以利用这些开源资源进行学习和研究，促进技术的普及和应用。
2K10编辑于 2024-10-09
来自专栏IT从业者张某某
大模型与大模型的幻觉问题
参考大模型中的涌现 OpenAI 科学家：幻觉是大模型与生俱来的特性，而非缺陷大模型「幻觉」，看这一篇就够了｜哈工大华为出品大模型什么是大模型大语言模型（LLM）是基于海量文本数据训练的深度学习模型大模型的模型发展如下图涌现参考：大模型中的涌现什么是涌现？先从蚂蚁开始说起。蚂蚁是自然界中一种个体非常简单，但是群体能力非常强大的生物。如何解决大模型的「幻觉」问题？方向一：什么是大模型「幻觉」大模型出现幻觉，简而言之就是“胡说八道”。用文中的话来讲，是指模型生成的内容与现实世界事实或用户输入不一致的现象。 OpenAI 科学家 Andrej Karpathy关于大模型幻觉在 Karpathy 看来：从某种意义上说，大语言模型的全部工作恰恰就是制造幻觉，大模型就是「造梦机」。只有大模型助手存在幻觉问题。方向二：造成大模型「幻觉」的原因那么致使大模型产生幻觉的原因都有哪些？
2K11编辑于 2024-01-04
来自专栏数据派THU
原创 | 大模型扫盲系列——初识大模型
为了提高模型的性能，研究者们不断尝试增加模型的参数数量，从而诞生了大模型这一概念。本文讨论的大模型将以平时指向比较多的大语言模型为例来进行相关介绍。 3）Decoder-Only，仅包含解码器部分，通常用于序列生成任务，如文本生成、机器翻译等。这类结构的模型适用于需要生成序列的任务，可以从输入的编码中生成相应的序列。 3、对齐微调（Alignment Tuning）主要目标在于将语言模型与人类的偏好、价值观进行对齐，其中最重要的技术就是使用RLHF（reinforcement learning from human Step 3.利用强化学习模型微调主要使用了强化学习的邻近策略优化（PPO，proximal policy optimization ）算法，对于每个时间步，PPO算法会计算当前产生和初始化的KL散度 3.无法保障内容可信：大模型会编造词句，无法保障内容真实可信、有据可查。当前使用者只能根据自己需求去验证生成的内容是否真实可信，很难具有权威说服力。
21.4K29编辑于 2023-11-22
别再“为了大模型而大模型”了
最近这两年，在很多公司里，大模型成了一种奇妙的存在。它不像一个技术工具，更像是一只突然闯进会议室的大象。领导一拍桌子： “我们也要上大模型！” 业务同事一听： “我们这个流程能不能加个大模型？” 但现在有些项目会直接说： “让大模型来判断吧。” 乍一听很高级，仔细一想很浪费。大模型当然能判断，但它不一定最适合判断。大模型天然消耗昂贵的GPU和电力，成本更高；大模型的参数量巨大，运算速度更慢；大模型基于语言的概率给出答案，结果不稳定，大模型内核原理对业务就是一个黑盒，无法说明，解释更困难；出了错还不好定位，你只能靠经验去猜不需要梳理业务流程了，大模型会自己理解；不需要总结专家经验了，大模型会自己推理；不需要定义评价标准了，大模型会自己判断；不需要建设知识库了，大模型会自己知道。七、别把大模型当神仙，要把它当同事我一直觉得，企业用大模型最健康的心态，不是“请神”，而是“招人”。
18611编辑于 2026-06-01

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型在线离线使用 )

简单3步部署本地国产大模型DeepSeek大模型

【大模型AIGC系列课程 3-2】国产开源大模型：ChatGLM

OpenClaw怎么换大模型？3步免费切换各种大模型配置教程

【大模型学习 | DeepSeek-V3原理】

3SemanticKernel使用非ChatGPT大模型

大语言模型--Llama3新特性

多模态大模型技术原理与实战(3)

DINOv3视觉基础大模型正式发布！

港大 | 发布 “点云” 大模型：PointLLM，旨在实现大模型在3D对象上的应用！

通用大模型VS垂直大模型

【AI大模型】训练Al大模型

3大基础模型，搞掂互联网产品分析

国产大模型选型指南：避开这3个坑

最强开源大模型Llama 3发布！

腾讯混元宣布大语言模型和3D模型正式开源！

开源大模型与闭源大模型

大模型与大模型的幻觉问题

原创 | 大模型扫盲系列——初识大模型

别再“为了大模型而大模型”了

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型 在线 离线 使用 )

简单3步部署本地国产大模型DeepSeek大模型

【大模型AIGC系列课程 3-2】国产开源大模型：ChatGLM

OpenClaw怎么换大模型？3步免费切换各种大模型配置教程

【大模型学习 | DeepSeek-V3原理】

3SemanticKernel使用非ChatGPT大模型

大语言模型--Llama3新特性

多模态大模型技术原理与实战(3)

DINOv3视觉基础大模型正式发布！

港大 | 发布 “点云” 大模型：PointLLM，旨在实现大模型在3D对象上的应用！

通用大模型VS垂直大模型

【AI大模型】训练Al大模型

3大基础模型，搞掂互联网产品分析

国产大模型选型指南：避开这3个坑

最强开源大模型Llama 3发布！

腾讯混元宣布大语言模型和3D模型正式开源！

开源大模型与闭源大模型

大模型与大模型的幻觉问题

原创 | 大模型扫盲系列——初识大模型

别再“为了大模型而大模型”了

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型在线离线使用 )