搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏韩曙亮的移动开发专栏
【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型在线离线使用 )
首先 , 安装 Ollama 软件 , 到 https://ollama.com/ 下载安装 ; 然后 , 运行 ollama run llama3 命令 , 即可开始使用 Llama3 大模型 ; 一、Meta Llama 3 大模型安装 1、Llama 3 大模型简介 Llama 3 大模型是 Meta 公司发布的大模型 , Meta 公司就是 Facebook ; Llama 3 大模型 Llama3 大模型 ; 下载的模型放在了 C:\Users\用户名.ollama 目录中 , 在我的电脑上的路径是 C:\Users\octop.ollama ; 这个模型很大 , 有 4.7 G 安装完成后的效果 for help) 二、Meta Llama 3 大模型使用 1、Llama 3 大模型在线使用在命令行中 , 可以直接进行对话 , 下面是对话内容 : D:\Llama>ollama run llama3 for help) 2、Llama 3 大模型离线使用 Llama 3 大模型联网时 , 可以访问云端服务 , 可以生成更加丰富的文本 ; Llama 3 大模型在断网后也可以使用 , 下面是断开网络后
1.7K12编辑于 2024-08-09
来自专栏科技云报道
通用与垂直大模型之战：大模型驱动的商业智能变革之路
是做通用大模型还是垂直大模型，这一个争论在“百模大战”的下讨论愈发热烈。目前，以微软、谷歌、百度、阿里等为代表的发力于通用大模型的科技大厂，也都开始推动大模型在垂直领域的商业化落地。垂直大模型则更为直接的深入特定行业和应用场景，如金融、医疗或零售等，相比于通用大模型，垂直大模型能够更精准地满足行业特定的需求。说到底，无论是通用还是垂直大模型，其核心点还是落地场景和商业化。大模型重新定义了人工智能的边界和可能性，但更需要的是，在具体的商业环境中找到了新的生存空间和增长点。在众多垂直领域中，大模型在智能商业BI领域落地尤为引人注目。寻找通用与垂直大模型的平衡点回到开头通用和垂直大模型的讨论上。这一次，有记者在网易数帆城市行媒体沟通环节将这个问题抛给了网易。在大模型掀起的新时代里，许多企业都站在了一个十字路口，开始寻找通用大模型与垂直行业大模型之间的平衡。
1.2K50编辑于 2023-08-18
来自专栏机器之心
大语言模型的可信之路：TrustLLM全面揭秘
3）用户对 LLMs 的高期望。用户可能对 LLMs 的性能有很高的期望，期望它们提供准确且有见地的回应，强调模型与⼈类价值观的一致性。许多研究者对 LLMs 是否与⼈类价值观一致表示担忧。尽管⼈们已经付出了非常多的努力来确保大语言模型的可信赖，一个问题仍然存在：我们真正能在多大程度上信任 LLMs？论文得出的核心结论如下：可信性与大语言模型的能力密切相关。作者的发现表明，可信性与实用性之间存在正相关，尤其在特定任务中更为明显。接下来，他们观察到不同程度的过度安全问题（如图 5 右侧），这是近期研究中突出的一个问题（大语言模型会拒绝回答无害的输⼊）。最后，他们通过偏好询问来探究大语言模型中潜在的偏见问题（Preference）。鲁棒性（Robustness）在大型语言模型（LLMs）中，鲁棒性指的是它们在面对各种输⼊条件时的稳定性和性能。
59410编辑于 2024-02-26
来自专栏开源项目搭建
简单3步部署本地国产大模型DeepSeek大模型
简单3步部署本地国产大模型DeepSeek大模型DeepSeek是最近非常火的开源大模型，国产大模型 DeepSeek 凭借其优异的性能和对硬件资源的友好性，受到了众多开发者的关注。本文将介绍如何通过简单 3 步在本地部署 DeepSeek 大模型，让你能够轻松体验这一强大的 AI 工具。 deepseek-r1的哪个版本的大模型？它支持各种LLM，包括Llama 3、Mistral和Gemma。提供了类似OpenAI的API接口和聊天界面,可以非常方便地部署最新版本的GPT模型并通过接口使用。理论上就安装完成了，可以只在命令行中使用大模型了。修改路径文件保存路径可以不用改，如果C盘空间不够用，建议修改。
6.4K33编辑于 2025-02-06
来自专栏IT杂谈学习
探索AI大模型学习的未来之路
二、AI大模型学习的理论基础 2.1 深度学习 AI大模型学习建立在深厚的数学和算法基础之上。其中，深度学习技术是支撑大模型学习的重要基石。 2.2 数据处理在大规模数据处理方面，AI大模型学习具有显著的优势。通过增加模型的深度和宽度，大模型能够捕捉到更多的信息，从而提高模型的准确性和泛化能力。然而，这也带来了计算复杂度和资源消耗的挑战。 3.2 AI大模型在特定领域的应用实例 AI大模型学习在自然语言处理、图像识别、语音识别等领域取得了显著的应用成果。四、AI大模型学习的注意点随着AI大模型学习在各领域的广泛应用，其带来的伦理和社会问题也逐渐凸显出来。首先，数据隐私是一个不可忽视的问题。大模型往往具有复杂的结构和参数，使得其容易受到攻击和篡改。因此，加强模型的安全防护和鲁棒性是大模型学习领域的重要研究方向。
49110编辑于 2024-03-29
来自专栏资讯分享
为什么价值对齐是大模型的必由之路？
在大型AI模型开发中实现价值对齐是关键，这有助于减少潜在风险并确保技术产生积极影响。2. 构建基于信任的框架是实现技术和社会之间良好互动的重要因素，尤其在全球AI治理中显得尤为重要。3. 大模型价值对齐需要关注个体需求、集体规范、主体能动性，并兼顾技术实践与法律规制。6. 大模型价值对齐仍有理论局限，需要保持开放和审慎的态度，在实践中逐步推进。过去在大模型没有出现时，我们还没有察觉到技术可以如此强大，随着GPT3到PaLM到各种各样开源模型出现，大模型的能力越来越强，我们进入到了生成式人工智能的时代。滕妍：大语言模型的价值设计与评测当前，人工智能步入“通用模型”时代。全球对于大模型的社会伦理问题非常关注。
64220编辑于 2023-11-10
AGI 进阶之路探索：我和头部大模型对话学习3w+轮次后发现…
接下来让我们一起来看看这些顶尖大模型表现如何吧！目录1.评测背景：AGI 发展的进阶之路2.十分钟 Quiz 评测方案 2.1 评测框架 2.2 产品化隐式评测手段 2.3 丰富的专业数据集及可泛化对话场景 2.4 评测指标3.十分钟十分钟 Quiz 评测方案2.1 评测框架10分钟 Quiz 评测方案首先对 L2→L3 做了进一步拆解，将系统指令根据详细程度划分为四个 Prompt 层级（目标、大框架、笼统的 Workflow、详细的 2.4 评测指标评测指标体系构建的复杂性是隐式评测中的一大难题，本方案通过拆解模型输出过程中的三项关键链路：【Prompt】【长上下文信息】【模型思考过程】，挖掘出体现模型能力差异的四大类定性 / 定量指标以上就是本次的评测内容， AGI-Eval 大模型评测社区持续关注现在大模型行业的发展，持续探寻 AGI 的发展之路。后续我们也将第一时间为大家评测更多模型，期待更多人加入我们！
47210编辑于 2025-05-22
来自专栏大数据成神之路
阿里大数据之路：数据模型篇大总结
1.2 关系数据库系统和数据仓库 1.3 从 OLTP 和 OLAP 系统的区别看模型方法论的选择 OLTP 系统通常面向的主要数据操作是随机读写，主要采用满足 3NF 的实体关系模型存储数据，从而在事务处理中解决数据的冗余和一，将金融业务划分为10大主题，并以设计面向金融仓库模型的核心为基础，企业基于此模型做适当调整和扩展就能快速落地实施。至此，我们也得到了一个经验：在不太成熟、快速变化的业务面前，构建 ER 模型的风险非常大，不太适合去构建 ER 模型。基于应用的数据组装 : 大宽表集市、横表转纵表、趋势指标串。主要依据高内聚、低耦合的理念，在物理实现中，将业务关系大、源系统影响差异小的表进行整合：将业务关系小、源系统影响差异大的表进行分而置之。
2.7K22编辑于 2022-11-11
来自专栏Soul Joy Hub
【大模型AIGC系列课程 3-2】国产开源大模型：ChatGLM
GLM https://arxiv.org/pdf/2103.10360.pdf GLM是General Language Model的缩写，是一种通用的语言模型预训练框架。这个图示说明了GLM预训练的过程，具体解释如下： a) 原始文本：给定一个原始文本，例如[x1, x2, x3, x4, x5, x6]。在这个例子中，我们随机选择了两个连续的词片段[x3]和[x5, x6]作为样本。 b) 替换和洗牌：在Part A中，我们将被选择的词片段替换为[M]（表示遮盖）。在这个例子中，我们将[x3]和[x5, x6]洗牌为[x5, x6]和[x3]。 c) 自回归生成：GLM使用自回归的方式生成Part B。在生成过程中，模型可以根据之前生成的词片段和Part A中的上下文来预测下一个词片段。 d) 自注意力掩码：为了限制模型的注意力范围，
78220编辑于 2023-08-28
来自专栏新智元
ChatGPT全年更新大总结！重看「大模型风向标」进化之路
新智元报道编辑：LRS 【新智元导读】2024年，OpenAI的ChatGPT在大模型领域不断突破，推出了多项创新功能，如个性化聊天机器人商店、增强记忆功能、多模态处理能力等，在安全性、稳定性和高效性方面也持续优化 2024年，大模型已经深入融入了我们的日常生活。而作为领跑者，ChatGPT也一直是大模型届的指南针，无论是去年发布的大模型o1-pro，Sora Turbo，还是各种小功能，比如视频模式、打断说话等，甚至是每月200美元的高额定价，OpenAI的每一场发布会都能给广大下面共同回顾一下OpenAI在2024年发布的关键更新，一起见证大模型的进化之路！ 1月 GPT商店：用户可以发布构建的个性化聊天机器人（GPTs），按类别进行搜索，如写作、生活方式和教育等。为了确保o3和o3-mini模型在发布前的安全性和可靠性，OpenAI采用了多层安全测试方法，将内部评估与外部研究计划相结合，招募安全研究人员参与测试，以便发现潜在的安全风险和漏洞并及时修复。
76910编辑于 2025-02-15
来自专栏AI科技评论
大模型行至深处，「悟道」如何走好全面开源之路？
“悟道 1.0”是当时中国首个超大模型，“悟道 2.0”发布时成为全球最大的智能模型，模型参数规模达到 1.75 万亿，是 OpenAI 所发布的 GPT-3 的 10 倍，受到了国内外的瞩目。也因此，智源被斯坦福、谷歌等企业列为大模型的先驱。尽管如此，由于早期，大模型还缺乏好的应用场景和产品，价值始终无法发挥，大模型的研发也曾受到一些争议。悟道·天鹰 Aquila 基础模型（7B、33B）则集成了 GPT-3、LLaMA 等模型架构设计优点，在替换更高效的底层算子、重新设计实现了中英双语 tokenizer 的同时，升级 BMTrain 2 为未来智能运营商提供底层支持 2021 年 3 月，在“悟道 1.0 ”的发布现场，黄铁军表示，人工智能的发展已经从“大炼模型”逐步迈向了“炼大模型”的阶段。其中，FlagOpen 的核心 FlagAI 是大模型算法开源项目，当中集成了全球各领域的一些明星模型，如语言大模型 OPT、T5，视觉大模型 ViT、Swin Transformer，多模态大模型 CLIP
79220编辑于 2023-08-08
来自专栏openclaw系列
OpenClaw怎么换大模型？3步免费切换各种大模型配置教程
一句话总结：OpenClaw 本身不内置任何大模型，而是通过灵活的配置机制对接各类模型服务。更换模型只需三步：选择目标模型获取 API Key、在配置文件中添加模型提供商、重启网关生效。但很多人忽略了一个关键问题：OpenClaw 本身不包含任何 AI 模型。就像一台性能再强的电脑，没有操作系统也无法工作。OpenClaw 的“大脑”完全来自你接入的大模型。第一章：核心原理——OpenClaw 如何对接大模型？1.1 为什么需要更换模型？OpenClaw 的核心价值在于“连接”——连接大模型的思考能力与电脑的真实操作权限。 2.1 腾讯元宝模型配置（推荐中文场景）腾讯元宝基于混元大模型，提供强大的中文理解和多模态能力，2026 年推出免费额度方案，大幅降低使用门槛。 Q3：本地模型响应太慢怎么办？
15.3K54编辑于 2026-03-28
来自专栏AI实验室应用
RLHF三大挑战与突围之路：如何让大模型更懂人类偏好？
从RLHF到DPO：大模型对齐技术的深度演进与实战解析当大语言模型学会理解人类偏好，一场关于对齐的技术革命正在悄然发生。 01 大模型训练的三段式进阶之路基础构建：预训练阶段预训练（Pre-training）：利用数十亿到数万亿个token的庞大文本语料库对模型继续预训练，使模型能够根据提供的文本来预测「下一个单词」 3.如何基于RM模型使用PPO算法微调SFT模型？ 03 RLHF的五大核心挑战与创新解决方案挑战一：人工标注成本高、难规模化解决方案：AI反馈替代人类反馈 RLAIF：使用大模型评估其他模型的输出，构建AI偏好数据集 Constitutional 零样本对齐：在新任务上无需额外对齐可解释对齐：让对齐过程更加透明可控个性化对齐：适应不同用户的偏好和价值观 05 结论：对齐之路，以人为本大模型对齐技术的发展，本质上是让机器更好地理解和服务人类的过程
74122编辑于 2025-12-17
来自专栏人工智能极简应用
AI智能体研发之路-模型篇（三）：中文大模型开、闭源之争
存在即合理，从ios vs android，打到GPT4 vs LLama3，可能永远不会有胜负。今天我们详细聊聊中文大模型开闭源的那些事。二、中文开/闭源大模型概览大家先看《2024年中文大模型全景图》，对国内中文大模型开闭源情况有个概念。 Tips：图片引自SuperCLUE中文大模型基准测评2024年4月报告，国内领先的大模型评测公司，高中室友创办的，没想到毕业多年，兜兜转转进入到了一个行业，如需合作需要可以联系我哈闭源大模型：主要有文心一言开源大模型：主要有baichuan2-13B-Chat、ChatGLM3-6B、Qwen1.5、Chinese-LLaMA-Alpaca-3等。从商业模式上讲，又可以分为3类。 3、训练和部署难度：对于一些复杂的大模型，训练和部署可能需要较高的技术水平和计算资源。 4、数据隐私和安全：开源模型可能涉及数据的共享和使用，需要注意数据隐私和安全问题。
68110编辑于 2024-08-13
来自专栏科控自动化
SCADA 大咖之路
对于WinCC V7.x来说，在画面设计中使用脚本将带来非常大的便利性。当要实现对象的动态化，你可以只通过组态的方式来实现。常规的动态应用，通过动态化窗口实现都没有问题。因此，开始学习并且掌握好JavaScript，就成了更好地使用Portal WinCC Unified的必经之路。看到这里，你可能会想，我大概明白了编程在SCADA应用中的重要性。这样，当在网上找到别人编写的一大段代码时，才能在浏览一下，大概就能弄清程序的结构脉络。在理解程序结构的基础上，再去研究其细节的功能实现。才能不至于一下子就掉到某个函数的细节上，而丢失了对整体的把握。但站在 WinCC 的角度上，多掌握些与 WinCC 相关的 Windows 知识，对我们的 WinCC 成长之路还是大有裨益的。操作系统，其实也是一种程序，一种特殊的程序而已。追溯DLL 产生背景，应该是在计算机应用早期，为了解决单体应用程序体积大及占用内存过多而采取的一种解决方案。多个应用程序共享的功能库不用再静态链接到每个单体程序中，从而减小其程序体积。
1.9K20编辑于 2022-03-29
来自专栏大模型成长之路
【大模型学习 | DeepSeek-V3原理】
DeepSeek-V3 Technical Report DeepSeek-V3 的基本框架还是 Transformer。另外，V3 模型是通过将预测多token作为训练目标。本文主要是对DeepSeek-V3的模型框架以及训练目标进行讨论。什么是负载平衡？ 2️⃣ DeepSeekMoE 在Transformer架构中的FFN层，V3模型采用了MoE进行替换，使用更细粒度的专家，并将一些专家隔离为共享专家。 ✅ Yes ✅ 无偏置目前的模型权重已开源： https://huggingface.co/deepseek-ai/DeepSeek-V3-Base 者由于设备限制无法对 V3模型进行体验。
1.4K21编辑于 2025-07-25
来自专栏AI工程落地
大语言模型--Llama3新特性
更大的词表使得模型涵盖的语言更多、更加通用 Attention层--MultiHeadAttention算子 Llama3 8B和70B都使用了分组查询注意力机制(GQA)，4个Query共享一对Key 减少了计算量，同时保持了模型的性能。值是500000.0（Llama2用的是默认值10000.0）上下文窗口中的最大Tokens从 4096增加到 8192 数据类型 Llama2开源的参数是float16格式的，但Llama3开源的参数都是依赖软件包 transformers包升级到4.40.0以上模型版本 2024年4月21号初版 Llama3 8B的HellaSwag分数：acc 0.6039、acc_norm 0.776 2024年5月14号第二版 Llama3 8B的HellaSwag分数：acc_norm 0.822
37110编辑于 2024-05-29
来自专栏算法一只狗
OpenAI下一代大模型Orion被爆出提升有限，大模型之路还有机会吗？
如果你对于大模型有关注，这篇文章将为您提供有价值的参考。而这一次，大模型Orion被曝出效果不佳，大模型悲观主义学派Gary Marcus直接就宣布：游戏结束，是我赢了。GPT大模型正在进入一个收益递减期。这里总结了网上几个主流的观点目前大模型存在的问题 1.数据集的问题目前最主流的说法认为，大模型的scaling raw正在慢慢失效，也就是目前的大模型尽管有着大量的数据集进行训练，但是其能力却没有大规模的提升主要是现在大模型所需要的大规模数据集已经耗尽了，高质量的数据集其实没有多少。 OpenAI就为此创建了一个“基础团队”，主要研究怎么合成高质量的数据，提供给大模型进行学习。这里面一年就需要支出3亿美元。所以说，目前OpenAI训练一个大模型，特别是训练下一代大模型Orion，其花费应该是天价了。
33430编辑于 2024-11-18
来自专栏算法channel
AI大模型之路第三篇：从零实现词嵌入模型，加深理解！
今天我们研究「AI大模型第三篇」：词维度预测，很多读者听过词嵌入，这篇文章解答下面问题：词嵌入是什么意思？怎么做到的？原理是什么？ 1 skip-gram模型 Skip-gram模型是一种广泛使用的词嵌入（Word Embedding）方法，由Mikolov等人在2013年提出。我们可以挑选“fox”作为输入词，上下文窗口大小为2：输入："fox" 预测的上下文："quick"、"brown"、"jumps"、"over" 3 求解思路： 1 对“fox”进行独热编码。 2 使用Word2Vec模型预测“fox”的上下文词。 3 通过调整模型权重来最小化预测误差，使得模型可以更准确地预测到“fox”的正确上下文。使用模型SkipGramModel def predict_context(model, input_word, word_to_ix, ix_to_word, top_n=3): # Check
1.1K20编辑于 2024-04-25
来自专栏机器之心
适配超20+芯片厂商，昇思MindSpore大模型之路走南闯北
通过跨模态统一表征学习，中科院自动化所和武汉人工智能研究院联合打造的「紫东太初」2.0，让大模型第一次进入了全模态时代，同时支持多轮问答、文本创作、图像生成、3D 理解、信号分析等任务。 ‍ 做业界领先的 AI 框架自 2020 年 3 月发布首个版本以来，昇思作为业内瞩目的 AI 框架经历了快速发展。围绕昇思的社区，已是国内最具创新活力的 AI 开源社区。在 2.0 的大版本更新上，昇思在大模型能力、科学计算和 AI 技术落地上继续实现大幅改进。作为一款 AI 框架，昇思将大模型开发的系统工程难题集成到软件框架中解决，沉淀出了整套从预训练到场景应用的大模型实践方案。太初、鹏程系列等百亿、千亿级大模型，根据《中国人工智能大模型地图研究报告》中的数据，基于昇思孵化的产业落地大模型，占到国内总数的 40%。
71120编辑于 2023-08-07

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型在线离线使用 )

通用与垂直大模型之战：大模型驱动的商业智能变革之路

大语言模型的可信之路：TrustLLM全面揭秘

简单3步部署本地国产大模型DeepSeek大模型

探索AI大模型学习的未来之路

为什么价值对齐是大模型的必由之路？

AGI 进阶之路探索：我和头部大模型对话学习3w+轮次后发现…

阿里大数据之路：数据模型篇大总结

【大模型AIGC系列课程 3-2】国产开源大模型：ChatGLM

ChatGPT全年更新大总结！重看「大模型风向标」进化之路

大模型行至深处，「悟道」如何走好全面开源之路？

OpenClaw怎么换大模型？3步免费切换各种大模型配置教程

RLHF三大挑战与突围之路：如何让大模型更懂人类偏好？

AI智能体研发之路-模型篇（三）：中文大模型开、闭源之争

SCADA 大咖之路

【大模型学习 | DeepSeek-V3原理】

大语言模型--Llama3新特性

OpenAI下一代大模型Orion被爆出提升有限，大模型之路还有机会吗？

AI大模型之路第三篇：从零实现词嵌入模型，加深理解！

适配超20+芯片厂商，昇思MindSpore大模型之路走南闯北

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型 在线 离线 使用 )

通用与垂直大模型之战：大模型驱动的商业智能变革之路

大语言模型的可信之路：TrustLLM全面揭秘

简单3步部署本地国产大模型DeepSeek大模型

探索AI大模型学习的未来之路

为什么价值对齐是大模型的必由之路？

AGI 进阶之路探索：我和头部大模型对话学习3w+轮次后发现…

阿里大数据之路：数据模型篇大总结

【大模型AIGC系列课程 3-2】国产开源大模型：ChatGLM

ChatGPT全年更新大总结！重看「大模型风向标」进化之路

大模型行至深处，「悟道」如何走好全面开源之路？

OpenClaw怎么换大模型？3步免费切换各种大模型配置教程

RLHF三大挑战与突围之路：如何让大模型更懂人类偏好？

AI智能体研发之路-模型篇（三）：中文大模型开、闭源之争

SCADA 大咖之路

【大模型学习 | DeepSeek-V3原理】

大语言模型--Llama3新特性

OpenAI下一代大模型Orion被爆出提升有限，大模型之路还有机会吗？

AI大模型之路 第三篇：从零实现词嵌入模型，加深理解！

适配超20+芯片厂商，昇思MindSpore大模型之路走南闯北

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型在线离线使用 )

AI大模型之路第三篇：从零实现词嵌入模型，加深理解！