搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏韩曙亮的移动开发专栏
【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型在线离线使用 )
首先 , 安装 Ollama 软件 , 到 https://ollama.com/ 下载安装 ; 然后 , 运行 ollama run llama3 命令 , 即可开始使用 Llama3 大模型 ; 一、Meta Llama 3 大模型安装 1、Llama 3 大模型简介 Llama 3 大模型是 Meta 公司发布的大模型 , Meta 公司就是 Facebook ; Llama 3 大模型 Llama3 大模型 ; 下载的模型放在了 C:\Users\用户名.ollama 目录中 , 在我的电脑上的路径是 C:\Users\octop.ollama ; 这个模型很大 , 有 4.7 G 安装完成后的效果 for help) 二、Meta Llama 3 大模型使用 1、Llama 3 大模型在线使用在命令行中 , 可以直接进行对话 , 下面是对话内容 : D:\Llama>ollama run llama3 for help) 2、Llama 3 大模型离线使用 Llama 3 大模型联网时 , 可以访问云端服务 , 可以生成更加丰富的文本 ; Llama 3 大模型在断网后也可以使用 , 下面是断开网络后
1.9K12编辑于 2024-08-09
AI大模型知识库
而基于AI大模型构建的知识库系统，通过自然语言处理技术和深度学习算法，能够自动完成文本解析、语义关联与智能检索，使分散的知识资源形成有机网络，为企业知识管理带来革命性变革。相较于传统方案，AI大模型知识库在技术特性上展现出显著优势：语义理解深度方面，传统方案依赖关键词匹配，误差率高，而AI方案具备上下文感知能力，准确率超92%；更新维护成本上，传统方案人工录入月均耗时120h 二、典型应用场景落地AI大模型知识库在多场景落地应用，创造显著价值：智能问答机器人可7×24小时解答员工关于政策制度、操作流程的咨询，某金融机构部署后人力咨询量下降47%，提升咨询响应效率；辅助决策沙盘整合市场动态三、实施路径规划建议成功部署AI大模型知识库需经历三个阶段：首先是领域定制化训练，使用企业专属语料对基座模型进行调优，确保模型适配企业业务场景；其次是人机协同校验机制建立，通过人工复核保障输出内容的合规性与准确性五、未来演进方向展望随着多模态融合技术的发展，下一代AI大模型知识库将突破文本局限，实现图纸三维模型与操作视频的联动检索，拓展知识呈现与应用形式。
64610编辑于 2025-10-16
来自专栏开源技术小栈
3分钟快速构建大语言模型AI知识库
FastGPT FastGPT 是一个基于 LLM 大语言模型的知识库问答系统，提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排，从而实现复杂的问答场景！ WhisperModel": { "model": "whisper-1", "name": "Whisper1", "price": 0 } } 3、登录成功访问页面如下所示构建知识库创建知识库成功登录后，新建一个知识库，取名开源技术小栈。 https://mp.weixin.qq.com/s/mNhMCzUtLUKrIzqSVa-qZA https://mp.weixin.qq.com/s/n4n-0UCWJW9u2N1ca3HisQ 创建应用使用知识库必须要创建一个应用关联知识库设置了开场白并且选择绑定对应知识库开源技术小栈点击保存预留后，可以直接在右边调试预览框预览对话进行文档内容测试。
2.2K11编辑于 2023-11-27
来自专栏机器学习与统计学
基于大模型、SKills 的知识管理
整个系统的架构可以拆成五个模块： Karpathy 知识库系统：五大模块 1. 数据导入（Data Import）把各种原始素材——论文、文章、代码库、数据集、图片——统统丢进 raw/ 目录。将数据分类到不同的概念为每个概念撰写专题文章将所有文章互相链接注意这个词：编译（compile） Karpathy 用的是编程的隐喻——原始数据是"源码"，维基是"编译产物"，LLM 就是那个"编译器" 3. 这点我必须插一嘴——40 万字对现在的长上下文模型来说真不算什么。 Gemini 的百万 token 窗口，Claude 的 200K 上下文，处理这个量级的知识库绑绑有余。但作为一个每周要输出 3-5 篇技术文章、配套口播视频、社交媒体内容的人，我需要的不只是"积累"和"查询"，我需要把知识变成内容产品推出去。这就是我做的事——知识管理的下游：内容生产流水线。 40 万字知识库微调一个专属的小模型，让它从骨子里"理解"你的领域知识和思考方式。
64121编辑于 2026-04-13
来自专栏开源项目搭建
简单3步部署本地国产大模型DeepSeek大模型
简单3步部署本地国产大模型DeepSeek大模型DeepSeek是最近非常火的开源大模型，国产大模型 DeepSeek 凭借其优异的性能和对硬件资源的友好性，受到了众多开发者的关注。本文将介绍如何通过简单 3 步在本地部署 DeepSeek 大模型，让你能够轻松体验这一强大的 AI 工具。 deepseek-r1的哪个版本的大模型？它支持各种LLM，包括Llama 3、Mistral和Gemma。提供了类似OpenAI的API接口和聊天界面,可以非常方便地部署最新版本的GPT模型并通过接口使用。理论上就安装完成了，可以只在命令行中使用大模型了。修改路径文件保存路径可以不用改，如果C盘空间不够用，建议修改。
6.8K33编辑于 2025-02-06
来自专栏深度学习自然语言处理
FuseLLM：大语言模型的知识融合！
Knowledge Distillation：知识蒸馏最初被提出用于模型压缩，包括在一个或多个教师模型的指导下训练学生模型。在NLP中已有较为广泛的应用。本文的方法与传统的知识蒸馏有显著的区别。首先，在传统的知识蒸馏中，学生模型通常被限制为比教师更小的尺寸。然而，在本文的场景中，目标模型的大小没有限制。其次，传统的知识蒸馏通常会导致学生模型在蒸馏后落后于教师的表现。相比之下，本文预计在融合之后，目标模型将超过任何源模型的性能。方法模型架构上图展示了传统模型融合技术和本文的LLM知识融合方法(FUSELLM)的对比。不同的动物图标代表不同的LLM。随着模型数量从1增加到3，FuseLLM的性能有了明显的改进。在BBH中观察到持续的性能改进。而在CS或ME中，当融合两个模型时，优势更加突出。这表明FuseLLM 通过通过连续训练集成三个具有不同架构的7B模型来实现的卓越性能超过了简单地从单个13B模型中提取知识的好处。
1.3K11编辑于 2024-01-31
AI 大模型知识管理平台：让企业知识“活”起来
基于 AI 大模型的知识管理平台正彻底改变这一现状，让知识真正流动起来，成为驱动企业创新的活水源头。图片什么是 AI 大模型知识管理平台？核心技术：RAG 如何让大模型更“懂”企业？AI 知识管理平台的核心技术是检索增强生成（RAG）。这一技术巧妙结合了信息检索和大语言模型生成的优势。当用户提问时，平台会先在知识库中检索相关信息，然后将这些信息作为上下文提供给大模型，最终生成精准可靠的答案。这种方法既利用了大模型的强大理解能力，又确保了回答内容基于企业权威知识，有效避免了常见的大模型“幻觉”问题。例如，潍柴集团通过此类平台，在客服场景中实现了94% 的问答准确率，大幅提升了工作效率。结语AI 大模型知识管理平台不仅是技术工具，更是企业智能化转型的核心基础设施。它让知识从静态存储变为动态资源，从成本中心转化为价值引擎。对于技术社区而言，这一领域充满创新机遇。
59510编辑于 2025-10-11
来自专栏创作是最好的自我投资
知识蒸馏：让大模型“瘦身”的魔法
AI界的“知识浓缩术”核心定义蒸馏模型（Distillation Model）是一种通过“师生教学”的方式，将庞大复杂的大模型（教师模型）中的核心知识，“浓缩”到轻量级小模型（学生模型）中的技术。传统训练 vs 知识蒸馏传统训练：学生模型就是直接从数据中学习（如同自学），需要大模型自己从海量数据中提取自己需要的信息，就像你想上学，但是没有资金支持，只能自己通过书籍来学习，那么在没有人指导的情况下 50倍）推理速度1x15x（手机实时响应）内存占用320GB6.4GB（手机可承载）文本生成质量90.2分87.5分（差距<3%）真实场景验证：智能客服：响应速度从2.1秒→0.15秒，服务器成本降低未来展望：蒸馏模型将如何改变AI？边缘计算革命：智能音箱、摄像头等设备将具备本地大模型能力。就像把大模型拆解成无数"小模型"，从而在手机、摄像头、工厂机器人甚至红绿灯里就地处理数据。通过在智能终端增加大模型能力，从而使得智能家居不联网也能听懂指令。这也就意味着让数据不再拥堵在"云端高速公路"，从而既保护隐私又省电，像给大模型装上会思考的"神经末梢"。
1.3K30编辑于 2025-04-09
腾讯云大模型知识引擎产品概要
一、产品定位与核心亮点腾讯云大模型知识引擎是一个基于大语言模型的知识应用开发平台。其核心技术属性是提供大模型企业知识服务应用模版及文档解析、向量检索等原子能力，旨在推动大语言模型在政企服务场景的应用落地。支持文档解析、向量检索、知识库管理、对话测试与发布等功能。技术内核：依托OCR大模型解析引擎、多模态大模型、业内首个语义切分大模型与基于混元大模型技术的行业大模型。工具链完善，支持自定义模型选择、角色设定、提示词自动优化、知识库管理及维护。提供对话测试-修正-发布-反馈增强的一站式处理流程。荣誉背书技术方案中提及包含业内首个语义切分大模型。解决方案：一阶段打造了全球首个大熊猫智能行为识别模型及智慧系统。未来计划借助腾讯云大模型知识引擎打造大熊猫“AI大模型奶爸”。
23210编辑于 2026-05-31
来自专栏技术丛林大冒险
基于大语言模型构建知识问答系统
本文探索使用大语言模型（Large Language Model, LLM），通过其对自然语言理解和生成的能力，揣摩用户意图，并对原始知识点进行汇总、整合，生成更贴切的答案。从大语言模型（Large Language Model, LLM）角度而言，上面的需求是在两阶段训练模式下，面向下游场景进行适配的问题。与普通搜索结合，使用基础模型对搜索结果加工。Fine-Tuning使用下游特定领域的知识对基础模型进行微调，改变神经网络中参数的权重。消耗的资源量虽然相对大模型预训练减少，但还是不容小觑的。比如Alpaca 的微调，据作者介绍他们使用8 个显存80GB A100 ，花费了 3 个小时。以游戏 NBA2K为例，球员的打法在不同比赛模式中是不同的，比如王朝 5v5和街头 3v3就不一样。
7.2K85编辑于 2023-05-08
来自专栏老张的求知思考世界
性能测试知识科普(六)：三大模型
今天的这篇文章是性能测试知识科普的第六篇，我会聊聊在实际工作中开展性能测试，前期最核心的工作。即业务模型、流量模型和数据模型这三大模型，该如何评估和建立。为了便于大家理解三大模型，我会以电商业务下单的场景来举例说明，如下图：业务模型大家可以将业务模型看作功能测试中的业务场景。生产环境全链路压测场景针对生产集群的全链路压测，常见的案例就是双11电商大促。；构建流量模型下面是之前我实际工作中一次双11大促时的流量模型构建案例，仅供参考。预估大促时的支付转化率为60%，则可得：大促峰值订单支付QPS为（200/40%）*60%*（200W/50W）=1200QPS。
1.6K20编辑于 2023-03-01
大模型+知识库rag项目架构
在AI领域，“大模型”通常指的是具有大量参数的深度学习模型，它们能够处理复杂的任务，如自然语言处理（NLP）、图像识别等。而“知识库”则是指存储大量结构化或半结构化数据的系统，这些数据可以用于支持决策、提供信息查询等服务。将大模型与知识库结合的项目架构（RAG项目架构）可能指的是一种结合了检索（Retrieval）和生成（Generation）的架构，即RAG（Retrieval-Augmented Generation RAG架构的一般流程如下：检索阶段（Retrieval）：首先，系统会从知识库中检索出与输入查询相关的信息。这可以通过关键词匹配、语义搜索或其他相关性度量来实现。例如，检索系统可以使用不同的搜索引擎或推荐系统，而生成模型可以是传统的语言模型，也可以是专门为特定任务训练的模型。
1.1K10编辑于 2024-04-19
腾讯云大模型知识引擎产品概要
一、产品定位与核心亮点腾讯云大模型知识引擎是一个基于大语言模型的企业级知识应用开发平台。其核心技术属性是提供大模型企业知识服务应用模板及文档解析、向量检索等原子能力，旨在推动大语言模型在政企服务场景的应用落地。依托OCR大模型解析引擎、多模态大模型、业内首个语义切分大模型与基于混元大模型技术的行业大模型，端到端问答效果业内领先。多模态交互模式丰富，应用端支持多种输入、输出格式。解决方案：利用知识引擎准确解析复杂表格文档，通过大模型理解推理生成答案。应用大模型的数学计算、范围判断及方案框架生成能力。成效：创建行业知识库“榕博士”，促进知识共享。解决方案：基于通用大模型，为不同城市业务知识配置标签，实现一问多答。大模型可基于业务文档回复未配置的通用业务问题，或自行应答非业务问题。成效：极大节省知识配置工作量。
23110编辑于 2026-05-31
来自专栏《活动征集》
DeepSeek大模型的基础知识解析!
作为一款国产大模型，DeepSeek不仅在技术上做出了突破，还承载着国产AI的雄心壮志。很多人对大模型可能还抱有一丝困惑，尤其是像 DeepSeek 这样的模型。那么，DeepSeek究竟是什么？前言：DeepSeek，国产大模型的代表近年来，随着深度学习的迅猛发展，大模型成为人工智能领域的主流。 DeepSeek 作为国产大模型的佼佼者，不仅仅代表了技术上的创新，也象征着中国在 AI 领域日益崛起的竞争力。预训练与微调：模型的“养成”之路 DeepSeek 采用了预训练 + 微调的训练方式。首先，模型在大规模的无标签数据上进行预训练，学习通用的知识和规律。这种方式显著提升了模型在没有人工标签的情况下进行学习的能力，降低了人工标注数据的依赖，节省了大量的时间和成本。3. 分布式训练与大规模计算 DeepSeek 的训练依赖于强大的计算资源。
90721编辑于 2025-02-08
来自专栏从流域到海域
大模型基础知识 - 语言模型及其演进公开版
接下来我们来从0到1了解一下大语言模型背后的基础知识。导语通过本节课程，希望大家能够了解：语言模型的数学基础：概率语言模型（25分钟）神经网络语言模型的发展历史：即大语言模型是如何发展而来的（10分钟） GPT训练流程：大语言模型是如何训练的（ Scaling Laws for Neural Language Models 神经网络语言模型发展史 nlp中的预训练语言模型总结(单向模型、BERT系列模型、XLNet) 大模型时代之前，大语言模型的雏形出现。随着神经网络语言模型的参数量继续增大到一个千亿级别，开始表现出强大的涌现能力，辅以instruction fituning和RLHF的（大语言模型）训练流程改进，突破性的大语言模型ChatGPT出现，大模型时代来临
88430编辑于 2023-10-12
来自专栏NLP/KG
LLM 大模型学习必知必会系列(一)：大模型基础知识篇
1.前言 1.1 基础模型研究 2023 年，随着 LLM 技术的发展，中国模型研究机构的开源模型迎来了爆发式的增长： 2023 年 3 月，智谱 AI 首先在魔搭社区发布了 ChatGLM-6B 系列 3.使用 LLM 及优化 LLM 输出效果大语言模型是根据跨学科的海量的文本数据训练而成的，这也让大语言模型被大家认为最接近 “AGI” 的人工智能。然而，针对大语言模型，我们希望更好的使用 LLM，让 LLM 更好的遵循我们的指令，按照我们可控的方式和特定行业的知识输出答案。检索增强生成 (RAG) 通过整合来自外部数据库的知识成为一个有前途的解决方案，这增强了模型的准确性和可信度，特别是对于知识密集型任务，并且允许知识的不断更新和整合特定领域的信息。 **3. vLLM 推理加速：**魔搭社区和 vLLM 合作，支持更快更高效的 LLM 推理服务，基于 vLLM，开发者可以通过一行代码实现针对魔搭社区的大语言模型部署。 **4.
4.6K512编辑于 2024-05-11
来自专栏Soul Joy Hub
【大模型AIGC系列课程 3-2】国产开源大模型：ChatGLM
GLM https://arxiv.org/pdf/2103.10360.pdf GLM是General Language Model的缩写，是一种通用的语言模型预训练框架。这个图示说明了GLM预训练的过程，具体解释如下： a) 原始文本：给定一个原始文本，例如[x1, x2, x3, x4, x5, x6]。在这个例子中，我们随机选择了两个连续的词片段[x3]和[x5, x6]作为样本。 b) 替换和洗牌：在Part A中，我们将被选择的词片段替换为[M]（表示遮盖）。在这个例子中，我们将[x3]和[x5, x6]洗牌为[x5, x6]和[x3]。 c) 自回归生成：GLM使用自回归的方式生成Part B。在生成过程中，模型可以根据之前生成的词片段和Part A中的上下文来预测下一个词片段。 d) 自注意力掩码：为了限制模型的注意力范围，
88520编辑于 2023-08-28
AI 大语言模型知识图谱：让模型“更懂知识、更聪明、更可信”
在传统的大模型训练方式中，知识依赖海量语料“读出来”，但容易出现知识碎片化、逻辑断层、更新不及时的问题；模型回答看似流畅，却可能犯事实性错误或在复杂推理上“卡住”。而 AI 大语言模型知识图谱，就是用结构化、逻辑化、可计算的技术体系，为大模型安装一套“知识骨架”，让模型不仅会说，还真正“懂知识、会推理、能更新”。知识不再是散乱的语句，而是能够被计算机理解和逻辑推演的网络。二是知识图谱 + 大模型协同推理，让模型“更准、更稳、更懂逻辑”。，大模型在聊天、问答、检索、写作等场景都能调用同一套知识图谱，实现一致的知识标准。 AI 大语言模型知识图谱，用知识抽取、结构建模、图谱推理和动态更新，让模型从“会说话”走向“会理解”。它不仅提升模型的准确性与稳定性，也为专业场景提供真正可用的 AI 智能。
85910编辑于 2025-11-18
来自专栏数智转型架构师
一文秒懂大模型硬件知识
自从一头扎进AI大模型的奇妙世界，你是不是也曾有过这样的经历：刚刚弄明白“提示词”（Prompt）怎么写，一扭头就撞上了一堵“硬件墙”。训练一个大模型 = 建造一艘航空母舰所有的硬件术语，我们都可以在这个“造航母”的过程中找到它们的位置。模型参数、计算数据这些“零件”，必须先搬到工作台上才能开始组装。为什么总说“显存不够”？因为大模型的“零件”（参数）实在太多了！ 3. KV Cache：工程师的“草稿纸” 它是什么？这是AI模型在“聊天”（推理）时的一种关键优化。AI聊天时，每生成一个新词，都需要回顾前面说过的所有话。怎么工作？训练真正的大模型，需要几百上千台服务器（几千上万块GPU）一起工作。这就好比一个巨大的造船工业园，里面有无数个车间。InfiniBand就是连接这些不同车间的“高铁物流系统”。怎么工作？
54910编辑于 2025-12-30
来自专栏openclaw系列
OpenClaw怎么换大模型？3步免费切换各种大模型配置教程
一句话总结：OpenClaw 本身不内置任何大模型，而是通过灵活的配置机制对接各类模型服务。更换模型只需三步：选择目标模型获取 API Key、在配置文件中添加模型提供商、重启网关生效。但很多人忽略了一个关键问题：OpenClaw 本身不包含任何 AI 模型。就像一台性能再强的电脑，没有操作系统也无法工作。OpenClaw 的“大脑”完全来自你接入的大模型。第一章：核心原理——OpenClaw 如何对接大模型？1.1 为什么需要更换模型？OpenClaw 的核心价值在于“连接”——连接大模型的思考能力与电脑的真实操作权限。 2.1 腾讯元宝模型配置（推荐中文场景）腾讯元宝基于混元大模型，提供强大的中文理解和多模态能力，2026 年推出免费额度方案，大幅降低使用门槛。 Q3：本地模型响应太慢怎么办？
24.6K54编辑于 2026-03-28

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型在线离线使用 )

AI大模型知识库

3分钟快速构建大语言模型AI知识库

基于大模型、SKills 的知识管理

简单3步部署本地国产大模型DeepSeek大模型

FuseLLM：大语言模型的知识融合！

AI 大模型知识管理平台：让企业知识“活”起来

知识蒸馏：让大模型“瘦身”的魔法

腾讯云大模型知识引擎产品概要

基于大语言模型构建知识问答系统

性能测试知识科普(六)：三大模型

大模型+知识库rag项目架构

腾讯云大模型知识引擎产品概要

DeepSeek大模型的基础知识解析!

大模型基础知识 - 语言模型及其演进公开版

LLM 大模型学习必知必会系列(一)：大模型基础知识篇

【大模型AIGC系列课程 3-2】国产开源大模型：ChatGLM

AI 大语言模型知识图谱：让模型“更懂知识、更聪明、更可信”

一文秒懂大模型硬件知识

OpenClaw怎么换大模型？3步免费切换各种大模型配置教程

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型 在线 离线 使用 )

AI大模型知识库

3分钟快速构建大语言模型AI知识库

基于大模型、SKills 的知识管理

简单3步部署本地国产大模型DeepSeek大模型

FuseLLM：大语言模型的知识融合！

AI 大模型知识管理平台：让企业知识“活”起来

知识蒸馏：让大模型“瘦身”的魔法

腾讯云大模型知识引擎产品概要

基于大语言模型构建知识问答系统

性能测试知识科普(六)：三大模型

大模型+知识库rag项目架构

腾讯云大模型知识引擎产品概要

DeepSeek大模型的基础知识解析!

大模型基础知识 - 语言模型及其演进 公开版

LLM 大模型学习必知必会系列(一)：大模型基础知识篇

【大模型AIGC系列课程 3-2】国产开源大模型：ChatGLM

AI 大语言模型知识图谱：让模型“更懂知识、更聪明、更可信”

一文秒懂大模型硬件知识

OpenClaw怎么换大模型？3步免费切换各种大模型配置教程

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

【AI 大模型】Meta Llama 3 大模型 ( Llama 3 大模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3 大模型在线离线使用 )

大模型基础知识 - 语言模型及其演进公开版