搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

AI大模型知识库
而基于AI大模型构建的知识库系统，通过自然语言处理技术和深度学习算法，能够自动完成文本解析、语义关联与智能检索，使分散的知识资源形成有机网络，为企业知识管理带来革命性变革。相较于传统方案，AI大模型知识库在技术特性上展现出显著优势：语义理解深度方面，传统方案依赖关键词匹配，误差率高，而AI方案具备上下文感知能力，准确率超92%；更新维护成本上，传统方案人工录入月均耗时120h 二、典型应用场景落地AI大模型知识库在多场景落地应用，创造显著价值：智能问答机器人可7×24小时解答员工关于政策制度、操作流程的咨询，某金融机构部署后人力咨询量下降47%，提升咨询响应效率；辅助决策沙盘整合市场动态三、实施路径规划建议成功部署AI大模型知识库需经历三个阶段：首先是领域定制化训练，使用企业专属语料对基座模型进行调优，确保模型适配企业业务场景；其次是人机协同校验机制建立，通过人工复核保障输出内容的合规性与准确性五、未来演进方向展望随着多模态融合技术的发展，下一代AI大模型知识库将突破文本局限，实现图纸三维模型与操作视频的联动检索，拓展知识呈现与应用形式。
51410编辑于 2025-10-16
来自专栏数据派THU
详解：7大经典回归模型
来源：csdn 深度学习爱好者本文约2900字，建议阅读5分钟本文给大家介绍机器学习建模中7大经典的回归分析模型。什么是回归分析？ 4.它需要大的样本量，因为在样本数量较少的情况下，极大似然估计的效果比普通的最小二乘法差。 5.自变量不应该相互关联的，即不具有多重共线性。 7.如果因变量是多类的话，则称它为多元逻辑回归。 3. Polynomial Regression多项式回归对于一个回归方程，如果自变量的指数大于1，那么它就是多项式回归方程。 7. ElasticNet回归 ElasticNet是Lasso和Ridge回归技术的混合体。它使用L1来训练并且L2优先作为正则化矩阵。当有多个相关的特征时，ElasticNet是很有用的。除了这7个最常用的回归技术，你也可以看看其他模型，如Bayesian、Ecological和Robust回归。如何正确选择回归模型？当你只知道一个或两个技术时，生活往往很简单。
1.7K41编辑于 2023-04-18
来自专栏机器学习与统计学
基于大模型、SKills 的知识管理
整个系统的架构可以拆成五个模块： Karpathy 知识库系统：五大模块 1. 数据导入（Data Import）把各种原始素材——论文、文章、代码库、数据集、图片——统统丢进 raw/ 目录。这点我必须插一嘴——40 万字对现在的长上下文模型来说真不算什么。 Gemini 的百万 token 窗口，Claude 的 200K 上下文，处理这个量级的知识库绑绑有余。这种场景下知识库方法的优势更明显——你不可能把所有领域的知识都记在脑子里。最炸裂的用法——跑步语音播客：Lex 会让系统为特定主题生成一个临时的迷你知识库，加载进 LLM，然后在 7-10 英里的长跑中开启语音模式。 40 万字知识库微调一个专属的小模型，让它从骨子里"理解"你的领域知识和思考方式。
21720编辑于 2026-04-13
来自专栏深度学习自然语言处理
FuseLLM：大语言模型的知识融合！
Knowledge Distillation：知识蒸馏最初被提出用于模型压缩，包括在一个或多个教师模型的指导下训练学生模型。在NLP中已有较为广泛的应用。本文的方法与传统的知识蒸馏有显著的区别。首先，在传统的知识蒸馏中，学生模型通常被限制为比教师更小的尺寸。然而，在本文的场景中，目标模型的大小没有限制。其次，传统的知识蒸馏通常会导致学生模型在蒸馏后落后于教师的表现。 -2 7B中。如上表所示：蒸馏模型在所有基准测试中都优于原始的Llama2 7B，证明了知识蒸馏的有效性。与FuseLLM相比，Llama-2 KD实现的改进相对适中。这表明FuseLLM 通过通过连续训练集成三个具有不同架构的7B模型来实现的卓越性能超过了简单地从单个13B模型中提取知识的好处。
1.2K11编辑于 2024-01-31
来自专栏python学习教程
Python入门课程7大知识点讲解！
Python基础入门课程包含的内容：变量，运算符，输入输出和条件以及循环语句等知识点，认识Python，学习第一个Python程序，注释和Python2的中文问题，变量以及类型转换，标识符、关键字以及驼峰命名法
68950发布于 2021-04-23
AI 大模型知识管理平台：让企业知识“活”起来
基于 AI 大模型的知识管理平台正彻底改变这一现状，让知识真正流动起来，成为驱动企业创新的活水源头。图片什么是 AI 大模型知识管理平台？核心技术：RAG 如何让大模型更“懂”企业？AI 知识管理平台的核心技术是检索增强生成（RAG）。这一技术巧妙结合了信息检索和大语言模型生成的优势。当用户提问时，平台会先在知识库中检索相关信息，然后将这些信息作为上下文提供给大模型，最终生成精准可靠的答案。这种方法既利用了大模型的强大理解能力，又确保了回答内容基于企业权威知识，有效避免了常见的大模型“幻觉”问题。例如，潍柴集团通过此类平台，在客服场景中实现了94% 的问答准确率，大幅提升了工作效率。结语AI 大模型知识管理平台不仅是技术工具，更是企业智能化转型的核心基础设施。它让知识从静态存储变为动态资源，从成本中心转化为价值引擎。对于技术社区而言，这一领域充满创新机遇。
41610编辑于 2025-10-11
来自专栏创作是最好的自我投资
知识蒸馏：让大模型“瘦身”的魔法
AI界的“知识浓缩术”核心定义蒸馏模型（Distillation Model）是一种通过“师生教学”的方式，将庞大复杂的大模型（教师模型）中的核心知识，“浓缩”到轻量级小模型（学生模型）中的技术。传统训练 vs 知识蒸馏传统训练：学生模型就是直接从数据中学习（如同自学），需要大模型自己从海量数据中提取自己需要的信息，就像你想上学，但是没有资金支持，只能自己通过书籍来学习，那么在没有人指导的情况下对于大模型来说，通常的数据训练只能保证在通常情景下的问题回答，在涉及到一些相对专业的领域往往回答效果就不是太好，这个时候就需要进行微调优化，比如对特定领域进行特定数据的训练，从而提高在特定领域的回答准确性未来展望：蒸馏模型将如何改变AI？边缘计算革命：智能音箱、摄像头等设备将具备本地大模型能力。就像把大模型拆解成无数"小模型"，从而在手机、摄像头、工厂机器人甚至红绿灯里就地处理数据。通过在智能终端增加大模型能力，从而使得智能家居不联网也能听懂指令。这也就意味着让数据不再拥堵在"云端高速公路"，从而既保护隐私又省电，像给大模型装上会思考的"神经末梢"。
1K30编辑于 2025-04-09
大模型+知识库rag项目架构
在AI领域，“大模型”通常指的是具有大量参数的深度学习模型，它们能够处理复杂的任务，如自然语言处理（NLP）、图像识别等。而“知识库”则是指存储大量结构化或半结构化数据的系统，这些数据可以用于支持决策、提供信息查询等服务。将大模型与知识库结合的项目架构（RAG项目架构）可能指的是一种结合了检索（Retrieval）和生成（Generation）的架构，即RAG（Retrieval-Augmented Generation RAG架构的一般流程如下：检索阶段（Retrieval）：首先，系统会从知识库中检索出与输入查询相关的信息。这可以通过关键词匹配、语义搜索或其他相关性度量来实现。例如，检索系统可以使用不同的搜索引擎或推荐系统，而生成模型可以是传统的语言模型，也可以是专门为特定任务训练的模型。
1K10编辑于 2024-04-19
来自专栏技术丛林大冒险
基于大语言模型构建知识问答系统
本文探索使用大语言模型（Large Language Model, LLM），通过其对自然语言理解和生成的能力，揣摩用户意图，并对原始知识点进行汇总、整合，生成更贴切的答案。从大语言模型（Large Language Model, LLM）角度而言，上面的需求是在两阶段训练模式下，面向下游场景进行适配的问题。与普通搜索结合，使用基础模型对搜索结果加工。Fine-Tuning使用下游特定领域的知识对基础模型进行微调，改变神经网络中参数的权重。 Alpaca 是在 Meta 提出的 LLaMA 7B 模型基础上微调的结果。原生的 Alpaca 对中文的支持并不好，不过已经业界也做了些扩充中文词表的开源方案。消耗的资源量虽然相对大模型预训练减少，但还是不容小觑的。比如Alpaca 的微调，据作者介绍他们使用8 个显存80GB A100 ，花费了 3 个小时。
7K85编辑于 2023-05-08
来自专栏老张的求知思考世界
性能测试知识科普(六)：三大模型
今天的这篇文章是性能测试知识科普的第六篇，我会聊聊在实际工作中开展性能测试，前期最核心的工作。即业务模型、流量模型和数据模型这三大模型，该如何评估和建立。为了便于大家理解三大模型，我会以电商业务下单的场景来举例说明，如下图：业务模型大家可以将业务模型看作功能测试中的业务场景。生产环境全链路压测场景针对生产集群的全链路压测，常见的案例就是双11电商大促。；构建流量模型下面是之前我实际工作中一次双11大促时的流量模型构建案例，仅供参考。预估大促时的支付转化率为60%，则可得：大促峰值订单支付QPS为（200/40%）*60%*（200W/50W）=1200QPS。
1.6K20编辑于 2023-03-01
来自专栏《活动征集》
DeepSeek大模型的基础知识解析!
作为一款国产大模型，DeepSeek不仅在技术上做出了突破，还承载着国产AI的雄心壮志。很多人对大模型可能还抱有一丝困惑，尤其是像 DeepSeek 这样的模型。那么，DeepSeek究竟是什么？前言：DeepSeek，国产大模型的代表近年来，随着深度学习的迅猛发展，大模型成为人工智能领域的主流。 DeepSeek 作为国产大模型的佼佼者，不仅仅代表了技术上的创新，也象征着中国在 AI 领域日益崛起的竞争力。但许多人可能会疑问，“什么是大模型？” “DeepSeek 怎么与我们常见的 AI 模型不同？” “它到底是怎么工作的？” 别担心！在这篇文章中，我们将带你一探究竟。预训练与微调：模型的“养成”之路 DeepSeek 采用了预训练 + 微调的训练方式。首先，模型在大规模的无标签数据上进行预训练，学习通用的知识和规律。
82321编辑于 2025-02-08
来自专栏从流域到海域
大模型基础知识 - 语言模型及其演进公开版
接下来我们来从0到1了解一下大语言模型背后的基础知识。导语通过本节课程，希望大家能够了解：语言模型的数学基础：概率语言模型（25分钟）神经网络语言模型的发展历史：即大语言模型是如何发展而来的（10分钟） GPT训练流程：大语言模型是如何训练的（ Scaling Laws for Neural Language Models 神经网络语言模型发展史 nlp中的预训练语言模型总结(单向模型、BERT系列模型、XLNet) 大模型时代之前，大语言模型的雏形出现。随着神经网络语言模型的参数量继续增大到一个千亿级别，开始表现出强大的涌现能力，辅以instruction fituning和RLHF的（大语言模型）训练流程改进，突破性的大语言模型ChatGPT出现，大模型时代来临
77630编辑于 2023-10-12
来自专栏NLP/KG
LLM 大模型学习必知必会系列(一)：大模型基础知识篇
2023 年 6 月，百川首先在魔搭社区发布了百川 - 7B 模型，baichuan-7B 是由百川智能开发的一个开源的大规模预训练模型。 2023 年 7 月，上海人工智能实验室在 WAIC 2023 开幕式和科学前沿全体会议上，联合多家机构发布全新升级的 “书生通用大模型体系”，包括书生 · 多模态、书生 · 浦语和书生 · 天际等三大基础模型，以及首个面向大模型研发与应用的全链条开源体系。然而，针对大语言模型，我们希望更好的使用 LLM，让 LLM 更好的遵循我们的指令，按照我们可控的方式和特定行业的知识输出答案。检索增强生成 (RAG) 通过整合来自外部数据库的知识成为一个有前途的解决方案，这增强了模型的准确性和可信度，特别是对于知识密集型任务，并且允许知识的不断更新和整合特定领域的信息。
4.3K512编辑于 2024-05-11
来自专栏大模型应用
大模型应用：大模型参数调优：结合本地模型对比多种组合探索差异.7
引言在大模型的应用中，参数调优是连接模型潜力与实际效能的关键桥梁。与传统的软件参数不同，大模型的生成参数更像是一组精密的调控旋钮，它们不改变模型的基础知识，而是影响模型如何思考和表达。理解这些参数的本质，不仅能够提升模型输出的质量，更是将大模型从玩具转变为工具的关键一步。今天我们将从理论基础到实践应用，全面解析大模型的核心参数体系，详细的介绍大模型推理中常用的参数项，并通过本地模型示例展示参数调整对模型效能的影响。常见参数项：max_length：生成文本的最大长度。 Dict, Anyimport pandas as pdfrom modelscope import snapshot_downloadclass ModelParameterTester: """大模型参数测试器分步调优流程图五、总结大模型的参数调优本质上是在控制与释放之间寻找平衡的艺术。
70632编辑于 2026-02-04
AI 大语言模型知识图谱：让模型“更懂知识、更聪明、更可信”
在传统的大模型训练方式中，知识依赖海量语料“读出来”，但容易出现知识碎片化、逻辑断层、更新不及时的问题；模型回答看似流畅，却可能犯事实性错误或在复杂推理上“卡住”。而 AI 大语言模型知识图谱，就是用结构化、逻辑化、可计算的技术体系，为大模型安装一套“知识骨架”，让模型不仅会说，还真正“懂知识、会推理、能更新”。知识不再是散乱的语句，而是能够被计算机理解和逻辑推演的网络。二是知识图谱 + 大模型协同推理，让模型“更准、更稳、更懂逻辑”。，大模型在聊天、问答、检索、写作等场景都能调用同一套知识图谱，实现一致的知识标准。 AI 大语言模型知识图谱，用知识抽取、结构建模、图谱推理和动态更新，让模型从“会说话”走向“会理解”。它不仅提升模型的准确性与稳定性，也为专业场景提供真正可用的 AI 智能。
55610编辑于 2025-11-18
来自专栏GiantPandaCV
星辰AI大模型TeleChat-7B评测
前言受中电信 AI 科技有限公司的邀请，为他们近期开源的TeleChat-7B大模型做一个评测。最后，我们可以从TeleChat-7B开源项目在文创方面展示的例子看到它具有不错的文创能力和一定的代码能力，可以作为开发者来使用的一个不错的基础大模型。在评论评语方面，TeleChat7B可能是因为SFT的缘故会拒答一些问题，以及对于上面的第二个prompt回答的质量比较低。而对于上面的第一个问题，也出现了经典的大模型幻觉问题。总结总的来说，TeleChat-7B具有一定的文创能力和代码能力，对于本次测试的大多数prompt可以生成较为合理的答案。但模型本身也存在大模型幻觉，指令跟随能力一般以及回答有概率重复的问题。此外，TeleChat-7B在开源方面是相当有诚意的，将清洗之后的训练数据进行开源是在之前的大模型开源中比较难见到的，如果想了解更多的数据清洗细节以及模型训练的细节可以阅读官方放出的技术报告：https
67320编辑于 2024-02-22
来自专栏数智转型架构师
一文秒懂大模型硬件知识
自从一头扎进AI大模型的奇妙世界，你是不是也曾有过这样的经历：刚刚弄明白“提示词”（Prompt）怎么写，一扭头就撞上了一堵“硬件墙”。训练一个大模型 = 建造一艘航空母舰所有的硬件术语，我们都可以在这个“造航母”的过程中找到它们的位置。模型参数、计算数据这些“零件”，必须先搬到工作台上才能开始组装。为什么总说“显存不够”？因为大模型的“零件”（参数）实在太多了！训练真正的大模型，需要几百上千台服务器（几千上万块GPU）一起工作。这就好比一个巨大的造船工业园，里面有无数个车间。InfiniBand就是连接这些不同车间的“高铁物流系统”。怎么工作？你不需要记住每一个细节，只需要理解这个“造航母”的大框架。下次当再有人讨论AI硬件时，你的脑海里浮现的不再是冰冷的代码和缩写，而是一个热火朝天的、宏伟的工业图景。
27110编辑于 2025-12-30
大模型下半场：7个趋势判断
虽然去年以来，我国AI高端芯片企业数量和能力均有提升，华为、燧原科技、摩尔线程、海光、壁仞等多家企业已设计出对标英伟达A100单卡性能的国产芯片，但由于台积电暂停7nm产能供应及HBM禁令等限制，国产高端芯片的制造仍面临挑战四、“后真相”时代，打造可信大模型迫在眉睫技术对知识信息的影响，第一次从传播和交互环节向前延伸到生产环节。大模型知识输出的精准度、专业度，即大模型的“可信度”，正在成为人工智能的核心竞争指标。引入权威的图书、杂志、新闻资讯、论文等优质内容数据，并打造新的、“可信”的知识共识机制和供应体系，是大模型未来在生产、生活应用领域产生更大价值的关键所在。既能实现类似脚注尾注、文献索引等传统知识溯源机制的迁移，确保输出知识的共识性、准确性，也将为出版机构和大模型平台带来可持续共赢的模式。以深圳宝安政务大模型应用为例，已覆盖民生诉求、企业服务、政务办公、社会治理等31个业务场景，覆盖全区14个领域、20个行业近3万余条政府服务知识，整合了60多种模型能力，并可结合业务场景需要快速部署新的智能应用
59320编辑于 2025-04-02
来自专栏哆哆Excel
Thinkphp6（7）模型学习与知识总结（三）
Thinkphp6（7）模型学习与知识总结（三）继续学习模型的知识，上节课已学习到的知识有查询、软删除、自动时间戳。今天来学习: 1.数据更新， 2. 批量更新数据可以使用saveAll方法批量更新数据，只需要在批量更新的数据中包含主键即可， 7. 直接更新（静态方法）使用模型的静态update方法更新： User::update(['name' => 'thinkphp'], ['id' => 1]); 模型的update方法返回模型的对象实例，打印输出的是修改后的数据了，那我想输出原来的数据，怎么办呢：用getData方法 ◆模型的修改器模型修改器的作用,就是对模型设置对象的值进行处理比如,我们要新増数据的时候,对数据就行格式化、过滤、 strtoupper(Svalue)} .除了新增,会调用修改器,修改更新也会触发修改器 .模型修改器只对模型方法有效,调用数据库的方法是无效的, 比如-> insert(); ===学习测试===
1.2K20编辑于 2022-10-25
来自专栏流川疯编写程序的艺术
《书生·浦语大模型实战营》第7课学习笔记：OpenCompass 大模型评测实战
0.背景知识与简介为什么要研究大模型的评测？百家争鸣，百花齐放。首先，研究评测对于我们全面了解大型语言模型的优势和限制至关重要。评测对象本算法库的主要评测对象为语言大模型与多模态大模型。我们以语言大模型为例介绍评测的具体模型类型。在模型通用能力方面，从语言、知识、理解、推理、安全等多个能力维度进行评测。在特色能力方面，从长文本、代码、工具、知识增强等维度进行评测。 C-Eval 数据集上的性能其他学习内容参考文献本人学习系列笔记《书生·浦语大模型实战营》第1课学习笔记：书生·浦语大模型全链路开源体系《书生·浦语大模型实战营》第2课学习笔记：轻松玩转书生 /article/details/138811450 本人博客：基于大语言模型的本地知识库问答系统构建方案
76810编辑于 2024-07-01

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

AI大模型知识库

详解：7大经典回归模型

基于大模型、SKills 的知识管理

FuseLLM：大语言模型的知识融合！

Python入门课程7大知识点讲解！

AI 大模型知识管理平台：让企业知识“活”起来

知识蒸馏：让大模型“瘦身”的魔法

大模型+知识库rag项目架构

基于大语言模型构建知识问答系统

性能测试知识科普(六)：三大模型

DeepSeek大模型的基础知识解析!

大模型基础知识 - 语言模型及其演进公开版

LLM 大模型学习必知必会系列(一)：大模型基础知识篇

大模型应用：大模型参数调优：结合本地模型对比多种组合探索差异.7

AI 大语言模型知识图谱：让模型“更懂知识、更聪明、更可信”

星辰AI大模型TeleChat-7B评测

一文秒懂大模型硬件知识

大模型下半场：7个趋势判断

Thinkphp6（7）模型学习与知识总结（三）

《书生·浦语大模型实战营》第7课学习笔记：OpenCompass 大模型评测实战

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

AI大模型知识库

详解：7大经典回归模型

基于大模型、SKills 的知识管理

FuseLLM：大语言模型的知识融合！

Python入门课程7大知识点讲解！

AI 大模型知识管理平台：让企业知识“活”起来

知识蒸馏：让大模型“瘦身”的魔法

大模型+知识库rag项目架构

基于大语言模型构建知识问答系统

性能测试知识科普(六)：三大模型

DeepSeek大模型的基础知识解析!

大模型基础知识 - 语言模型及其演进 公开版

LLM 大模型学习必知必会系列(一)：大模型基础知识篇

大模型应用：大模型参数调优：结合本地模型对比多种组合探索差异.7

AI 大语言模型知识图谱：让模型“更懂知识、更聪明、更可信”

星辰AI大模型TeleChat-7B评测

一文秒懂大模型硬件知识

大模型下半场：7个趋势判断

Thinkphp6（7）模型学习与知识总结（三）

《书生·浦语大模型实战营》第7课 学习笔记：OpenCompass 大模型评测实战

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

大模型基础知识 - 语言模型及其演进公开版

《书生·浦语大模型实战营》第7课学习笔记：OpenCompass 大模型评测实战