首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • AI模型知识

    而基于AI模型构建的知识库系统,通过自然语言处理技术和深度学习算法,能够自动完成文本解析、语义关联与智能检索,使分散的知识资源形成有机网络,为企业知识管理带来革命性变革。 相较于传统方案,AI模型知识库在技术特性上展现出显著优势:语义理解深度方面,传统方案依赖关键词匹配,误差率高,而AI方案具备上下文感知能力,准确率超92%;更新维护成本上,传统方案人工录入月均耗时120h 二、典型应用场景落地AI模型知识库在多场景落地应用,创造显著价值:智能问答机器人可7×24小时解答员工关于政策制度、操作流程的咨询,某金融机构部署后人力咨询量下降47%,提升咨询响应效率;辅助决策沙盘整合市场动态 三、实施路径规划建议成功部署AI模型知识库需经历三个阶段:首先是领域定制化训练,使用企业专属语料对基座模型进行调优,确保模型适配企业业务场景;其次是人机协同校验机制建立,通过人工复核保障输出内容的合规性与准确性 五、未来演进方向展望随着多模态融合技术的发展,下一代AI模型知识库将突破文本局限,实现图纸三维模型与操作视频的联动检索,拓展知识呈现与应用形式。

    51410编辑于 2025-10-16
  • 来自专栏数据派THU

    详解:7经典回归模型

    来源:csdn 深度学习爱好者本文约2900字,建议阅读5分钟本文给大家介绍机器学习建模中7经典的回归分析模型。 什么是回归分析? 4.它需要的样本量,因为在样本数量较少的情况下,极大似然估计的效果比普通的最小二乘法差。 5.自变量不应该相互关联的,即不具有多重共线性。 7.如果因变量是多类的话,则称它为多元逻辑回归。 3. Polynomial Regression多项式回归 对于一个回归方程,如果自变量的指数大于1,那么它就是多项式回归方程。 7. ElasticNet回归 ElasticNet是Lasso和Ridge回归技术的混合体。它使用L1来训练并且L2优先作为正则化矩阵。当有多个相关的特征时,ElasticNet是很有用的。 除了这7个最常用的回归技术,你也可以看看其他模型,如Bayesian、Ecological和Robust回归。 如何正确选择回归模型? 当你只知道一个或两个技术时,生活往往很简单。

    1.7K41编辑于 2023-04-18
  • 来自专栏机器学习与统计学

    基于模型、SKills 的知识管理

    整个系统的架构可以拆成五个模块: Karpathy 知识库系统:五模块 1. 数据导入(Data Import) 把各种原始素材——论文、文章、代码库、数据集、图片——统统丢进 raw/ 目录。 这点我必须插一嘴——40 万字对现在的长上下文模型来说真不算什么。 Gemini 的百万 token 窗口,Claude 的 200K 上下文,处理这个量级的知识库绑绑有余。 这种场景下知识库方法的优势更明显——你不可能把所有领域的知识都记在脑子里。 最炸裂的用法——跑步语音播客:Lex 会让系统为特定主题生成一个临时的迷你知识库,加载进 LLM,然后在 7-10 英里的长跑中开启语音模式。 40 万字知识库微调一个专属的小模型,让它从骨子里"理解"你的领域知识和思考方式。

    21720编辑于 2026-04-13
  • 来自专栏深度学习自然语言处理

    FuseLLM:语言模型知识融合!

    Knowledge Distillation:知识蒸馏最初被提出用于模型压缩,包括在一个或多个教师模型的指导下训练学生模型。在NLP中已有较为广泛的应用。本文的方法与传统的知识蒸馏有显著的区别。 首先,在传统的知识蒸馏中,学生模型通常被限制为比教师更小的尺寸。然而,在本文的场景中,目标模型的大小没有限制。其次,传统的知识蒸馏通常会导致学生模型在蒸馏后落后于教师的表现。 -2 7B中。 如上表所示: 蒸馏模型在所有基准测试中都优于原始的Llama2 7B,证明了知识蒸馏的有效性。 与FuseLLM相比,Llama-2 KD实现的改进相对适中。 这表明FuseLLM 通过通过连续训练集成三个具有不同架构的7B模型来实现的卓越性能超过了简单地从单个13B模型中提取知识的好处。

    1.2K11编辑于 2024-01-31
  • 来自专栏python学习教程

    Python入门课程7知识点讲解!

    Python基础入门课程包含的内容:变量,运算符,输入输出和条件以及循环语句等知识点,认识Python,学习第一个Python程序,注释和Python2的中文问题,变量以及类型转换,标识符、关键字以及驼峰命名法

    68950发布于 2021-04-23
  • AI 模型知识管理平台:让企业知识“活”起来

    基于 AI 模型知识管理平台正彻底改变这一现状,让知识真正流动起来,成为驱动企业创新的活水源头。图片什么是 AI 模型知识管理平台? 核心技术:RAG 如何让模型更“懂”企业?AI 知识管理平台的核心技术是检索增强生成(RAG)。这一技术巧妙结合了信息检索和语言模型生成的优势。 当用户提问时,平台会先在知识库中检索相关信息,然后将这些信息作为上下文提供给模型,最终生成精准可靠的答案。 这种方法既利用了模型的强大理解能力,又确保了回答内容基于企业权威知识,有效避免了常见的模型“幻觉”问题。例如,潍柴集团通过此类平台,在客服场景中实现了94% 的问答准确率,大幅提升了工作效率。 结语AI 模型知识管理平台不仅是技术工具,更是企业智能化转型的核心基础设施。它让知识从静态存储变为动态资源,从成本中心转化为价值引擎。对于技术社区而言,这一领域充满创新机遇。

    41610编辑于 2025-10-11
  • 来自专栏创作是最好的自我投资

    知识蒸馏:让模型“瘦身”的魔法

    AI界的“知识浓缩术”核心定义蒸馏模型(Distillation Model)是一种通过“师生教学”的方式,将庞大复杂的模型(教师模型)中的核心知识,“浓缩”到轻量级小模型(学生模型)中的技术。 传统训练 vs 知识蒸馏传统训练:学生模型就是直接从数据中学习(如同自学),需要模型自己从海量数据中提取自己需要的信息,就像你想上学,但是没有资金支持,只能自己通过书籍来学习,那么在没有人指导的情况下 对于模型来说,通常的数据训练只能保证在通常情景下的问题回答,在涉及到一些相对专业的领域往往回答效果就不是太好,这个时候就需要进行微调优化,比如对特定领域进行特定数据的训练,从而提高在特定领域的回答准确性 未来展望:蒸馏模型将如何改变AI?边缘计算革命:智能音箱、摄像头等设备将具备本地大模型能力。就像把模型拆解成无数"小模型",从而在手机、摄像头、工厂机器人甚至红绿灯里就地处理数据。 通过在智能终端增加大模型能力,从而使得智能家居不联网也能听懂指令。这也就意味着让数据不再拥堵在"云端高速公路",从而既保护隐私又省电,像给模型装上会思考的"神经末梢"。

    1K30编辑于 2025-04-09
  • 模型+知识库rag项目架构

    在AI领域,“模型”通常指的是具有大量参数的深度学习模型,它们能够处理复杂的任务,如自然语言处理(NLP)、图像识别等。 而“知识库”则是指存储大量结构化或半结构化数据的系统,这些数据可以用于支持决策、提供信息查询等服务。 将模型知识库结合的项目架构(RAG项目架构)可能指的是一种结合了检索(Retrieval)和生成(Generation)的架构,即RAG(Retrieval-Augmented Generation RAG架构的一般流程如下:检索阶段(Retrieval):首先,系统会从知识库中检索出与输入查询相关的信息。这可以通过关键词匹配、语义搜索或其他相关性度量来实现。 例如,检索系统可以使用不同的搜索引擎或推荐系统,而生成模型可以是传统的语言模型,也可以是专门为特定任务训练的模型

    1K10编辑于 2024-04-19
  • 来自专栏技术丛林大冒险

    基于语言模型构建知识问答系统

    本文探索使用语言模型(Large Language Model, LLM),通过其对自然语言理解和生成的能力,揣摩用户意图,并对原始知识点进行汇总、整合,生成更贴切的答案。 从语言模型(Large Language Model, LLM)角度而言,上面的需求是在两阶段训练模式下,面向下游场景进行适配的问题。 与普通搜索结合,使用基础模型对搜索结果加工。Fine-Tuning使用下游特定领域的知识对基础模型进行微调,改变神经网络中参数的权重。 Alpaca 是在 Meta 提出的 LLaMA 7B 模型基础上微调的结果。原生的 Alpaca 对中文的支持并不好,不过已经业界也做了些扩充中文词表的开源方案。 消耗的资源量虽然相对模型预训练减少,但还是不容小觑的。比如Alpaca 的微调,据作者介绍他们使用8 个 显存80GB A100 ,花费了 3 个小时。

    7K85编辑于 2023-05-08
  • 来自专栏老张的求知思考世界

    性能测试知识科普(六):三模型

    今天的这篇文章是性能测试知识科普的第六篇,我会聊聊在实际工作中开展性能测试,前期最核心的工作。即业务模型、流量模型和数据模型这三模型,该如何评估和建立。 为了便于大家理解三模型,我会以电商业务下单的场景来举例说明,如下图: 业务模型 大家可以将业务模型看作功能测试中的业务场景。 生产环境全链路压测场景 针对生产集群的全链路压测,常见的案例就是双11电商促。 ; 构建流量模型 下面是之前我实际工作中一次双11促时的流量模型构建案例,仅供参考。 预估促时的支付转化率为60%,则可得:促峰值订单支付QPS为(200/40%)*60%*(200W/50W)=1200QPS。

    1.6K20编辑于 2023-03-01
  • 来自专栏《活动征集》

    DeepSeek模型的基础知识解析!

    作为一款国产模型,DeepSeek不仅在技术上做出了突破,还承载着国产AI的雄心壮志。很多人对模型可能还抱有一丝困惑,尤其是像 DeepSeek 这样的模型。那么,DeepSeek究竟是什么? 前言:DeepSeek,国产模型的代表   近年来,随着深度学习的迅猛发展,模型成为人工智能领域的主流。 DeepSeek 作为国产模型的佼佼者,不仅仅代表了技术上的创新,也象征着中国在 AI 领域日益崛起的竞争力。 但许多人可能会疑问,“什么是模型?” “DeepSeek 怎么与我们常见的 AI 模型不同?” “它到底是怎么工作的?” 别担心!在这篇文章中,我们将带你一探究竟。 预训练与微调:模型的“养成”之路   DeepSeek 采用了 预训练 + 微调 的训练方式。首先,模型在大规模的无标签数据上进行 预训练,学习通用的知识和规律。

    82321编辑于 2025-02-08
  • 来自专栏从流域到海域

    模型基础知识 - 语言模型及其演进 公开版

    接下来我们来从0到1了解一下语言模型背后的基础知识。 导语 通过本节课程,希望大家能够了解: 语言模型的数学基础:概率语言模型 (25分钟) 神经网络语言模型的发展历史:即语言模型是如何发展而来的 (10分钟) GPT训练流程:语言模型是如何训练的 ( Scaling Laws for Neural Language Models 神经网络语言模型发展史 nlp中的预训练语言模型总结(单向模型、BERT系列模型、XLNet) 模型时代之前 ,语言模型的雏形出现。 随着神经网络语言模型的参数量继续增大到一个千亿级别,开始表现出强大的涌现能力,辅以instruction fituning和RLHF的(语言模型)训练流程改进,突破性的语言模型ChatGPT出现,模型时代来临

    77630编辑于 2023-10-12
  • 来自专栏NLP/KG

    LLM 模型学习必知必会系列(一):模型基础知识

    2023 年 6 月,百川首先在魔搭社区发布了百川 - 7B 模型,baichuan-7B 是由百川智能开发的一个开源的大规模预训练模型。 2023 年 7 月,上海人工智能实验室在 WAIC 2023 开幕式和科学前沿全体会议上,联合多家机构发布全新升级的 “书生通用模型体系”,包括书生 · 多模态、书生 · 浦语和书生 · 天际等三基础模型 ,以及首个面向模型研发与应用的全链条开源体系。 然而,针对语言模型,我们希望更好的使用 LLM,让 LLM 更好的遵循我们的指令,按照我们可控的方式和特定行业的知识输出答案。 检索增强生成 (RAG) 通过整合来自外部数据库的知识成为一个有前途的解决方案,这增强了模型的准确性和可信度,特别是对于知识密集型任务,并且允许知识的不断更新和整合特定领域的信息。

    4.3K512编辑于 2024-05-11
  • 来自专栏大模型应用

    模型应用:模型参数调优:结合本地模型对比多种组合探索差异.7

    引言 在模型的应用中,参数调优是连接模型潜力与实际效能的关键桥梁。与传统的软件参数不同,模型的生成参数更像是一组精密的调控旋钮,它们不改变模型的基础知识,而是影响模型如何思考和表达。 理解这些参数的本质,不仅能够提升模型输出的质量,更是将模型从玩具转变为工具的关键一步。 今天我们将从理论基础到实践应用,全面解析模型的核心参数体系,详细的介绍模型推理中常用的参数项,并通过本地模型示例展示参数调整对模型效能的影响。常见参数项:max_length:生成文本的最大长度。 Dict, Anyimport pandas as pdfrom modelscope import snapshot_downloadclass ModelParameterTester: """模型参数测试器 分步调优流程图五、总结 模型的参数调优本质上是在控制与释放之间寻找平衡的艺术。

    70632编辑于 2026-02-04
  • AI 语言模型知识图谱:让模型“更懂知识、更聪明、更可信”

    在传统的模型训练方式中,知识依赖海量语料“读出来”,但容易出现知识碎片化、逻辑断层、更新不及时的问题;模型回答看似流畅,却可能犯事实性错误或在复杂推理上“卡住”。 而 AI 语言模型知识图谱,就是用结构化、逻辑化、可计算的技术体系,为模型安装一套“知识骨架”,让模型不仅会说,还真正“懂知识、会推理、能更新”。 知识不再是散乱的语句,而是能够被计算机理解和逻辑推演的网络。二是知识图谱 + 模型协同推理,让模型“更准、更稳、更懂逻辑”。 ,模型在聊天、问答、检索、写作等场景都能调用同一套知识图谱,实现一致的知识标准。 AI 语言模型知识图谱,用知识抽取、结构建模、图谱推理和动态更新,让模型从“会说话”走向“会理解”。它不仅提升模型的准确性与稳定性,也为专业场景提供真正可用的 AI 智能。

    55610编辑于 2025-11-18
  • 来自专栏GiantPandaCV

    星辰AI模型TeleChat-7B评测

    前言 受中电信 AI 科技有限公司的邀请,为他们近期开源的TeleChat-7B模型做一个评测。 最后,我们可以从TeleChat-7B开源项目在文创方面展示的例子看到它具有不错的文创能力和一定的代码能力,可以作为开发者来使用的一个不错的基础模型。 在评论评语方面,TeleChat7B可能是因为SFT的缘故会拒答一些问题,以及对于上面的第二个prompt回答的质量比较低。而对于上面的第一个问题,也出现了经典的模型幻觉问题。 总结 总的来说,TeleChat-7B具有一定的文创能力和代码能力,对于本次测试的大多数prompt可以生成较为合理的答案。但模型本身也存在模型幻觉,指令跟随能力一般以及回答有概率重复的问题。 此外,TeleChat-7B在开源方面是相当有诚意的,将清洗之后的训练数据进行开源是在之前的模型开源中比较难见到的,如果想了解更多的数据清洗细节以及模型训练的细节可以阅读官方放出的技术报告:https

    67320编辑于 2024-02-22
  • 来自专栏数智转型架构师

    一文秒懂模型硬件知识

    自从一头扎进AI模型的奇妙世界,你是不是也曾有过这样的经历: 刚刚弄明白“提示词”(Prompt)怎么写,一扭头就撞上了一堵“硬件墙”。 训练一个模型 = 建造一艘航空母舰 所有的硬件术语,我们都可以在这个“造航母”的过程中找到它们的位置。 模型参数、计算数据这些“零件”,必须先搬到工作台上才能开始组装。 为什么总说“显存不够”? 因为模型的“零件”(参数)实在太多了! 训练真正的模型,需要几百上千台服务器(几千上万块GPU)一起工作。这就好比一个巨大的造船工业园,里面有无数个车间。InfiniBand就是连接这些不同车间的“高铁物流系统”。 怎么工作? 你不需要记住每一个细节,只需要理解这个“造航母”的框架。下次当再有人讨论AI硬件时,你的脑海里浮现的不再是冰冷的代码和缩写,而是一个热火朝天的、宏伟的工业图景。

    27110编辑于 2025-12-30
  • 模型下半场:7个趋势判断

    虽然去年以来,我国AI高端芯片企业数量和能力均有提升,华为、燧原科技、摩尔线程、海光、壁仞等多家企业已设计出对标英伟达A100单卡性能的国产芯片,但由于台积电暂停7nm产能供应及HBM禁令等限制,国产高端芯片的制造仍面临挑战 四、“后真相”时代,打造可信模型迫在眉睫技术对知识信息的影响,第一次从传播和交互环节向前延伸到生产环节。模型知识输出的精准度、专业度,即模型的“可信度”,正在成为人工智能的核心竞争指标。 引入权威的图书、杂志、新闻资讯、论文等优质内容数据,并打造新的、“可信”的知识共识机制和供应体系,是模型未来在生产、生活应用领域产生更大价值的关键所在。 既能实现类似脚注尾注、文献索引等传统知识溯源机制的迁移,确保输出知识的共识性、准确性,也将为出版机构和模型平台带来可持续共赢的模式。 以深圳宝安政务模型应用为例,已覆盖民生诉求、企业服务、政务办公、社会治理等31个业务场景,覆盖全区14个领域、20个行业近3万余条政府服务知识,整合了60多种模型能力,并可结合业务场景需要快速部署新的智能应用

    59320编辑于 2025-04-02
  • 来自专栏哆哆Excel

    Thinkphp6(7模型学习与知识总结(三)

    Thinkphp6(7模型学习与知识总结(三) 继续学习模型知识,上节课已学习到的知识有查询、软删除、自动时间戳。 今天来学习: 1.数据更新, 2. 批量更新数据 可以使用saveAll方法批量更新数据,只需要在批量更新的数据中包含主键即可, 7. 直接更新(静态方法) 使用模型的静态update方法更新: User::update(['name' => 'thinkphp'], ['id' => 1]); 模型的update方法返回模型的对象实例 ,打印输出的是修改后的数据了,那我想输出原来的数据,怎么办呢:用getData方法 ◆模型的修改器 模型修改器的作用,就是对模型设置对象的值进行处理比如,我们要新増数据的时候,对数据就行格式化、过滤、 strtoupper(Svalue)} .除了新增,会调用修改器,修改更新也会触发修改器 .模型修改器只对模型方法有效,调用数据库的方法是无效的, 比如-> insert(); ===学习测试===

    1.2K20编辑于 2022-10-25
  • 来自专栏流川疯编写程序的艺术

    《书生·浦语模型实战营》第7课 学习笔记:OpenCompass 模型评测实战

    0.背景知识与简介 为什么要研究模型的评测? 百家争鸣,百花齐放。 首先,研究评测对于我们全面了解大型语言模型的优势和限制至关重要。 评测对象 本算法库的主要评测对象为语言模型与多模态模型。我们以语言模型为例介绍评测的具体模型类型。 在模型通用能力方面,从语言、知识、理解、推理、安全等多个能力维度进行评测。在特色能力方面,从长文本、代码、工具、知识增强等维度进行评测。 C-Eval 数据集上的性能 其他学习内容 参考文献 本人学习系列笔记 《书生·浦语模型实战营》第1课 学习笔记:书生·浦语模型全链路开源体系 《书生·浦语模型实战营》第2课 学习笔记:轻松玩转书生 /article/details/138811450 本人博客: 基于语言模型的本地知识库问答系统构建方案

    76810编辑于 2024-07-01
领券