首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏LLVM

    一文穿模型核心概念

    一文穿模型核心概念模型的技术体系看似复杂,实则能按核心逻辑层层拆解:最初,人们以“万物皆函数(Function)”为起点,先尝试用符号主义(Symbolism)解释所有原理,随后转向联结主义(Connectionism 为提升匹配效率,知识库中的内容需先通过词嵌入(Embedding)转化为向量形式,存储到向量数据库(Vector Database)中;后续通过向量检索(Vector Search)对比词向量的相似, 当前函数的输出,是下个函数的输入 有了 输入层、隐藏层、输出层 ->神经网络Model (模型) 多个函数的组合Weight (权重) 模型内的参数,是一个抽象概念Large Mode (模型) 代表了模型内的参数特别 ,即模型LLM Large Language Model (语言模型 LLM ) 用于自然语言处理的模型Training (训练) 参数的调整过程Pretraining (预训练) 提前训练好的模型 ,将知识库存储在向量数据库中Embedding (词嵌入) 把文字转换成词向量的过程Vector Search (向量检索)对比词向量之间的相似,在向量数据库中找到相关问题的答案AI.

    1.3K14编辑于 2025-09-24
  • 来自专栏DT数据侠

    AI教你如何穿成“表姐”!

    “ 有一种病就是每天不知道“穿”什么好,在线买衣服不知道买哪一件好!我们称之为“选衣服困难症”。 这包括使用机器学习模型进行训练以及不同组员同时开发 Flask 应用。 每个帖子的点赞数的中位数反应了受欢迎程度,其中号称全球第一网红的Kylie Jenner比中位数多了600万(即为平均每一张图有600万点赞),所以下图没有包括她。 ? 作为最知名的话题模型,它将所有单词以及他们出现的次数作为输入,然后尝试在没有打标签的文档中找到结构或者话题。话题模型假设单词的使用与话题出现相关。 模型表现 验证数据组整体的 ROC 和PR曲线。整体的表现不错。然而,也有一些标签表现不好。下一阶段我们希望能更直观的用可视化的形式看到模型表现究竟如何。因此我们将模型放在AWS上。 ? ?

    86230发布于 2018-12-25
  • 来自专栏机器学习AI算法工程

    【开源】小满中文金融对话模型

    项目开源代码获取地址: 关注微信公众号 datayx 然后回复 小满 即可获取。 金融一直是轩辕模型重点关注的领域和主要应用目标,因此我们首先在金融场景评测了XuanYuan-6B模型。 除金融外,我们也注重轩辕模型的通用能力,因此我们也在多个主流评测集上进行了模型评测,观察轩辕模型在知识、逻辑、代码等通用能力上的表现。评测结果如下表所示。 评估对比对象为业界开源的类似尺寸的主流模型,我们并采用GSB(Good,Same,Bad)指标来展示评估结果,具体结果如下图所示。 从评测结果来看,XuanYuan-13B具备很强的通用能力和金融能力,其性能甚至可比肩更大尺寸的模型,做到了以小搏

    72910编辑于 2024-04-18
  • 来自专栏大模型应用

    模型应用:构建智能模型运维体系:模型健康监测系统实践.8

    引言 大型语言模型已成为各行各业的核心基础设施。从客户服务到内容创作,从代码生成到科学研究,模型正深度融入企业的核心业务流程。 传统的系统监控工具如Zabbix、Prometheus等虽然能监控基础硬件资源,但无法深入理解模型服务的特殊行为模式,无法感知模型推理的内在质量,更无法预测服务性能的潜在风险。 我们需要一套能够深入理解模型行为、实时感知服务状态、智能预警潜在风险的全方位健康监测体系。 今天我们将以模型健康监测系统为例,深度剖析现代模型运维平台的设计理念、技术实现与创新亮点。通过详细的流程分析、架构解读和实践场景说明,为构建智能化的模型运维体系提供完整的实践参考和技术路线图。 ): """智能性能评分算法 - 基于模型服务特性的专业评分体系""" score = 100 # 基准分数 # CPU性能 (权重: 25%) - 考虑到模型推理对CPU

    33543编辑于 2026-02-05
  • 来自专栏机器之心

    今天,语言模型革新百搜索

    集团副总裁、搜索平台负责人肖阳在万象大会的演讲中表示,得益于语义检索技术和语言模型,搜索迎来了奇点,出现了代际变革。  用百搜索,直接生成答案  3 月 16 日上线的「文心一言」是百对标 ChatGPT,竞争通用智能赛道的语言模型,它大幅拓宽了国内对话类 AI 产品的能力边界,一直备受人们的关注。 随着内测范围的铺开,大家体验到了文心一言的能力,又开始期待起它商用落地后的样子,语言模型加持的百搜索会是什么样?这次大会上,百展示了新版搜索引擎的三新能力。 ,百也能在搜索结果第一的位置给出模型生成的答案: ‍现在,搜索引擎给出的结果不仅是语言模型整理好的一段话,有回答有引用,而且还是多模态的,相关图片、视频都包含在内,你不再需要从搜索结果中浏览、花时间判断和总结了 最终,这款模型被应用在了百最核心的搜索业务上。如果说 ChatGPT、文心一言这样的模型是在让 AI 变大,那么现在改变格局的搜索重构,就是在让 AI 变小,让它变得人人可用。

    32820编辑于 2023-05-31
  • 来自专栏刘旷专栏

    模型重构行业,百网盘再度抢跑?

    配图来自Canva可画随着ChatGPT爆火出圈,AI模型逐渐渗透到各个行业和领域,诸多大厂也纷纷发布了自己的模型产品。而在国内AI模型的市场上,百的文心模型无疑是其中较为有名的一个。 于是,在国内大厂都在探索如何在模型时代取得更多优势时,百模型也不再局限于某个特定领域,而是将目光放在了网盘应用上。自百网盘经历“百盘大战”进入新的发展阶段以来,就从未停止过书写新的故事。 而无论从产品技术、行业,还是百自身来看,百网盘都是模型赋能的一个不错的“立足点”。因此,前不久,百网盘就传出结合模型进行战略升级的消息。 而百网盘之所以结合模型升级,其中的原因自然不言而喻。从自身来说,百网盘增速逐渐放缓,模型赋能有望为其带来更多新可能。 比如,百发布文心一言不久,阿里云就推出了模型通义千问,并且宣布“阿里所有产品未来将接入模型全面升级”,这也就意味着阿里云盘也将会围绕模型展开探索。

    42750编辑于 2023-09-13
  • 搭上模型风口,小、天猫精灵焕发“新生机”

    事实上,近年来引入AI模型的智能硬件不在少数,而智能音箱作为AI模型最容易落地的终端应用场景之一,自然也就成为了玩家加码的重点,在此背景下,一陷入增长瓶颈的智能音箱市场也开始“重获生机”。 而小音箱和天猫精灵之所以能够引入AI模型,则与其自身优势不无关系。在技术上,百和阿里在AI模型技术上的沉淀,有助于提升其智能音箱的语义理解和语音交互能力。 而百和阿里凭借其在模型领域的多年深耕,收集了足够多样化、真实性和高质量的用户数据,为其智能音箱AI模型的训练和运行提供了强大的算力、算法和数据基础。 而发力AI模型,能够很好地提升智能音箱语音交互的准确性和流畅、智能助手的功能丰富、智能家居设备的兼容性和互操作性等。 而接入模型后,小、天猫精灵是否就一定能焕发“第二春”,只有时间能给出答案。

    58610编辑于 2024-03-18
  • 来自专栏刘旷专栏

    竞逐文生图模型,百、快手、网易“明争暗斗”

    “声东击西”在文生图领域,快手的自研模型“可图”可谓是独具一格,作为国内领先的AI技术公司,百的AI作画产品“文心一格”自然也备受期待。 文生图技术对中文语义的理解尤为关键,而文心一格的技术基础是百文心知识增强跨模态理解模型,百文心学习了海量优质图文数据,能全面提升图像生成质量和语义一致性。 二来,文心模型在技术上的深厚积淀,在一定程度上解决了文心一格在实际应用中的技术难题。众所周知,文心一格AI作图产品顺利落地,是百依托于飞桨、文心模型持续进行技术创新的结果。 而百的文心跨模态模型ERNIE-ViLG 2.0是全球首个知识增强的AI作画模型,也是目前全球参数规模最大的AI作画模型。 百在训练模型方面取得了长足的进步,也让文心一格有效解决了复杂概念、属性混淆等文生图领域的常见问题。三来,文心模型丰富的产业应用场景,有助于文心一格实现商业化快速落地。

    41530编辑于 2023-10-23
  • 来自专栏MixLab科技+设计实验室

    语言模型优化技术 - KL散引导的智能量化

    Rishiraj Acharya揭示当前LLM量化评估的盲区——仅关注MMLU分数会掩盖"答案翻转"现象(量化后模型对错答案互换但总分不变)。 通过实验证明KL散(KLD)与翻转率相关性高达0.97,提出分层量化策略:对低敏感层(如MoE专家矩阵)采用2比特激进压缩,对高敏感层(注意力机制)保留8比特精度。 这种混合量化在减小模型体积的同时,通过KLD最小化保障模型行为一致性,比传统均匀量化更科学。 - **效率价值**:显著减少模型大小(从90GB压缩到25GB)同时保持性能 - **可访问性价值**:使先进AI模型能在消费级设备上运行 - **技术价值**:提供比传统均匀量化更优的压缩方法 - **创新价值**:建立了新的模型评估标准(KL散 vs 传统准确率) ### 来源URL https://huggingface.co/blog/rishiraj/kld-guided-quantization

    10110编辑于 2026-03-24
  • 来自专栏刘旷专栏

    竞逐文生图模型,百、快手、网易“明争暗斗”

    “声东击西”在文生图领域,快手的自研模型“可图”可谓是独具一格,作为国内领先的AI技术公司,百的AI作画产品“文心一格”自然也备受期待。 文生图技术对中文语义的理解尤为关键,而文心一格的技术基础是百文心知识增强跨模态理解模型,百文心学习了海量优质图文数据,能全面提升图像生成质量和语义一致性。 二来,文心模型在技术上的深厚积淀,在一定程度上解决了文心一格在实际应用中的技术难题。众所周知,文心一格AI作图产品顺利落地,是百依托于飞桨、文心模型持续进行技术创新的结果。 而百的文心跨模态模型ERNIE-ViLG 2.0是全球首个知识增强的AI作画模型,也是目前全球参数规模最大的AI作画模型。 百在训练模型方面取得了长足的进步,也让文心一格有效解决了复杂概念、属性混淆等文生图领域的常见问题。三来,文心模型丰富的产业应用场景,有助于文心一格实现商业化快速落地。

    40220编辑于 2023-10-23
  • 来自专栏深度学习与python

    基于模型安全运营的质效提升实践

    在 InfoQ 举办的 QCon 全球软件开发大会上百杰出架构师,安全技术委员会主席包沉浮为我们带来了精彩专题演讲“百基于模型安全运营的质效提升实践”,分享将介绍百如何基于模型构建深度安全推理智能体框架 其算力、数据量和算法规模的持续增长,使得系统的复杂和应用场景的丰富不断提升,从而增加了安全风险的复杂性。传统的安全风险在不断增加,同时模型还引入了许多新兴的安全风险。 一开始看到模型时,我们都非常兴奋,认为它非常好,尤其是我们身处百,是国内最早做大模型的公司之一。 我们预期未来模型能够端到端地承担具体任务,例如告警研判智能体或事件处置智能体,通过意图识别智能体进行任务分发,从而实现安全运营领域任务的协同完成。 从安全运营的角度来看,百正在重构其安全运营系统。 基于这一理念,未来的安全运营中心将包含三个重要层面: 安全工具层:这一层面要求极高的工具集成,因为所有安全工具都需要能够被模型直接访问和调用。

    54610编辑于 2025-03-28
  • 来自专栏量子位

    模型“百一下”,是种什么体验?

    这也正是百文心模型产业化路径的一个缩影,而铺设这么一条路百已有数载时间。 那么站在现在这个时间节点,模型的产业之路,或者更广泛的来说是AI的产业化之路,都有啥新进展? 我们不妨一同来看下。 百模型之路:越发亲民、易用 “亲民”、“易用”,是纵观整场WAVE SUMMIT后,对百模型最为直观的感受。 这里可以从两个方面来理解。 百·文心:知识增强的社科行业大模型 …… 除此之外,在工具与平台层面上,百还将模型的开发套件全面升级,开箱即可用的建模、定制、精调和可信学习工具。 不难看出的一点是,百的文心模型产业味道非常浓厚,它的“叶节点”正在向千行百业蔓延开来。 或许对于百而言,模型和行业大模型之间的关系,也展现出面向产业开放和赋能的一面。 那么产业大模型,就是百给产业各方提供了铸剑服务,帮助打造所需的工具,来自产业需求,用于产业痛点,而且产业方完全不需要掌握模型这样的高门槛技术,借助百就能完成符合自己需求的模型

    82420编辑于 2022-12-09
  • 来自专栏机器之心

    小满招聘:NLP算法研究员,金融领域模型方向

    2015年12月,百整合旗下金融业务,成立金融服务事业群组(FSG),交由百高级副总裁朱光全面负责,金融科技与无人车、DuerOS 成为百 AI 战略的三重要赛道。 2018年5月21日,小满正式成立,延承百技术基因,探索人工智能在金融领域的应用,先后布局信贷、财富管理、支付、保险、个人金融科技和供应链金融科技六业务板块。 基于人工智能、金融云、区块链和物联网等底层架构,小满搭建了金融大脑,运用情感计算、关联网络和知识图谱等技术,进行感知引擎和决策引擎运算,大数据处理能力实现日均100亿次计算,智能风控模型年均上线10万条策略 参与 NLP 前沿预训练算法研究,开展金融领域模型的研发和迭代,达到业界领先水准; 2.推动 NLP 模型对公司业务的应用落地,包括对话生成、智能营销等。 具备深厚的 NLP 基础和前沿跟踪能力,具备模型预训练、文本生成、多轮对话实践经验者优先; 4. 编程功底扎实,熟练使用常见深度学习框架,有大规模分布式训练部署等经验优先; 5.

    77920编辑于 2023-04-21
  • 来自专栏PaddlePaddle

    吴甜提出模型落地关键路径 业内首发行业大模型

    集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜发布飞桨文心最新全景图,提出支撑模型产业落地的3个关键路径,并在业内首发行业大模型。 百集团副总裁 深度学习技术及应用国家工程研究中心副主任吴甜 模型助力普惠AI 三关键落地路径发布 近年来,深度学习作为人工智能时代的通用型基础技术,推动了AI工业大生产。 百集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜表示,今年是模型产业落地的关键年。 吴甜介绍,在能源电力和金融领域,文心联合国家电网研发了知识增强的能源行业NLP模型国网-百·文心,联合浦发银行研发了知识增强的金融行业NLP模型浦发-百·文心,目前已在电力、金融相关任务上取得显著的效果提升 上海浦东发展银行总行信息科技部副总经理万化表示,浦发银行与百在AI的多个方面实现优势互补,联合研发了面向金融行业的模型「浦发-百·文心」,并且已在金融行业各类智能场景进行验证。

    37910编辑于 2022-08-31
  • 来自专栏创作是最好的自我投资

    通用模型VS垂直模型

    在人工智能这个充满无限可能的领域内,通用模型和垂直模型各有千秋。就我个人而言,在二者之间的选择上,并不存在偏向某一方的倾向。我觉得应当依据实际应用场景的具体需求,来挑选最为契合的模型。 通用模型通用模型,乃是旨在应对多种任务与数据类型的庞然物级人工智能模型。 在知识覆盖的广度方面,通用模型无疑具有明显的优势。当我们对于当下所需模型所涉及的精确专业领域的界限感到模糊不清时,选择通用模型无疑是一种明智之举。垂直模型接下来谈谈垂直模型。 然而,由于垂直模型的训练内容聚焦于当前行业,其涉猎的范围更集中,数据针对性更强,所以在提供专业咨询时往往更加精准、细致,这也正是垂直模型的独特价值所在。 因此,对于通用模型或者垂直模型,更倾向于哪一方不取决于个人想法,而是取决于用户需要。

    75901编辑于 2024-12-30
  • 来自专栏YO大数据

    【AI模型】Embedding模型解析 文本向量知识库的构建和相似检索

    目录导航 1 什么是Embedding 2 为什么使用Embedding 3 数据向量化的处理流程 4 Embedding实战 1 什么是Embedding 在模型中,"embedding"指的是将某种类型的输入数据 有助于提高处理效率,而且也使得不同实体之间的比较(如计算相似)变得可行。 切块 对于大型文档,直接处理可能会因为模型的输入限制(如Token数量限制)而变得不可行。在这种情况下,需要将文档分割成更小的部分。这些部分应该尽可能保持语义的完整性,例如按段落或章节切分。 当我们使用向量化模型(如OpenAI的text-embedding-ada-002模型)将文本转化为向量后,每个向量的维度表示某种语义特征,向量中的值反映了相应特征的强度。 在文本相似测量中,如果两个文本的向量化表示在方向上更接近,它们的余弦相似就更高,这意味着它们在语义上更相似。因此,通过计算向量之间的余弦相似,我们可以有效地评估两段文本的相似性。

    14.4K21编辑于 2024-05-25
  • 来自专栏小洁叫你mysql

    【AI模型】训练Al模型

    模型超越AI 目前所指的模型,是“大规模深度学习模型”的简称,指具有大量参数和复杂结构的机器学习模型,可以处理大规模的数据和复杂的问题,多应用于自然语言处理、计算机视觉、语音识别等领域。 本文将探讨模型的概念、训练技术和应用领域,以及与模型相关的挑战和未来发展方向。 模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数,而模型则可能拥有数亿或数十亿个参数。 训练模型的挑战 训练模型需要应对一系列挑战,包括: 以下是与模型相关的一些代码示例: 计算资源需求: import tensorflow as tf # 指定使用GPU进行训练 with tf.device 更智能的模型压缩技术:模型压缩和加速技术将继续发展,以减小模型的计算和存储开销。 更好的计算平台支持:为了支持训练和部署模型,计算平台将继续改进,提供更强大的计算资源和工具。

    1.5K30编辑于 2023-10-10
  • 来自专栏刘旷专栏

    抢跑搜索模型,百、昆仑万维“秋色平分”

    而得益于这些市场空间、刚需性强的通用性需求,搜索也成为了最先有可能被突破的应用场景。因此,模型加码搜索也就顺理成章了。模型与搜索的结合,能够大幅降低处理信息的复杂、更进一步提升用户体验。 而由于一手有搜索引擎,一手有文心一言模型,百AI搜索也得以发挥出更大价值。一方面,百在搜索领域的深厚积淀,能让其AI模型有更大的发挥余地。 除此之外,百丰富的内容生态为AI模型的训练提供了海量数据。多年以来,百一直在持续完善自有内容生态,构建超级内容平台。 于是,为了拓宽业务护城河,保持核心竞争优势,无论是昆仑万维还是百都一再“破圈”,开始积极拥抱AI模型。 为了实现更高的准确和更精细的预测,模型就需要更多的计算资源和数据量,这也就意味着模型需要投入更多的成本来支持模型训练和部署。

    48630编辑于 2023-10-08
  • 来自专栏学习

    开源模型与闭源模型

    在人工智能(AI)和机器学习(ML)的快速发展过程中,模型(Large Models)已经成为推动技术进步的重要力量。当前,业界存在两种主要的模型开发模式:开源模型和闭源模型。 一、开源模型 开源模型是指开发者将模型的代码和训练数据公开,使得任何人都可以访问、修改和使用这些资源。 二、闭源模型 闭源模型是指模型的代码和数据不对外公开,通常由商业公司开发和维护。代表性的闭源模型包括OpenAI的GPT-3和Google的BERT。 三、开源模型与闭源模型的对比 1.透明性与可控性: 开源模型的透明性更高,任何人都可以查看和验证其代码和数据,确保模型的行为符合预期。这对于学术研究和技术验证非常重要。 闭源模型通过控制代码和数据的访问,能够更好地保护用户隐私和数据安全,降低被恶意利用的风险。 五、总结 开源模型和闭源模型各有优缺点,适合不同的应用场景和需求。

    1.7K10编辑于 2024-10-09
  • 来自专栏IT从业者张某某

    模型模型的幻觉问题

    参考 模型中的涌现 OpenAI 科学家:幻觉是模型与生俱来的特性,而非缺陷 模型「幻觉」,看这一篇就够了|哈工大华为出品 模型 什么是模型 语言模型(LLM)是基于海量文本数据训练的深度学习模型 模型模型发展如下图 涌现 参考:模型中的涌现 什么是涌现?先从蚂蚁开始说起。蚂蚁是自然界中一种个体非常简单,但是群体能力非常强大的生物。 如何解决模型的「幻觉」问题? 方向一:什么是模型「幻觉」 模型出现幻觉,简而言之就是“胡说八道”。 用文中的话来讲,是指模型生成的内容与现实世界事实或用户输入不一致的现象。 OpenAI 科学家 Andrej Karpathy关于模型幻觉 在 Karpathy 看来: 从某种意义上说,语言模型的全部工作恰恰就是制造幻觉,模型就是「造梦机」。 只有模型助手存在幻觉问题。 方向二:造成大模型「幻觉」的原因 那么致使模型产生幻觉的原因都有哪些?

    1.8K11编辑于 2024-01-04
领券