搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏后台技术汇
大模型应用之（4）：Langchain架构与大模型接入
作为一个语言模型集成框架，LangChain 的用例与一般语言模型的用例有很大的重叠。重叠范围包括文档分析和总结摘要, 代码分析和聊天机器人。 Langchain架构 LangChain工具组件：大模型包装器、聊天模型包装器、数据增强工具和接口链：提供了标准接口，和数据平台和实际应用工具紧密集成 LangChain六大模块模块核心作用 Agent作为高级模块，可调用其他所有模块功能大模型接入接入示例云服务和私有化大模型优劣对比维度开发成本算力成本运维成本数据安全云厂商大模型较低，开箱即用算力资源充足，大模型性能好 &吞吐量较高较低，提供云平台监控安全性低私有化大模型较高，自建大模型网关、服务鉴权、可用性等算力硬件投入成本高，大模型性能较差低&吞吐量较低较高，需要专业运维团队介入安全性高，保密性强小结： - 研发&测试环境：为了方便部署和测试，使用云服务 - 大客户生产环境：安全审核严格，大多数采用自建大模型的方式总结 LangChain 是什么？
60910编辑于 2025-08-04
来自专栏大模型成长之路
【大模型学习 | MINIGPT-4原理】
MINIGPT-4: ENHANCING VISION-LANGUAGE UNDERSTANDING WITH ADVANCED LARGE LANGUAGE MODELS在GPT4未开源的情况下，作者认为其表现优越是因为采用了最为先进的 LLM模型，因此，作者在BLIP2的基础上，将LLM模型替换为了Vicuna，同样也是通过一个线性映射层将图像表征映射为LLM的输入。开源代码：https://minigpt-4.github.io/一、预训练方法预训练方法几乎和BLIP2模型一致，可以参考：【大模型学习 | BLIP2原理】-腾讯云开发者社区-腾讯云1.1 Q-Former ； MINI-GPT4表现比BLIP2要强上许多？ ① MiniGPT-4 使用的是 Vicuna（基于 LLaMA 的开源 ChatGPT 对话模型），具有更强的自然语言表达和指令理解能力；而BLIP-2 使用的 LLM 主要是 Flan-T5 或 OPT
71710编辑于 2025-07-02
来自专栏算法一只狗
LLama4 原生多模态大模型
Meta最新发布了原生多模态大模型 Llama 4，一经亮相即登上LMSYS大模型排行榜第二名，仅次于Google的Gemini-2.5-pro，分差仅为22分，实力可见一斑。在模型规模方面，Llama 4系列的确非常庞大，尤其是Behemoth模型，远超业内主流，例如DeepSeek R1参数量仅为6710亿，只有Behemoth的约三分之一。当前行业趋势多偏向小而高效的模型，Llama 4如此庞大的规模实属少见。总结与展望Llama 4的发布，意味着Meta正式进入原生多模态大模型竞争核心领域。相比Gemini系列、GPT-4o、Claude 3、DeepSeek等主流模型，Llama 4以务实高效的技术路线，突出计算成本、推理效率与多模态能力的平衡。
63300编辑于 2025-05-01
来自专栏啄木鸟软件测试
多模态大模型技术原理与实战(4)
多模态大模型核心技术 1多模态的困难困难数据集标志困难人工标注生成 COCO Visual Genome ... OpenAl的DALL-E2和GPT4 谷歌大脑的 lmaen和Stable Diffusion 百度的文心一言文本生成图像基于GAN的文本生成图像方法 AlignDRAW:第一个现代文本生成图像模型图像解码器把隐信息还原成图像 4语音多模态技术文本生成语音以前技术：拼接法和参数法基于非深度学习的文本生成语音技术隐马尔可夫模型 (HMM) 文本信息提取模块声学特征提取模块可调整的低秩适配(Adaptive Low-Rank Adaptation，AdaLoRA)技术和量化压缩远程注意力(Quantized Long-Range Attention，QLoRA)技术 8 GPT-4多模型核心技术介绍 Transformer：编码器-解码器框架编码器：衍生出了自编码大模型，如BERT、RoBERT和ALBERT 解码器：衍生出了自回归大模型,如GPT-1和GPT-2 整体衍生出：T5和GLM
44110编辑于 2024-09-10
来自专栏科学最Top
近期值得关注的4个时序大模型研究
前言梳理了近期几篇时间序列大模型研究文章（后台回复：“论文合集”获取），时间序列大模型的研究正在迅速发展，并且在多个领域和应用中展现出巨大的潜力。随着技术的不断进步，预计未来会有更多创新的方法和应用出现，但我感觉目前可以重点关注以下三方面：基础模型的构建：研究者们正在尝试构建时间序列预测的基础模型，这些模型可以在不同的时间序列数据集上进行预训练特定领域的应用：大模型正在被应用于特定领域的时间序列预测，如金融、医疗、交通等，以解决特定问题并提供可解释的预测。这一模型采用了一个创新的统一网络架构，结合了序列和变量注意力机制、动态线性算子，并作为一个统一模型进行训练。在38个跨领域的数据集上，UniTS展现了超越特定任务模型和基于自然语言的LLMs的性能。 4、Lag-Llama 论文标题：Lag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting 在过去的几年中
1.6K10编辑于 2024-09-18
来自专栏自然语言处理(NLP)论文速递
猛犸象大模型！MAmmoTH：目前最好的开源、通用数学大模型，现已超过GPT-4！
引言大型语言模型 (LLM)的数学推理能力是评估大模型能力的一项关键指标。尽管目前很多大型语言模型(LLMs)在该领域取得了一定的进展，但与闭源的大模型相比，开源大模型的数学推理能力仍然有很大差距。 (LLM)的数学推理能力是评估大模型能力的一项关键指标。尽管该领域取得了一定的进展，但是开源大模型和闭源大模型之间仍然存在明显的差距。目前一些比较流行的闭源LLM主要包括：GPT-4、PaLM-2、 Claude2，它们在主流的GSM8K、MATH数据集上面占据着了主导地位；而Llama、Falcon、OPT等开源大模型在所有基准上都大幅落后
1.7K20编辑于 2023-09-21
来自专栏【腾讯云开发者】
腾讯混元大模型·4月产品动态
作为腾讯全链路自研的大模型，自2023年9月公开亮相以来，腾讯混元大模型共经历了数十次迭代，支持内部超过400个业务和场景接入，并通过腾讯云面向企业和个人开发者全面开放（API个人权益与企业客户一致，已实名腾讯云账号提供累计
52340编辑于 2024-04-28
来自专栏AI分享
大模型有关信息（2025年4月8日 - 4月14日）
Meta发布Llama 4大模型引发争议发布情况：4月13日，Meta平台公司推出了Llama大语言模型新一代版本——Llama 4 Scout和Llama 4 Maverick。专业评估机构LMArena把Llama 4 Maverick的某个版本评为当下性能最强的开源大语言模型，但开发者亲自测试发现，通过不同方式访问时效果差异巨大，Meta高管也承认其表现“参差不齐”“质量不稳定独特优势：Llama 4拥有超大的上下文窗口，一次能处理1000万个token，大约相当于800万个单词，相比OpenAI的GPT-4的上下文窗口优势明显。嘀嗒出行公布大模型应用于客服的进展应用成果：4月14日，嘀嗒出行公布其AI大模型在客服领域的应用进展。基于大模型的智能判责准确率已超过80%，智能工单生成效率提升50%，准确率达98%。小鹏汽车训练物理大模型何小鹏表态：4月14日，小鹏汽车创始人何小鹏在社交平台发帖称，小鹏坚持全栈自研，去年率先在自动驾驶领域引入强化学习、模型蒸馏的路线，并且训练了一个超大规模的物理世界大模型，国内还没有第二家车企可以做到
3.3K20编辑于 2025-04-15
来自专栏大模型应用
大模型应用：庖丁解牛：QKV机制详解，大模型的注意力之眼.4
基础介绍我们先从理论角度来解释QKV机制，QKV机制是注意力机制的核心，尤其在Transformer模型中，注意力机制源于人类感知世界的方式：在处理信息时，我们会选择性地关注一部分信息，在机器学习中，注意力机制允许模型在处理序列数据时，对不同的部分赋予不同的权重，从而更有效地利用信息。1. 多头注意力机制实际中大模型使用多头注意力，让模型同时从多个角度关注信息：比如在分析"我去银行取钱"时：头1关注："取"→"钱"（动作-对象关系）头2关注："银行"→"取钱"（地点-活动关系）头3关注：" attention = SimpleSelfAttention(d_model=4, d_k=2, d_v=2) # 示例输入：3个词的序列，每个词用4维向量表示 # "猫" QKV机制赋予模型动态上下文感知能力，每个位置的输出都融合了全局相关信息，而非固定窗口内的局部特征，这使模型能有效处理代词指代、一词多义等复杂语言现象。
41110编辑于 2026-02-01
来自专栏NewBeeNLP
LLM4Rec：当推荐系统遇到大语言模型
大模型LLM在越来越多的领域开始崭露头角，前段时间我们整理了大模型在推荐系统中的应用 survey，当时留了一些坑没填上，今天补上。 FT OR NOT FT 上文是从『Where』的角度对 LLM4RS 工作进行整理，下面从『How』的角度看，大模型如何应用。从大模型训练和推理两个阶段出发，可以将现有工作分为四个象限训练阶段是否需要微调？推理阶段是否使用传统推荐模型？；是否需要 ID-index 探索更适合语言模型的 ID 索引和建模策略避免大模型偏见：问题：由于训练数据的不平衡等因素导致的大模型输出存在某种偏好或倾向，进而引发一系列伦理和社会问题 Can ChatGPT A Fairness Evaluation Benchmark for Recommendation with Large Language Model 大模型安全问题： GPT4 technical
4.6K11编辑于 2024-01-17
来自专栏创作是最好的自我投资
通用大模型VS垂直大模型
在人工智能这个充满无限可能的领域内，通用大模型和垂直大模型各有千秋。就我个人而言，在二者之间的选择上，并不存在偏向某一方的倾向。我觉得应当依据实际应用场景的具体需求，来挑选最为契合的大模型。通用大模型通用大模型，乃是旨在应对多种任务与数据类型的庞然大物级人工智能模型。在知识覆盖的广度方面，通用大模型无疑具有明显的优势。当我们对于当下所需模型所涉及的精确专业领域的界限感到模糊不清时，选择通用大模型无疑是一种明智之举。垂直大模型接下来谈谈垂直大模型。然而，由于垂直大模型的训练内容聚焦于当前行业，其涉猎的范围更集中，数据针对性更强，所以在提供专业咨询时往往更加精准、细致，这也正是垂直大模型的独特价值所在。因此，对于通用大模型或者垂直大模型，更倾向于哪一方不取决于个人想法，而是取决于用户需要。
71401编辑于 2024-12-30
GLM4大模型微调入门实战（完整代码）
GLM4是清华智谱团队最近开源的大语言模型。以GLM4作为基座大模型，通过指令微调的方式做高精度文本分类，是学习LLM微调的入门任务。显存要求相对较高，需要40GB左右。在本文中，我们会使用 GLM4-9b-Chat 模型在复旦中文新闻数据集上做指令微调训练，同时使用SwanLab监控训练过程、评估模型效果。大模型指令微调（Instruction Tuning）是一种针对大型预训练语言模型的微调技术，其核心目的是增强模型理解和执行特定指令的能力，使模型能够根据用户提供的自然语言指令准确、恰当地生成相应的输出或执行相关任务４日将进行两场半决赛，由青海山川机床铸造厂队和青岛铸造机械厂队分别与武汉肉联厂队和上海大隆机器厂队交锋。本届比赛将于６日结束。（完） Category: Sports, Politics Output:[OUTPUT]Sports """ 我们的训练任务，便是希望微调后的大模型能够根据Text和Category组成的提示词，预测出正确的
2.5K10编辑于 2024-06-20
来自专栏机器之心
最接近GPT-4的国产大模型诞生了
综合能力全面跃升国产基座大模型比肩 GPT-4 一直以来，AI 领域内的研究者和从业者都以「GPT-4」作为大模型技术的标杆。而 GLM-4 的诞生，意味着国产大模型的水平真正做到了「比肩 GPT-4」。短短几个月，GLM-4 即可实现多项模型能力的飞跃，与智谱 AI 长期以来所坚持的「All in 大模型」路线密不可分。在 2023 年的大模型浪潮之中，智谱 AI GLM 系列大模型保持每 3-4 个月升级一次的节奏，同时逐步具备了多模态理解、代码解释、网络搜索增强等新功能。从全行业的角度来说，GLM-4-All Tools 的意义或许更为突出。基于比肩 GPT-4 的基座大模型能力，这一功能的上线将为应用、行业模型和商业化落地案例开辟出更加广阔的实践空间。
56011编辑于 2024-01-17
来自专栏小洁叫你mysql
【AI大模型】训练Al大模型
大模型超越AI 目前所指的大模型，是“大规模深度学习模型”的简称，指具有大量参数和复杂结构的机器学习模型，可以处理大规模的数据和复杂的问题，多应用于自然语言处理、计算机视觉、语音识别等领域。本文将探讨大模型的概念、训练技术和应用领域，以及与大模型相关的挑战和未来发展方向。 }") 什么是大模型？大模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数，而大模型则可能拥有数亿或数十亿个参数。训练大模型的挑战训练大模型需要应对一系列挑战，包括：以下是与大模型相关的一些代码示例：计算资源需求： import tensorflow as tf # 指定使用GPU进行训练 with tf.device
1.5K30编辑于 2023-10-10
来自专栏量子位
国产GPTs来了，基于智谱第4代大模型！模型性能均达GPT-4九成以上
衡宇发自凹非寺量子位 | 公众号 QbitAI 国产大模型玩家智谱AI，交出最新成绩单—— 发布全自研第四代基座大模型GLM-4，且所有更新迭代的能力全量上线。作为国内唯一一个产品线全对标OpenAI的大模型公司，智谱年前攒了波大的：按官方说法，GLM-4性能相比GLM-3提升60%，逼近GPT-4（11月6日最新版本效果）。不过张鹏也表示，GLM-4在中文推理方面的能力，还有待进一步提升。其次，在大模型的“内存”能力方面，GLM-4系列支持128k上下文窗口长度，单次提示词可处理文本300页，比前作有所提升。对GLM-4的发布，综合下来给人一种这样的感觉：去年10月底第3代基座大模型，该公司在模型产品线上和OpenAI逐一对齐；第4代是在拉齐模型能力和OpenAI GPT-4的能力水平线。参数不强调了，外界的目光自然更加紧盯这一代基座模型的性能——这确实是智谱这回想要强调的东西。接下来将主要发力三个方向 “大模型的技术，不是说把原来系统里的小模型扔掉，换上大模型的接口就行了。
35910编辑于 2024-01-17
来自专栏学习
开源大模型与闭源大模型
在人工智能（AI）和机器学习（ML）的快速发展过程中，大模型（Large Models）已经成为推动技术进步的重要力量。当前，业界存在两种主要的大模型开发模式：开源大模型和闭源大模型。一、开源大模型开源大模型是指开发者将模型的代码和训练数据公开，使得任何人都可以访问、修改和使用这些资源。二、闭源大模型闭源大模型是指模型的代码和数据不对外公开，通常由商业公司开发和维护。代表性的闭源大模型包括OpenAI的GPT-3和Google的BERT。三、开源大模型与闭源大模型的对比 1.透明性与可控性：开源大模型的透明性更高，任何人都可以查看和验证其代码和数据，确保模型的行为符合预期。这对于学术研究和技术验证非常重要。 4.安全与隐私：开源大模型的公开性带来了潜在的安全和隐私风险，恶意行为者可能利用这些资源进行攻击或滥用。
1.5K10编辑于 2024-10-09
来自专栏数据派THU
原创 | 大模型扫盲系列——初识大模型
为了提高模型的性能，研究者们不断尝试增加模型的参数数量，从而诞生了大模型这一概念。本文将从大模型的原理、训练过程、prompt和相关应用介绍等方面进行分析，帮助读者初步了解大模型。为了提高模型的性能，研究者们不断尝试增加模型的参数数量，从而诞生了大模型这一概念。本文讨论的大模型将以平时指向比较多的大语言模型为例来进行相关介绍。 OpenAI的ChatGPT4能有如此惊人的效果，主要的一个原因就是他们训练数据源比较优质。 4）搜索引擎和推荐系统：大模型可以应用于企业的搜索引擎和推荐系统，通过深度学习算法，对用户的搜索意图进行准确理解，提供更精准的搜索结果和个性化的推荐内容。 4.无法实现成本可控：直接训练和部署千亿级参数大模型成本过高，企业级应用应使用百亿级基础模型，根据不同需求训练不同的垂直模型，企业则只需要负担垂直训练成本。
21.1K29编辑于 2023-11-22
来自专栏IT从业者张某某
大模型与大模型的幻觉问题
参考大模型中的涌现 OpenAI 科学家：幻觉是大模型与生俱来的特性，而非缺陷大模型「幻觉」，看这一篇就够了｜哈工大华为出品大模型什么是大模型大语言模型（LLM）是基于海量文本数据训练的深度学习模型大模型的模型发展如下图涌现参考：大模型中的涌现什么是涌现？先从蚂蚁开始说起。蚂蚁是自然界中一种个体非常简单，但是群体能力非常强大的生物。如何解决大模型的「幻觉」问题？方向一：什么是大模型「幻觉」大模型出现幻觉，简而言之就是“胡说八道”。用文中的话来讲，是指模型生成的内容与现实世界事实或用户输入不一致的现象。 OpenAI 科学家 Andrej Karpathy关于大模型幻觉在 Karpathy 看来：从某种意义上说，大语言模型的全部工作恰恰就是制造幻觉，大模型就是「造梦机」。只有大模型助手存在幻觉问题。方向二：造成大模型「幻觉」的原因那么致使大模型产生幻觉的原因都有哪些？
1.7K11编辑于 2024-01-04
来自专栏周末程序猿
ChatGPT|开源大模型Llama3性能匹敌GPT4
4月18日，Meta正式发布Llama3，开源了包括8B和70B，在多个关键的基准测试中性能优于业界先进同类模型，其在代码生成等任务上实现了全面领先，能够进行复杂的推理，可以更遵循指令。）https://llama3.replicate.dev/ （2）https://build.nvidia.com/explore/discover#llama3-70b，英伟达在这个平台上提供各种模型，其中包括现在流行的模型，建议收藏（3）https://huggingface.co/meta-llama/Meta-Llama-3-8B，huggingface地址如果有GPU可以尝试自己跑起来：包括增强的推理和代码能力；训练效率比 Llama 2 高 3 倍；带有 Llama Guard 2、Code Shield 和 CyberSec Eval 2 的新版信任和安全工具；对比各个闭源大模型
19510编辑于 2025-02-27
来自专栏CSDNToQQCode
【千帆大模型4】——Prompt优化——游戏对话语句优化
此对话应用于对话小游戏：【寻找游戏大模王】利用千帆大模型4制作小游戏优化操作指引优化指引在新手引导里面，右上角，直接点就行，描述的很直接，有动作指引。基本对话目标：随机渣男与女朋友的对话式聊天，需要5条信息， 1、信息1是渣女的问句； 2、信息2是渣男的优秀回复； 3、信息3是普通男的一般回复； 4、信息4是渣女对信息2渣男的回复并告知回答对了给与奖励话语信息4：渣女对信息2渣男的回复并告知回答对了给与奖励话语： “真开心听到你这么说，我也好爱你！今晚我们去吃那家新开的餐厅吧，算作是你的奖励。” 4. **举报功能**：如遇到不良用户，可以举报给平台管理。 **聊天内容设计：** 1. **渣女的问题**： * “你经常这样哄女孩子吗？” 2. 4. **渣女对第2条的回答并给出奖励的话语**： * “你真的很会说话哦，这次给你加个分~” 5.
43510编辑于 2023-11-22

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

大模型应用之（4）：Langchain架构与大模型接入

【大模型学习 | MINIGPT-4原理】

LLama4 原生多模态大模型

多模态大模型技术原理与实战(4)

近期值得关注的4个时序大模型研究

猛犸象大模型！MAmmoTH：目前最好的开源、通用数学大模型，现已超过GPT-4！

腾讯混元大模型·4月产品动态

大模型有关信息（2025年4月8日 - 4月14日）

大模型应用：庖丁解牛：QKV机制详解，大模型的注意力之眼.4

LLM4Rec：当推荐系统遇到大语言模型

通用大模型VS垂直大模型

GLM4大模型微调入门实战（完整代码）

最接近GPT-4的国产大模型诞生了

【AI大模型】训练Al大模型

国产GPTs来了，基于智谱第4代大模型！模型性能均达GPT-4九成以上

开源大模型与闭源大模型

原创 | 大模型扫盲系列——初识大模型

大模型与大模型的幻觉问题

ChatGPT|开源大模型Llama3性能匹敌GPT4

【千帆大模型4】——Prompt优化——游戏对话语句优化

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐