搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏掘金安东尼
👾打开 RAG 对接大模型的黑盒 —— 9 大隐藏问题
Prompt 给他介绍一下相关背景，然后大模型就有更专业的应答能力了。言而总之，大数据时代，很多公司都拥有大量的专有数据，如果能基于它们创建 RAG，将显著提升大模型的特异性。对于很多人来说，RAG 的引入、与大模型的对接是一个黑盒，任何微小参数的变动都将引起结果发生很大的变化。 /模型没有回答问题/模型编造有害的或带有偏见的答案接下来，一起揭秘：RAG 对接大模型的黑盒 —— 9 大问题来源：Seven Failure Points When Engineering a Retrieval 总结本篇提供了开发 RAG 通道 9 个痛点，并针对每个痛点都给了相应的解决思路。 RAG 是非常重要的专用检索+通用大模型的技术手段，在赋能模型、满足特定化场景中非常重要！
78910编辑于 2024-04-04
来自专栏DeepHub IMBA
9月大型语言模型研究论文总结
大型语言模型(llm)在今年发展迅速，随着新一代模型不断地被开发，研究人员和工程师了解最新进展变得非常重要。本文总结9-10月期间发布了一些重要的LLM论文。这些论文涵盖了一系列语言模型的主题，从模型优化和缩放到推理、基准测试和增强性能。最后部分讨论了有关安全训练并确保其行为保持有益的论文。这种方法产生了MathCoder模型，这是一组能够生成基于代码的解决方案的模型，用于解决具有挑战性的数学问题。现有的问答基准(如ToMi)会向模型提问，以推断故事中人物的信念，但不会测试模型是否可以使用这些推断来指导它们的行动。 SmartPlay中的每个游戏都独特地挑战了智能LLM代理的9个重要功能的子集，包括对象依赖性推理，提前计划，空间推理，从历史中学习和理解随机性。
77121编辑于 2023-10-23
来自专栏猫头虎博客专区
开源大模型DeepSeek.ai火遍全球:9条让DeepSeek颠覆通用大模型的事实
DeepSeek.ai火遍全球的几个事实: DeepSeek 不是套壳不是蒸馏美国的大模型。虽然中国有些大模型是套壳和蒸馏的, 但 DeepSeek 不是。在训练阶段, Deepseek 用标注的 Long CoT 数据微调模型, 让模型生成更清晰的推理步骤, 在强化学习中用 CoT 设计奖励优化, 增强长链推理能力, 并且在此过程中观察到了模型的反思 ( 数据, 训练了 R1-Zero 模型, 探索了模型不依赖人类标注数据微调、自主推演的能力, 打开了新的思路。比如轻量化设计把大钢板换成钢条 (类似通过稀疏的办法减少大模型的参数量); 涡轮增压利用废气能量增加空气供给, 提高燃烧效率; 精密制造, 使得发动机零部件的配合更加紧密, 从而减少能量损失; 等等。基础大模型终将 commoditize (商品化), toB 领域看谁能将 LLM 更好和复杂的生产环节衔接好帮客户落地提高生产效率, toC 领域看谁有流量入口, 最终才会获取 AI 产业价值创造中最多的利润
1.1K10编辑于 2025-02-02
来自专栏大模型应用
大模型应用：本地大模型部署中的Token效率优化与性能分析.9
引言在大模型应用日益普及的今天，对模型交互过程中Token消耗的深入理解和有效管理变得至关重要。 Token作为大模型处理文本的基本单位，不仅直接关系到模型的响应速度和质量，更影响着计算资源的消耗和使用成本。随着模型规模的不断扩大和应用场景的多样化，如何在不牺牲对话质量的前提下优化Token使用效率，已成为提升大模型应用经济性和实用性的关键问题。助理回复："我是通义千问，一个由开发的大语言模型。我致力于帮助用户解答问题、提供信息和执行各种任务。" ，确保系统在不同硬件环境下的可用性通过持续的技术迭代和优化，我们相信Token效率优化将在推动大语言模型普惠应用方面发挥越来越重要的作用。
56543编辑于 2026-02-06
来自专栏Python与算法之美
9，模型的评估
模块中的交叉验证相关方法可以评估模型的泛化能力，能够有效避免过度拟合。二，分类模型的评估模型分类效果全部信息： confusion_matrix 混淆矩阵,误差矩阵。 ? 模型整体分类效果： accuracy 正确率。通用分类评估指标。模型对某种类别的分类效果： precision 精确率，也叫查准率。模型不把正样本标错的能力。“不冤枉一个好人”。 recall 召回率，也叫查全率。模型识别出全部正样本的能力。三，回归模型的评估回归模型最常用的评估指标有： r2_score(r方，拟合优度，可决系数) explained_variance_score(解释方差得分) ? ? 留出法为了解决过拟合问题，常见的方法将数据分为训练集和测试集，用训练集去训练模型的参数，用测试集去测试训练后模型的表现。
97031发布于 2020-07-17
来自专栏GPUS开发者
在Jetson上玩转大模型Day9：建立EffectiveViT测试环境
後來受到NLP在Transformer技術的突破，對視覺技術產生非常大的衝擊，於是Google在2021年提出的ViT（Vision Transform）技術，對機器視覺上的圖片分類、物體檢測、語義分割等應用，產生非常大的變化，不僅在效能上有所突破，並且爲視覺與大語言模型相結合的多模態技術，開創新的格局。本文章的重點，在於爲大家提供一個快速搭建測試不同ViT模型的實驗環境，因此需要尋找合適的模型來進行示範，爲此我們找到非常適合在邊緣AI設備上部署的EfficientViT模型。 opencv-python timm==0.6.13 tqdm torchprofile matplotlib git+https://github.com/zhijian-liu/torchpack.git@3a5a9f7ac665444e1eb45942ee3f8fc7ffbd84e5 目前項目提供三大類應用，我們可以到 https://github.com/mit-han-lab/efficientvit/tree/master/applications 看到cls.md、sam.md
37110编辑于 2024-11-04
来自专栏程序员的知识天地
Python中9大时间序列预测模型
当有预测模型来预测未知变量时，在时间充当独立变量和目标因变量的情况下，时间序列预测就出现了。预测值可以是潜在雇员的工资或银行账户持有人的信用评分。模型的表示法涉及指定模型p的顺序作为AR函数的参数。）模型。它结合了ARIMA模型，能够在季节性水平上执行相同的自回归、差分和移动平均建模。 SARIMAX方法还可用于使用外生变量对包含的模型进行建模，例如ARX，MAX，ARMAX和ARIMAX。
1.8K40发布于 2019-05-25
来自专栏AIOT
在Jetson上玩转大模型Day9：建立EffectiveViT测试环境
後來受到NLP在Transformer技術的突破，對視覺技術產生非常大的衝擊，於是Google在2021年提出的ViT（Vision Transform）技術，對機器視覺上的圖片分類、物體檢測、語義分割等應用，產生非常大的變化，不僅在效能上有所突破，並且爲視覺與大語言模型相結合的多模態技術，開創新的格局。本文章的重點，在於爲大家提供一個快速搭建測試不同ViT模型的實驗環境，因此需要尋找合適的模型來進行示範，爲此我們找到非常適合在邊緣AI設備上部署的EfficientViT模型。 0.15.2einopsopencv-pythontimm==0.6.13tqdmtorchprofilematplotlibgit+https://github.com/zhijian-liu/torchpack.git@3a5a9f7ac665444e1eb45942ee3f8fc7ffbd84e5transformersonnxonnxsimonnxruntimegit 目前項目提供三大類應用，我們可以到 https://github.com/mit-han-lab/efficientvit/tree/master/applications 看到cls.md、sam.md
28010编辑于 2024-11-01
来自专栏机器学习/数据可视化
数据平滑9大妙招
今天给大家分享9大常见数据平滑方法：移动平均Moving Average指数平滑Exponential Smoothing低通滤波器多项式拟合贝塞尔曲线拟合局部加权散点平滑LoessKalman滤波小波变换阶多项式拟合的案例：import numpy as npimport matplotlib.pyplot as plt# 示例数据x = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9] Loess平滑的核心思想是在每个数据点附近拟合一个局部多项式模型，然后使用这些局部模型的加权平均来获得平滑曲线。可调参数：Loess允许用户指定平滑窗口的大小或带宽，以控制局部模型的拟合程度。较小的带宽会导致更强的局部适应，而较大的带宽会导致更平滑的曲线。卡尔曼滤波基于状态空间模型，其中系统状态通过线性或非线性动态模型演化，并且由观测模型通过传感器观测进行测量。
6K44编辑于 2023-10-13
来自专栏创作是最好的自我投资
通用大模型VS垂直大模型
在人工智能这个充满无限可能的领域内，通用大模型和垂直大模型各有千秋。就我个人而言，在二者之间的选择上，并不存在偏向某一方的倾向。我觉得应当依据实际应用场景的具体需求，来挑选最为契合的大模型。通用大模型通用大模型，乃是旨在应对多种任务与数据类型的庞然大物级人工智能模型。在知识覆盖的广度方面，通用大模型无疑具有明显的优势。当我们对于当下所需模型所涉及的精确专业领域的界限感到模糊不清时，选择通用大模型无疑是一种明智之举。垂直大模型接下来谈谈垂直大模型。然而，由于垂直大模型的训练内容聚焦于当前行业，其涉猎的范围更集中，数据针对性更强，所以在提供专业咨询时往往更加精准、细致，这也正是垂直大模型的独特价值所在。因此，对于通用大模型或者垂直大模型，更倾向于哪一方不取决于个人想法，而是取决于用户需要。
77601编辑于 2024-12-30
来自专栏小洁叫你mysql
【AI大模型】训练Al大模型
大模型超越AI 目前所指的大模型，是“大规模深度学习模型”的简称，指具有大量参数和复杂结构的机器学习模型，可以处理大规模的数据和复杂的问题，多应用于自然语言处理、计算机视觉、语音识别等领域。本文将探讨大模型的概念、训练技术和应用领域，以及与大模型相关的挑战和未来发展方向。大模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数，而大模型则可能拥有数亿或数十亿个参数。训练大模型的挑战训练大模型需要应对一系列挑战，包括：以下是与大模型相关的一些代码示例：计算资源需求： import tensorflow as tf # 指定使用GPU进行训练 with tf.device 更智能的模型压缩技术：模型压缩和加速技术将继续发展，以减小大模型的计算和存储开销。更好的计算平台支持：为了支持训练和部署大模型，计算平台将继续改进，提供更强大的计算资源和工具。
1.5K30编辑于 2023-10-10
来自专栏新智元
一文看尽SOTA生成式模型：9大类别21个模型全回顾！
但生成式模型种类繁多，发布速度也非常快，稍不留神就有可能错过了sota 最近，来自西班牙科米利亚斯主教大学的研究人员全面回顾了各个领域内AI的最新进展，将生成式模型按照任务模态、领域分为了九大类，并总结了 2022年发布的21个生成式模型，一次看明白生成式模型的发展脉络！论文链接：https://arxiv.org/abs/2301.04655 生成式AI分类模型可以按照输入和输出的数据类型进行分类，目前主要包括9类。有趣的是，在这些已发布大模型的背后，只有六个组织（OpenAI, Google, DeepMind, Meta, runway, Nvidia）参与部署了这些最先进的模型。用户可以向模型输入query，并附上一张照片或一段视频，模型就会用文本答案来回答。 Flamingo模型利用了两个互补的模型：一个是分析视觉场景的视觉模型，一个是执行基本推理形式的大型语言模型。
84530编辑于 2023-02-24
来自专栏数据派THU
一文看尽SOTA生成式模型：9大类别21个模型全回顾！
来源：新智元极市平台本文约3800字，建议阅读5分钟本文总结了2022年发布的21个生成式模型，一次看明白生成式模型的发展脉络！最近，来自西班牙科米利亚斯主教大学的研究人员全面回顾了各个领域内AI的最新进展，将生成式模型按照任务模态、领域分为了九大类，并总结了2022年发布的21个生成式模型，一次看明白生成式模型的发展脉络！论文链接：https://arxiv.org/abs/2301.04655 生成式AI分类模型可以按照输入和输出的数据类型进行分类，目前主要包括9类。有趣的是，在这些已发布大模型的背后，只有六个组织（OpenAI, Google, DeepMind, Meta, runway, Nvidia）参与部署了这些最先进的模型。用户可以向模型输入query，并附上一张照片或一段视频，模型就会用文本答案来回答。 Flamingo模型利用了两个互补的模型：一个是分析视觉场景的视觉模型，一个是执行基本推理形式的大型语言模型。
1.8K30编辑于 2023-03-29
来自专栏学习
开源大模型与闭源大模型
在人工智能（AI）和机器学习（ML）的快速发展过程中，大模型（Large Models）已经成为推动技术进步的重要力量。当前，业界存在两种主要的大模型开发模式：开源大模型和闭源大模型。一、开源大模型开源大模型是指开发者将模型的代码和训练数据公开，使得任何人都可以访问、修改和使用这些资源。二、闭源大模型闭源大模型是指模型的代码和数据不对外公开，通常由商业公司开发和维护。代表性的闭源大模型包括OpenAI的GPT-3和Google的BERT。三、开源大模型与闭源大模型的对比 1.透明性与可控性：开源大模型的透明性更高，任何人都可以查看和验证其代码和数据，确保模型的行为符合预期。这对于学术研究和技术验证非常重要。闭源大模型通过控制代码和数据的访问，能够更好地保护用户隐私和数据安全，降低被恶意利用的风险。五、总结开源大模型和闭源大模型各有优缺点，适合不同的应用场景和需求。
1.7K10编辑于 2024-10-09
来自专栏数据派THU
原创 | 大模型扫盲系列——初识大模型
为了提高模型的性能，研究者们不断尝试增加模型的参数数量，从而诞生了大模型这一概念。本文将从大模型的原理、训练过程、prompt和相关应用介绍等方面进行分析，帮助读者初步了解大模型。为了提高模型的性能，研究者们不断尝试增加模型的参数数量，从而诞生了大模型这一概念。本文讨论的大模型将以平时指向比较多的大语言模型为例来进行相关介绍。训练三步骤初步认识了大模型长什么样了，接下来一起来看看如何训练出一个大模型。除这些外还包括算法优化、隐私和数据安全以及模型可解释性等方面的研究和应用，每天还有很多大模型的应用正在不断涌现，大模型在未来仍然有很大的发展潜力，国内的优秀大模型代表例如百度文心大模型也正在搭建全系统产业化的大模型全景大模型挑战大模型也存在一些现实挑战： 1.数据安全隐患：一方面大模型训练需要大量的数据支持，但很多数据涉及到机密以及个人隐私问题，如客户信息、交易数据等。
21.2K29编辑于 2023-11-22
来自专栏IT从业者张某某
大模型与大模型的幻觉问题
参考大模型中的涌现 OpenAI 科学家：幻觉是大模型与生俱来的特性，而非缺陷大模型「幻觉」，看这一篇就够了｜哈工大华为出品大模型什么是大模型大语言模型（LLM）是基于海量文本数据训练的深度学习模型大模型的模型发展如下图涌现参考：大模型中的涌现什么是涌现？先从蚂蚁开始说起。蚂蚁是自然界中一种个体非常简单，但是群体能力非常强大的生物。如何解决大模型的「幻觉」问题？方向一：什么是大模型「幻觉」大模型出现幻觉，简而言之就是“胡说八道”。用文中的话来讲，是指模型生成的内容与现实世界事实或用户输入不一致的现象。 OpenAI 科学家 Andrej Karpathy关于大模型幻觉在 Karpathy 看来：从某种意义上说，大语言模型的全部工作恰恰就是制造幻觉，大模型就是「造梦机」。只有大模型助手存在幻觉问题。方向二：造成大模型「幻觉」的原因那么致使大模型产生幻觉的原因都有哪些？
1.8K11编辑于 2024-01-04
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。 LoRA是一种用于微调大型语言模型的轻量级方法，它通过添加低秩矩阵到预训练模型的权重上来实现适应性调整，从而在不显著增加模型大小的情况下提升特定任务的性能。 task_type: 指定任务类型，如'CAUSAL_LM'，以确保LoRA适应正确应用到模型的相应部分。 get_peft_model(model, config) print_trainable_parameters(model) 三、总结本文简要介绍LoraConfig的配置参数情况，具体的机遇peft对大模型进行微调后面单独开一页详细讲解
96010编辑于 2024-08-13
来自专栏java一日一条
未来编程的9大猜想
9. 指手画脚的BOSS让人抓狂这算不上是展望，因为他们已经做到了——这些上司们在速成班里学了点编程，就觉得自己成了行家，程序员于是就这样“被帮助”了。 “你要用一个变量吗？”
1.1K20发布于 2018-09-18
来自专栏网络技术联盟站
OSI模型第7层协议涉及的9大应用，你都了解吗？
9、多用途 Internet 邮件扩展 (MIME) 允许在 Internet 邮件的邮件标题中使用非 US-ASCII 文本消息、非文本消息、多部分消息正文和非 US-ASCII 信息。
65540编辑于 2023-03-13
来自专栏【腾讯云开发者】
赛博斗蛐蛐：9大模型决战三国志，天命在谁？
关注腾讯云开发者，一手技术干货提前解锁九个旗舰大模型决战中原，究竟谁才能问鼎天下，傲世群雄？作为一名游戏策划，我很想看看让不同的大模型在游戏中进行比试，看看究竟谁打游戏打的更好。蜀：qwen3.5-397b-a17b （其实我很喜欢qwen的8b模型，那qwen的大模型表现会如何呢？qwen加油！）吴白白送出了两员大将经济管理崩溃：建业从 R9 开始连续 5 回合缺粮，士气从 75 跌到 0，守军从 13717 逃散到 7956。随着大模型的能力越来越强，感觉未来还有很多新鲜的事情可以去尝试探索，让很多过去只能停留在想法层面的事情有了落地的可能性。 -End- 原创作者｜吴磾感谢你读到这里，不如关注一下？
12610编辑于 2026-04-09

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

👾打开 RAG 对接大模型的黑盒 —— 9 大隐藏问题

9月大型语言模型研究论文总结

开源大模型DeepSeek.ai火遍全球:9条让DeepSeek颠覆通用大模型的事实

大模型应用：本地大模型部署中的Token效率优化与性能分析.9

9，模型的评估

在Jetson上玩转大模型Day9：建立EffectiveViT测试环境

Python中9大时间序列预测模型

在Jetson上玩转大模型Day9：建立EffectiveViT测试环境

数据平滑9大妙招

通用大模型VS垂直大模型

【AI大模型】训练Al大模型

一文看尽SOTA生成式模型：9大类别21个模型全回顾！

一文看尽SOTA生成式模型：9大类别21个模型全回顾！

开源大模型与闭源大模型

原创 | 大模型扫盲系列——初识大模型

大模型与大模型的幻觉问题

【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig

未来编程的9大猜想

OSI模型第7层协议涉及的9大应用，你都了解吗？

赛博斗蛐蛐：9大模型决战三国志，天命在谁？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐