首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏掘金安东尼

    👾打开 RAG 对接模型的黑盒 —— 9 隐藏问题

    Prompt 给他介绍一下相关背景,然后模型就有更专业的应答能力了。 言而总之,大数据时代,很多公司都拥有大量的专有数据,如果能基于它们创建 RAG,将显著提升模型的特异性。 对于很多人来说,RAG 的引入、与模型的对接是一个黑盒,任何微小参数的变动都将引起结果发生很大的变化。 /模型没有回答问题/模型编造有害的或带有偏见的答案 接下来,一起揭秘:RAG 对接模型的黑盒 —— 9 大问题 来源:Seven Failure Points When Engineering a Retrieval 总结 本篇提供了开发 RAG 通道 9 个痛点,并针对每个痛点都给了相应的解决思路。 RAG 是非常重要的专用检索+通用模型的技术手段,在赋能模型、满足特定化场景中非常重要!

    77810编辑于 2024-04-04
  • 来自专栏DeepHub IMBA

    9型语言模型研究论文总结

    大型语言模型(llm)在今年发展迅速,随着新一代模型不断地被开发,研究人员和工程师了解最新进展变得非常重要。本文总结9-10月期间发布了一些重要的LLM论文。 这些论文涵盖了一系列语言模型的主题,从模型优化和缩放到推理、基准测试和增强性能。最后部分讨论了有关安全训练并确保其行为保持有益的论文。 我们还介绍了一种定制的监督微调和推理方法。 这种方法产生了MathCoder模型,这是一组能够生成基于代码的解决方案的模型,用于解决具有挑战性的数学问题。 这种方法有几个优点:它避免了标记或检索样本的需要,提供了通用性和方便性;它还可以为每个问题定制生成的示例和知识,提供适应性。 SmartPlay中的每个游戏都独特地挑战了智能LLM代理的9个重要功能的子集,包括对象依赖性推理,提前计划,空间推理,从历史中学习和理解随机性。

    76621编辑于 2023-10-23
  • 来自专栏量子位

    模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品

    Jiaxi 投稿自 凹非寺 量子位 | 公众号 QbitAI 北大团队新作,让模型拥有个性! 而且还是自定义那种,16种MBTI都能选。 这样一来,即便是同一个模型,不同性格下的回答都不一样。 ENFP的模型会说:喜欢参加社交活动,结识新朋友。 INFJ的模型则回答:喜欢独自读过。 这样能干啥呢?北大的童鞋们列出来了一些情景 : 在特殊节日,给你的男/女朋友寻找心仪的礼物。 深入理解模型定制化、个性化的方式及可能性。 在做出重大决策时,考虑不同情境下的个性特征。 通过深入了解人性的复杂性,促进个人成长和相互理解。 行为数据集的目的是为了让模型可以表现出不同性格的回应,这部分是对Alpaca数据集进行个性化修改实现。 行为数据集中MBTI四个维度的比例如下: 自我意识数据集是为了让模型能够意识到自己的个性特征。 通过一个两阶段的有监督训练微调过程,最后可以得到对应人格的模型

    98010编辑于 2024-01-17
  • 来自专栏猫头虎博客专区

    开源模型DeepSeek.ai火遍全球:9条让DeepSeek颠覆通用模型的事实

    DeepSeek.ai火遍全球的几个事实: DeepSeek 不是套壳不是蒸馏美国的模型。 虽然中国有些模型是套壳和蒸馏的, 但 DeepSeek 不是。 在训练阶段, Deepseek 用标注的 Long CoT 数据微调模型, 让模型生成更清晰的推理步骤, 在强化学习中用 CoT 设计奖励优化, 增强长链推理能力, 并且在此过程中观察到了模型的反思 ( 数据, 训练了 R1-Zero 模型, 探索了模型不依赖人类标注数据微调、自主推演的能力, 打开了新的思路。 比如轻量化设计把钢板换成钢条 (类似通过稀疏的办法减少模型的参数量); 涡轮增压利用废气能量增加空气供给, 提高燃烧效率; 精密制造, 使得发动机零部件的配合更加紧密, 从而减少能量损失; 等等。 基础模型终将 commoditize (商品化), toB 领域看谁能将 LLM 更好和复杂的生产环节衔接好帮客户落地提高生产效率, toC 领域看谁有流量入口, 最终才会获取 AI 产业价值创造中最多的利润

    1.1K10编辑于 2025-02-02
  • 来自专栏AiCharm

    训练开销骤减,10%成本定制专属类GPT-4多模态模型

    本文来自新加坡国立大学和清华大学的研究者提出了一个名为 VPGTrans 框架,以极低成本训练高性能多模态模型。 多模态模型定制:通过我们的 VPGTrans 框架可以根据需求为各种新的语言模型灵活添加视觉模块。 开源多模态对话模型:我们开源了 VL-Vicuna,可实现高质量的多模态对话: 图 2:VL-Vicuna 的交互实例 一、动机介绍 1.1 背景 2023 年是 AI 元年,以 ChatGPT 为代表的语言模型 比如,LLM 在多模态理解领域掀起了一股从传统预训练视觉语言模型 (VLM) 到基于语言模型的视觉语言模型 (VL-LLM) 的变革。 b) TaS 场景下,越小的语言模型上训练的 VPG,迁移到模型时效率越高,最终效果越好。c) TaT 场景下,越小的模型之间迁移的 gap 越大。

    48320编辑于 2023-06-07
  • 来自专栏实验盒

    NBT|BioChatter:为生物医学量身定制的开源语言模型应用平台

    引言 近年来,生成式人工智能尤其是语言模型(LLM)取得了显著进展,但在生物医学研究中的应用仍处于起步阶段。 BioChatter是一个开源的Python框架,旨在遵循开放科学原则,开发定制的生物医学研究软件。 它还促进了在简单性/经济性与安全性之间的定制部署,用户可以根据自己的需求在公共数据库、自托管云数据库和本地数据库之间进行选择,平衡安全性与成本。 系统提示与多智能体系统 BioChatter的可定制平台允许用户通过系统提示将其与自己的上下文对齐,并使用基于智能体的系统进行高级工作流程。 基准测试框架在所有模型和相关参数上运行这些测试,并通过BioChatter网站向社区报告结果。

    49510编辑于 2025-02-05
  • 来自专栏机器之心

    训练开销骤减,10%成本定制专属类GPT-4多模态模型

    本文来自新加坡国立大学和清华大学的研究者提出了一个名为 VPGTrans 框架,以极低成本训练高性能多模态模型。 多模态模型定制:通过我们的 VPGTrans 框架可以根据需求为各种新的语言模型灵活添加视觉模块。 开源多模态对话模型:我们开源了 VL-Vicuna,可实现高质量的多模态对话: 图 2:VL-Vicuna 的交互实例 一、动机介绍 1.1 背景 2023 年是 AI 元年,以 ChatGPT 为代表的语言模型 比如,LLM 在多模态理解领域掀起了一股从传统预训练视觉语言模型 (VLM) 到基于语言模型的视觉语言模型 (VL-LLM) 的变革。 b) TaS 场景下,越小的语言模型上训练的 VPG,迁移到模型时效率越高,最终效果越好。c) TaT 场景下,越小的模型之间迁移的 gap 越大。

    55920编辑于 2023-05-22
  • 来自专栏AI SPPECH

    63_模型定制:领域微调技术

    引言:为什么需要模型定制与微调 ├── 2. 微调技术体系:从全参数到参数高效 ├── 3. 全参数微调:深度定制的经典路径 ├── 4. 参数高效微调:资源受限下的优化选择 ├── 5. 指令调优:让模型更好地理解任务 ├── 6. RLHF:基于人类反馈的强化学习 ├── 7. 数据工程:微调成功的基础 ├── 8. 评估与优化:确保微调效果 └── 9. 行业应用与最佳实践 1. 引言:为什么需要模型定制与微调 在2025年的AI生态系统中,通用语言模型(LLM)如ChatGPT、LLaMA 4、Claude 4等已经展现出惊人的通用能力。 然而,当面对特定行业或场景的专业需求时,通用模型往往表现出局限性:术语理解不准确、领域知识不足、任务适配性差等问题。这正是模型定制与微调技术应运而生的背景。 A/B测试:比较不同微调策略的效果 集成优化:结合多种微调模型的优势 在线学习:在实际应用中不断优化模型 9.

    38710编辑于 2025-11-16
  • 来自专栏大模型应用

    模型应用:本地大模型部署中的Token效率优化与性能分析.9

    引言 在模型应用日益普及的今天,对模型交互过程中Token消耗的深入理解和有效管理变得至关重要。 Token作为模型处理文本的基本单位,不仅直接关系到模型的响应速度和质量,更影响着计算资源的消耗和使用成本。 随着模型规模的不断扩大和应用场景的多样化,如何在不牺牲对话质量的前提下优化Token使用效率,已成为提升模型应用经济性和实用性的关键问题。 助理回复:"我是通义千问,一个由开发的语言模型。我致力于帮助用户解答问题、提供信息和执行各种任务。" ,确保系统在不同硬件环境下的可用性通过持续的技术迭代和优化,我们相信Token效率优化将在推动语言模型普惠应用方面发挥越来越重要的作用。

    53143编辑于 2026-02-06
  • 来自专栏Python与算法之美

    9模型的评估

    模块中的交叉验证相关方法可以评估模型的泛化能力,能够有效避免过度拟合。 二,分类模型的评估 模型分类效果全部信息: confusion_matrix 混淆矩阵,误差矩阵。 ? 模型整体分类效果: accuracy 正确率。通用分类评估指标。 模型对某种类别的分类效果: precision 精确率,也叫查准率。模型不把正样本标错的能力。“不冤枉一个好人”。 recall 召回率,也叫查全率。模型识别出全部正样本的能力。 三,回归模型的评估 回归模型最常用的评估指标有: r2_score(r方,拟合优度,可决系数) explained_variance_score(解释方差得分) ? ? 留出法 为了解决过拟合问题,常见的方法将数据分为训练集和测试集,用训练集去训练模型的参数,用测试集去测试训练后模型的表现。

    96631发布于 2020-07-17
  • 来自专栏AI科技评论

    为每个用户提供专属定制服务,OPPO 安第斯模型的新卷法

    OPPO模型团队认为,有了模型技术加持的智能助手,将给用户带来全新的智能体验。 在模型以前,各个公司也会涉及AI板块,但根据应用的不同,可能会泛化出各类不同的小组,比如,对话一个AI团队,视频一个AI团队。 而在模型之后,一个通用模型能解决所有问题。 刘海锋表示,OPPO模型模型的规格方面,希望做由不同规格组成的一系列模型,既能够跟设备端更紧密的结合解决简单的任务,又可以部署在云端满足一些更复杂的需求。 安第斯模型基于端云协同架构构建。 可以看出OPPO安第斯模型主打知识与问答能力,显著提升了语言模型知识与百科能力的覆盖面和准确性。 图1 CLUE1.1总榜,共9个子任务 图2 KgCLUE1.0,知识图谱问答榜 从结果上,OPPO押注模型这一战,当前交出的成绩单似乎还不错。

    72820编辑于 2023-10-27
  • 标题:金融风控模型在腾讯云的定制化支持与技术指南

    摘要: 本文旨在解析金融风控模型技术能力,并提供基于腾讯云产品的定制化支持方案。文章将深入探讨技术核心价值、实施挑战、操作指南以及增强方案,并以结构化格式呈现,确保逻辑清晰、易于阅读。 3关键挑战 数据隐私与安全:在处理敏感金融数据时,如何确保数据安全和隐私保护是一挑战。 模型泛化能力:模型需要在不同的金融场景下保持高准确率,对模型的泛化能力提出了高要求。 实时性要求:金融风控需要实时或近实时的风险评估,对模型的响应速度和处理能力是一考验。 操作指南 实施流程 数据准备与预处理 原理说明:数据是金融风控模型的基础,需要从多个数据源收集并预处理数据以供模型训练。 在某银行客户实践中,通过腾讯云AI平台的定制化服务,成功将信用卡欺诈检测的准确率提高了20%。 通过本文的技术指南,您可以深入了解金融风控模型定制化支持方案,并利用腾讯云产品实现技术落地。

    54810编辑于 2025-07-29
  • 来自专栏程序员的知识天地

    Python中9时间序列预测模型

    当有预测模型来预测未知变量时,在时间充当独立变量和目标因变量的情况下,时间序列预测就出现了。 预测值可以是潜在雇员的工资或银行账户持有人的信用评分。 模型的表示法涉及指定模型p的顺序作为AR函数的参数。 )模型。 它结合了ARIMA模型,能够在季节性水平上执行相同的自回归、差分和移动平均建模。 SARIMAX方法还可用于使用外生变量对包含的模型进行建模,例如ARX,MAX,ARMAX和ARIMAX。

    1.7K40发布于 2019-05-25
  • 来自专栏GPUS开发者

    在Jetson上玩转模型Day9:建立EffectiveViT测试环境

    後來受到NLP在Transformer技術的突破,對視覺技術產生非常的衝擊,於是Google在2021年提出的ViT(Vision Transform)技術,對機器視覺上的圖片分類、物體檢測、語義分割等應用 ,產生非常的變化,不僅在效能上有所突破,並且爲視覺與語言模型相結合的多模態技術,開創新的格局。 本文章的重點,在於爲大家提供一個快速搭建測試不同ViT模型的實驗環境,因此需要尋找合適的模型來進行示範,爲此我們找到非常適合在邊緣AI設備上部署的EfficientViT模型。 opencv-python timm==0.6.13 tqdm torchprofile matplotlib git+https://github.com/zhijian-liu/torchpack.git@3a5a9f7ac665444e1eb45942ee3f8fc7ffbd84e5 目前項目提供三類應用,我們可以到 https://github.com/mit-han-lab/efficientvit/tree/master/applications 看到cls.md、sam.md

    36410编辑于 2024-11-04
  • 来自专栏AIOT

    在Jetson上玩转模型Day9:建立EffectiveViT测试环境

    後來受到NLP在Transformer技術的突破,對視覺技術產生非常的衝擊,於是Google在2021年提出的ViT(Vision Transform)技術,對機器視覺上的圖片分類、物體檢測、語義分割等應用 ,產生非常的變化,不僅在效能上有所突破,並且爲視覺與語言模型相結合的多模態技術,開創新的格局。 本文章的重點,在於爲大家提供一個快速搭建測試不同ViT模型的實驗環境,因此需要尋找合適的模型來進行示範,爲此我們找到非常適合在邊緣AI設備上部署的EfficientViT模型。 0.15.2einopsopencv-pythontimm==0.6.13tqdmtorchprofilematplotlibgit+https://github.com/zhijian-liu/torchpack.git@3a5a9f7ac665444e1eb45942ee3f8fc7ffbd84e5transformersonnxonnxsimonnxruntimegit 目前項目提供三類應用,我們可以到 https://github.com/mit-han-lab/efficientvit/tree/master/applications 看到cls.md、sam.md

    27910编辑于 2024-11-01
  • 来自专栏深度学习自然语言处理

    VPGTrans: 10%的成本定制你自己的类GPT-4多模态模型

    来自于新加坡国立大学和清华大学的研究工作提出一个VPGTrans框架,帮助小伙伴们实现极低成本训练一个高性能多模态模型。 多模态模型定制 通过我们的VPGTrans框架可以根据需求为各种新的语言模型灵活添加视觉模块。比如我们在LLaMA-7B和Vicuna-7B基础上制作了VL-LLaMA和VL-Vicuna。 为代表的语言模型(LLM)大火。 比如,LLM在多模态理解领域掀起了一股从传统预训练视觉语言模型(VLM)到基于语言模型的视觉语言模型(VL-LLM)的变革。 b) TaS场景下,越小的语言模型上训练的VPG,迁移到模型时效率越高,最终效果越好。c) TaT场景下,越小的模型之间迁移的gap越大。

    38220编辑于 2023-08-22
  • 来自专栏机器学习/数据可视化

    数据平滑9妙招

    今天给大家分享9常见数据平滑方法:移动平均Moving Average指数平滑Exponential Smoothing低通滤波器多项式拟合贝塞尔曲线拟合局部加权散点平滑LoessKalman滤波小波变换 阶多项式拟合的案例:import numpy as npimport matplotlib.pyplot as plt# 示例数据x = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9] Loess平滑的核心思想是在每个数据点附近拟合一个局部多项式模型,然后使用这些局部模型的加权平均来获得平滑曲线。 可调参数:Loess允许用户指定平滑窗口的大小或带宽,以控制局部模型的拟合程度。较小的带宽会导致更强的局部适应,而较大的带宽会导致更平滑的曲线。 卡尔曼滤波基于状态空间模型,其中系统状态通过线性或非线性动态模型演化,并且由观测模型通过传感器观测进行测量。

    6K44编辑于 2023-10-13
  • 来自专栏量子位

    ControlNet更新:仅靠提示词就能精准P图,保持画风不变,网友:效果堪比定制模型

    只需要一张参考图就能完成以上转变,部分图片几乎可以达到定制模型的效果了。 咳咳,各位AI绘画圈的朋友们,打起精神来,又有好玩的了。 (ps. 它不需要任何控制模型,直接使用参考图片就能引导扩散。 作者介绍,这个功能其实类似于“inpaint”功能,但不会让图像崩坏。

    1.2K20编辑于 2023-05-19
  • 来自专栏创作是最好的自我投资

    通用模型VS垂直模型

    在人工智能这个充满无限可能的领域内,通用模型和垂直模型各有千秋。就我个人而言,在二者之间的选择上,并不存在偏向某一方的倾向。我觉得应当依据实际应用场景的具体需求,来挑选最为契合的模型。 通用模型通用模型,乃是旨在应对多种任务与数据类型的庞然物级人工智能模型。 在知识覆盖的广度方面,通用模型无疑具有明显的优势。当我们对于当下所需模型所涉及的精确专业领域的界限感到模糊不清时,选择通用模型无疑是一种明智之举。垂直模型接下来谈谈垂直模型。 然而,由于垂直模型的训练内容聚焦于当前行业,其涉猎的范围更集中,数据针对性更强,所以在提供专业咨询时往往更加精准、细致,这也正是垂直模型的独特价值所在。 因此,对于通用模型或者垂直模型,更倾向于哪一方不取决于个人想法,而是取决于用户需要。

    76301编辑于 2024-12-30
  • 来自专栏小洁叫你mysql

    【AI模型】训练Al模型

    模型超越AI 目前所指的模型,是“大规模深度学习模型”的简称,指具有大量参数和复杂结构的机器学习模型,可以处理大规模的数据和复杂的问题,多应用于自然语言处理、计算机视觉、语音识别等领域。 本文将探讨模型的概念、训练技术和应用领域,以及与模型相关的挑战和未来发展方向。 模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数,而模型则可能拥有数亿或数十亿个参数。 训练模型的挑战 训练模型需要应对一系列挑战,包括: 以下是与模型相关的一些代码示例: 计算资源需求: import tensorflow as tf # 指定使用GPU进行训练 with tf.device 更智能的模型压缩技术:模型压缩和加速技术将继续发展,以减小模型的计算和存储开销。 更好的计算平台支持:为了支持训练和部署模型,计算平台将继续改进,提供更强大的计算资源和工具。

    1.5K30编辑于 2023-10-10
领券