首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏掘金安东尼

    👾打开 RAG 对接模型的黑盒 —— 9 隐藏问题

    Prompt 给他介绍一下相关背景,然后模型就有更专业的应答能力了。 言而总之,大数据时代,很多公司都拥有大量的专有数据,如果能基于它们创建 RAG,将显著提升模型的特异性。 对于很多人来说,RAG 的引入、与模型的对接是一个黑盒,任何微小参数的变动都将引起结果发生很大的变化。 /模型没有回答问题/模型编造有害的或带有偏见的答案 接下来,一起揭秘:RAG 对接模型的黑盒 —— 9 大问题 来源:Seven Failure Points When Engineering a Retrieval 总结 本篇提供了开发 RAG 通道 9 个痛点,并针对每个痛点都给了相应的解决思路。 RAG 是非常重要的专用检索+通用模型的技术手段,在赋能模型、满足特定化场景中非常重要!

    79310编辑于 2024-04-04
  • 来自专栏锤子代码

    Nginx反向代理模型推理接口(SSE)

    Nginx作用这么? 在后台写了一个接口,用来调用第三方的AI接口,SSE方式返回。 用普通的Nginx代理配置接口返回特别慢。 找了下原因,发现是代理配置有问题。 接口总算丝滑了。 http://192.168.0.105:228866 这个地址是你对应第三方AI模型返回数据的接口

    1.1K10编辑于 2025-04-04
  • 来自专栏DeepHub IMBA

    9型语言模型研究论文总结

    大型语言模型(llm)在今年发展迅速,随着新一代模型不断地被开发,研究人员和工程师了解最新进展变得非常重要。本文总结9-10月期间发布了一些重要的LLM论文。 这些论文涵盖了一系列语言模型的主题,从模型优化和缩放到推理、基准测试和增强性能。最后部分讨论了有关安全训练并确保其行为保持有益的论文。 这种方法产生了MathCoder模型,这是一组能够生成基于代码的解决方案的模型,用于解决具有挑战性的数学问题。 现有的问答基准(如ToMi)会向模型提问,以推断故事中人物的信念,但不会测试模型是否可以使用这些推断来指导它们的行动。 SmartPlay中的每个游戏都独特地挑战了智能LLM代理的9个重要功能的子集,包括对象依赖性推理,提前计划,空间推理,从历史中学习和理解随机性。

    77321编辑于 2023-10-23
  • 来自专栏大模型应用

    模型应用:模型的本地 API 服务:FastAPI 封装与接口鉴权.44

    一、引言 模型的里里外外我们都进行了很多细节的讲解,但模型的部署引用还没有涉及太多,今天我们重点讲一下模型接口发布,以及利用Postman工具的鉴权调试,Postman 是一款轻量、 让不同程序(比如 APP、网页)都能按统一规则跟模型沟通,而且这个窗口响应快、还会自动生成使用说明。接口鉴权:给 "服务窗口" 装一把 "安全锁"。 核心作用:把模型的 "推理功能"(比如文本生成、问答),包装成 "可网络调用的接口"。2.3 接口鉴权的核心目的身份验证:确认调用者是 "自己人",不是恶意攻击者。 定义接口函数:写一个 Python 函数,接收用户请求,比如提示词,调用模型生成结果,再返回给用户。 启动服务:用 Uvicorn(ASGI 服务器)运行应用,模型就变成了可网络访问的 API 服务。3. 接口鉴权原理3.1 调用 API Key 鉴权的接口本质:验证 "调用者凭证" 的有效性。

    48153编辑于 2026-03-13
  • 来自专栏猫头虎博客专区

    开源模型DeepSeek.ai火遍全球:9条让DeepSeek颠覆通用模型的事实

    DeepSeek.ai火遍全球的几个事实: DeepSeek 不是套壳不是蒸馏美国的模型。 虽然中国有些模型是套壳和蒸馏的, 但 DeepSeek 不是。 在训练阶段, Deepseek 用标注的 Long CoT 数据微调模型, 让模型生成更清晰的推理步骤, 在强化学习中用 CoT 设计奖励优化, 增强长链推理能力, 并且在此过程中观察到了模型的反思 ( 数据, 训练了 R1-Zero 模型, 探索了模型不依赖人类标注数据微调、自主推演的能力, 打开了新的思路。 比如轻量化设计把钢板换成钢条 (类似通过稀疏的办法减少模型的参数量); 涡轮增压利用废气能量增加空气供给, 提高燃烧效率; 精密制造, 使得发动机零部件的配合更加紧密, 从而减少能量损失; 等等。 基础模型终将 commoditize (商品化), toB 领域看谁能将 LLM 更好和复杂的生产环节衔接好帮客户落地提高生产效率, toC 领域看谁有流量入口, 最终才会获取 AI 产业价值创造中最多的利润

    1.1K10编辑于 2025-02-02
  • 来自专栏韩曙亮的移动开发专栏

    【AI 模型】函数调用 Function Calling ① ( 人机交互接口 与 应用程序编程接口 | 语言界面接口 | AI 模型缺陷与补救措施 | 函数调用为模型赋能 真逻辑 )

    应用程序编程接口 发展问题 , 短时间内实现的可能性不大 ; 二、AI 模型缺陷与补救措施 - 函数调用 Function Calling 引入 1、AI 模型原理 GPT 模型 ( Generative ; 根据现有提示词 , 后面生成每个词的概率中 , sat 的概率是 0.5 , 概率最大 , 则生成 sat 单词 ; 2、AI 模型缺陷 AI 模型有如下 缺陷 : 并非全知全能 : AI 模型 上述 三种缺陷 , 因此 需要 有一种机制 , 使得 AI 模型 需要 与 外部进行交互 , 为 AI 模型 对接 各种接口 ; 特定领域的知识或消息 , 如 : 非公开信息等 ; 专业领域的接口 , 数据输入进去 , 跟炼丹一样 , 得到一个结果 , 不知道具体的推理步骤和过程 ; GPT 模型 并没有 逻辑推理能力 ; 5、函数调用 Function Calling 为 模型 赋能 " 解决各种具体的问题 ; 函数调用 Function Calling 就是 使用代码 实现的 " 真逻辑 " , 嵌入到 AI 模型中 , 在 模型 的 概率生成文本的 基础上 增加 确定性的 "

    1.8K10编辑于 2024-07-14
  • 来自专栏大模型应用

    模型应用:本地大模型部署中的Token效率优化与性能分析.9

    引言 在模型应用日益普及的今天,对模型交互过程中Token消耗的深入理解和有效管理变得至关重要。 Token作为模型处理文本的基本单位,不仅直接关系到模型的响应速度和质量,更影响着计算资源的消耗和使用成本。 随着模型规模的不断扩大和应用场景的多样化,如何在不牺牲对话质量的前提下优化Token使用效率,已成为提升模型应用经济性和实用性的关键问题。 助理回复:"我是通义千问,一个由开发的语言模型。我致力于帮助用户解答问题、提供信息和执行各种任务。" ,确保系统在不同硬件环境下的可用性通过持续的技术迭代和优化,我们相信Token效率优化将在推动语言模型普惠应用方面发挥越来越重要的作用。

    58743编辑于 2026-02-06
  • 来自专栏测试开发干货

    接口测试平台代码实现113:登录态接口-9

    本节我们要把登陆态安装到 请求体中,首先我们先解决一个bug,就是当选择不添加登陆态时候,login_res未被定义的问题:

    43050编辑于 2022-05-19
  • 来自专栏Python与算法之美

    9模型的评估

    模块中的交叉验证相关方法可以评估模型的泛化能力,能够有效避免过度拟合。 二,分类模型的评估 模型分类效果全部信息: confusion_matrix 混淆矩阵,误差矩阵。 ? 模型整体分类效果: accuracy 正确率。通用分类评估指标。 模型对某种类别的分类效果: precision 精确率,也叫查准率。模型不把正样本标错的能力。“不冤枉一个好人”。 recall 召回率,也叫查全率。模型识别出全部正样本的能力。 三,回归模型的评估 回归模型最常用的评估指标有: r2_score(r方,拟合优度,可决系数) explained_variance_score(解释方差得分) ? ? 留出法 为了解决过拟合问题,常见的方法将数据分为训练集和测试集,用训练集去训练模型的参数,用测试集去测试训练后模型的表现。

    97131发布于 2020-07-17
  • 来自专栏GPUS开发者

    在Jetson上玩转模型Day9:建立EffectiveViT测试环境

    後來受到NLP在Transformer技術的突破,對視覺技術產生非常的衝擊,於是Google在2021年提出的ViT(Vision Transform)技術,對機器視覺上的圖片分類、物體檢測、語義分割等應用 ,產生非常的變化,不僅在效能上有所突破,並且爲視覺與語言模型相結合的多模態技術,開創新的格局。 本文章的重點,在於爲大家提供一個快速搭建測試不同ViT模型的實驗環境,因此需要尋找合適的模型來進行示範,爲此我們找到非常適合在邊緣AI設備上部署的EfficientViT模型。 opencv-python timm==0.6.13 tqdm torchprofile matplotlib git+https://github.com/zhijian-liu/torchpack.git@3a5a9f7ac665444e1eb45942ee3f8fc7ffbd84e5 目前項目提供三類應用,我們可以到 https://github.com/mit-han-lab/efficientvit/tree/master/applications 看到cls.md、sam.md

    37210编辑于 2024-11-04
  • 来自专栏AIOT

    在Jetson上玩转模型Day9:建立EffectiveViT测试环境

    後來受到NLP在Transformer技術的突破,對視覺技術產生非常的衝擊,於是Google在2021年提出的ViT(Vision Transform)技術,對機器視覺上的圖片分類、物體檢測、語義分割等應用 ,產生非常的變化,不僅在效能上有所突破,並且爲視覺與語言模型相結合的多模態技術,開創新的格局。 本文章的重點,在於爲大家提供一個快速搭建測試不同ViT模型的實驗環境,因此需要尋找合適的模型來進行示範,爲此我們找到非常適合在邊緣AI設備上部署的EfficientViT模型。 0.15.2einopsopencv-pythontimm==0.6.13tqdmtorchprofilematplotlibgit+https://github.com/zhijian-liu/torchpack.git@3a5a9f7ac665444e1eb45942ee3f8fc7ffbd84e5transformersonnxonnxsimonnxruntimegit 目前項目提供三類應用,我們可以到 https://github.com/mit-han-lab/efficientvit/tree/master/applications 看到cls.md、sam.md

    28110编辑于 2024-11-01
  • 来自专栏程序员的知识天地

    Python中9时间序列预测模型

    当有预测模型来预测未知变量时,在时间充当独立变量和目标因变量的情况下,时间序列预测就出现了。 预测值可以是潜在雇员的工资或银行账户持有人的信用评分。 模型的表示法涉及指定模型p的顺序作为AR函数的参数。 )模型。 它结合了ARIMA模型,能够在季节性水平上执行相同的自回归、差分和移动平均建模。 SARIMAX方法还可用于使用外生变量对包含的模型进行建模,例如ARX,MAX,ARMAX和ARIMAX。

    1.8K40发布于 2019-05-25
  • 从零到一:使用pycharm搭建API接口调用模型

    从零到一:使用pycharm搭建API接口调用模型【前言】随着人工智能技术的快速发展,语言模型(LLM)已成为许多应用场景的核心技术。 本文将详细介绍如何使用PyCharm开发环境搭建API接口调用模型的完整流程,包括两种主流调用方式、模型列表查看方法,以及一个完整的求职岗位查询实战案例。 【任务】1.掌握使用OpenAI库和requests库调用模型API的方法。2.学会查看和展示可用的模型列表。3.实现基于模型的求职岗位查询系统。4.掌握API调用的错误处理和结果展示技巧。 By:不吃花椒的喵酱一.模型调用模型调用有两种方式,一种通过openai库进行调用,一种通过requests库进行调用。 () 图4:获取模型列表表格形式代码示例三.通过pycharm调用API接口,实现模型求职岗位查询第一步:准备工作在运行代码之前,请确保你的项目目录下有以下文件和配置。

    1.7K21编辑于 2025-12-23
  • 来自专栏机器学习/数据可视化

    数据平滑9妙招

    今天给大家分享9常见数据平滑方法:移动平均Moving Average指数平滑Exponential Smoothing低通滤波器多项式拟合贝塞尔曲线拟合局部加权散点平滑LoessKalman滤波小波变换 阶多项式拟合的案例:import numpy as npimport matplotlib.pyplot as plt# 示例数据x = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9] Loess平滑的核心思想是在每个数据点附近拟合一个局部多项式模型,然后使用这些局部模型的加权平均来获得平滑曲线。 可调参数:Loess允许用户指定平滑窗口的大小或带宽,以控制局部模型的拟合程度。较小的带宽会导致更强的局部适应,而较大的带宽会导致更平滑的曲线。 卡尔曼滤波基于状态空间模型,其中系统状态通过线性或非线性动态模型演化,并且由观测模型通过传感器观测进行测量。

    6K44编辑于 2023-10-13
  • 来自专栏创作是最好的自我投资

    通用模型VS垂直模型

    在人工智能这个充满无限可能的领域内,通用模型和垂直模型各有千秋。就我个人而言,在二者之间的选择上,并不存在偏向某一方的倾向。我觉得应当依据实际应用场景的具体需求,来挑选最为契合的模型。 通用模型通用模型,乃是旨在应对多种任务与数据类型的庞然物级人工智能模型。 在知识覆盖的广度方面,通用模型无疑具有明显的优势。当我们对于当下所需模型所涉及的精确专业领域的界限感到模糊不清时,选择通用模型无疑是一种明智之举。垂直模型接下来谈谈垂直模型。 然而,由于垂直模型的训练内容聚焦于当前行业,其涉猎的范围更集中,数据针对性更强,所以在提供专业咨询时往往更加精准、细致,这也正是垂直模型的独特价值所在。 因此,对于通用模型或者垂直模型,更倾向于哪一方不取决于个人想法,而是取决于用户需要。

    78101编辑于 2024-12-30
  • 来自专栏小洁叫你mysql

    【AI模型】训练Al模型

    模型超越AI 目前所指的模型,是“大规模深度学习模型”的简称,指具有大量参数和复杂结构的机器学习模型,可以处理大规模的数据和复杂的问题,多应用于自然语言处理、计算机视觉、语音识别等领域。 本文将探讨模型的概念、训练技术和应用领域,以及与模型相关的挑战和未来发展方向。 模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数,而模型则可能拥有数亿或数十亿个参数。 训练模型的挑战 训练模型需要应对一系列挑战,包括: 以下是与模型相关的一些代码示例: 计算资源需求: import tensorflow as tf # 指定使用GPU进行训练 with tf.device 更智能的模型压缩技术:模型压缩和加速技术将继续发展,以减小模型的计算和存储开销。 更好的计算平台支持:为了支持训练和部署模型,计算平台将继续改进,提供更强大的计算资源和工具。

    1.5K30编辑于 2023-10-10
  • 来自专栏技术杂货店

    java集合【9】-- Vector接口源码解析

    同样继承AbstractList,实现了List,RandomAcess,Cloneable, java.io.Serializable接口。 具有以下特点: 提供随机访问的功能:实现RandomAcess接口,这个接口主要是为List提供快速访问的功能,也就是通过元素的索引,可以快速访问到。 if (newCapacity - minCapacity < 0) newCapacity = minCapacity; // 如果新的容量比最大的容量还要( +; ensureCapacityHelper(minCapacity); } } 手动将元素个数设置为newSize,分为两种情况,一种是新的size比现在的size还要, ,这个接口有两个方法,一个是hasMoreElements(),表示是否有下一个元素。

    67100发布于 2020-11-22
  • 来自专栏新智元

    一文看尽SOTA生成式模型9类别21个模型全回顾!

    过去的两年时间里,AI界的大型生成模型发布呈井喷之势,尤其是Stable Diffusion开源和ChatGPT开放接口后,更加激发了业界对生成式模型的热情。 但生成式模型种类繁多,发布速度也非常快,稍不留神就有可能错过了sota 最近,来自西班牙科米利亚斯主教大学的研究人员全面回顾了各个领域内AI的最新进展,将生成式模型按照任务模态、领域分为了九类,并总结了 论文链接:https://arxiv.org/abs/2301.04655 生成式AI分类 模型可以按照输入和输出的数据类型进行分类,目前主要包括9类。 有趣的是,在这些已发布模型的背后,只有六个组织(OpenAI, Google, DeepMind, Meta, runway, Nvidia)参与部署了这些最先进的模型。 用户可以向模型输入query,并附上一张照片或一段视频,模型就会用文本答案来回答。 Flamingo模型利用了两个互补的模型:一个是分析视觉场景的视觉模型,一个是执行基本推理形式的大型语言模型

    84930编辑于 2023-02-24
  • 来自专栏数据派THU

    一文看尽SOTA生成式模型9类别21个模型全回顾!

    过去的两年时间里,AI界的大型生成模型发布呈井喷之势,尤其是Stable Diffusion开源和ChatGPT开放接口后,更加激发了业界对生成式模型的热情。 最近,来自西班牙科米利亚斯主教大学的研究人员全面回顾了各个领域内AI的最新进展,将生成式模型按照任务模态、领域分为了九类,并总结了2022年发布的21个生成式模型,一次看明白生成式模型的发展脉络! 论文链接:https://arxiv.org/abs/2301.04655 生成式AI分类 模型可以按照输入和输出的数据类型进行分类,目前主要包括9类。 有趣的是,在这些已发布模型的背后,只有六个组织(OpenAI, Google, DeepMind, Meta, runway, Nvidia)参与部署了这些最先进的模型。 用户可以向模型输入query,并附上一张照片或一段视频,模型就会用文本答案来回答。 Flamingo模型利用了两个互补的模型:一个是分析视觉场景的视觉模型,一个是执行基本推理形式的大型语言模型

    1.8K30编辑于 2023-03-29
  • 评测腾讯混元模型,python调用混元生文接口

    想丰富腾讯混元python sdk 调用混元模型的实例。下面介绍python实现混元生文接口ChatCompletions实例。 975098478c96","Usage":{"PromptTokens":40,"CompletionTokens":1,"TotalTokens":41}}好的例子二:hunyuan-functioncall模型如何用流式方式调用接口 例子三:hunyuan-functioncall模型多轮对话如何调用接口,调用工具import jsonimport osfrom tencentcloud.common import credentialfrom 示例三多轮问答中调用查询天气工具时,混元模型回答的有问题。 工具查询的天气情况是:北京今天的天气情况如下:温度:35℃风向:西南风天气状况:暴雨深圳今天的天气情况如下:温度:20℃风向:西北风天气状况:晴模型回答的结果是:北京今天的天气情况如下:温度:35℃风向

    1.5K20编辑于 2024-09-13
领券