首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏锤子代码

    Nginx反向代理模型推理接口(SSE)

    Nginx作用这么? 在后台写了一个接口,用来调用第三方的AI接口,SSE方式返回。 用普通的Nginx代理配置接口返回特别慢。 找了下原因,发现是代理配置有问题。 接口总算丝滑了。 http://192.168.0.105:228866 这个地址是你对应第三方AI模型返回数据的接口

    1.1K10编辑于 2025-04-04
  • 来自专栏大模型应用

    模型应用:模型的本地 API 服务:FastAPI 封装与接口鉴权.44

    一、引言 模型的里里外外我们都进行了很多细节的讲解,但模型的部署引用还没有涉及太多,今天我们重点讲一下模型接口发布,以及利用Postman工具的鉴权调试,Postman 是一款轻量、 让不同程序(比如 APP、网页)都能按统一规则跟模型沟通,而且这个窗口响应快、还会自动生成使用说明。接口鉴权:给 "服务窗口" 装一把 "安全锁"。 核心作用:把模型的 "推理功能"(比如文本生成、问答),包装成 "可网络调用的接口"。2.3 接口鉴权的核心目的身份验证:确认调用者是 "自己人",不是恶意攻击者。 定义接口函数:写一个 Python 函数,接收用户请求,比如提示词,调用模型生成结果,再返回给用户。 启动服务:用 Uvicorn(ASGI 服务器)运行应用,模型就变成了可网络访问的 API 服务。3. 接口鉴权原理3.1 调用 API Key 鉴权的接口本质:验证 "调用者凭证" 的有效性。

    48153编辑于 2026-03-13
  • 来自专栏韩曙亮的移动开发专栏

    【AI 模型】函数调用 Function Calling ① ( 人机交互接口 与 应用程序编程接口 | 语言界面接口 | AI 模型缺陷与补救措施 | 函数调用为模型赋能 真逻辑 )

    应用程序编程接口 发展问题 , 短时间内实现的可能性不大 ; 二、AI 模型缺陷与补救措施 - 函数调用 Function Calling 引入 1、AI 模型原理 GPT 模型 ( Generative ; 根据现有提示词 , 后面生成每个词的概率中 , sat 的概率是 0.5 , 概率最大 , 则生成 sat 单词 ; 2、AI 模型缺陷 AI 模型有如下 缺陷 : 并非全知全能 : AI 模型 上述 三种缺陷 , 因此 需要 有一种机制 , 使得 AI 模型 需要 与 外部进行交互 , 为 AI 模型 对接 各种接口 ; 特定领域的知识或消息 , 如 : 非公开信息等 ; 专业领域的接口 , 数据输入进去 , 跟炼丹一样 , 得到一个结果 , 不知道具体的推理步骤和过程 ; GPT 模型 并没有 逻辑推理能力 ; 5、函数调用 Function Calling 为 模型 赋能 " 解决各种具体的问题 ; 函数调用 Function Calling 就是 使用代码 实现的 " 真逻辑 " , 嵌入到 AI 模型中 , 在 模型 的 概率生成文本的 基础上 增加 确定性的 "

    1.8K10编辑于 2024-07-14
  • 从零到一:使用pycharm搭建API接口调用模型

    从零到一:使用pycharm搭建API接口调用模型【前言】随着人工智能技术的快速发展,语言模型(LLM)已成为许多应用场景的核心技术。 本文将详细介绍如何使用PyCharm开发环境搭建API接口调用模型的完整流程,包括两种主流调用方式、模型列表查看方法,以及一个完整的求职岗位查询实战案例。 【任务】1.掌握使用OpenAI库和requests库调用模型API的方法。2.学会查看和展示可用的模型列表。3.实现基于模型的求职岗位查询系统。4.掌握API调用的错误处理和结果展示技巧。 By:不吃花椒的喵酱一.模型调用模型调用有两种方式,一种通过openai库进行调用,一种通过requests库进行调用。 () 图4:获取模型列表表格形式代码示例三.通过pycharm调用API接口,实现模型求职岗位查询第一步:准备工作在运行代码之前,请确保你的项目目录下有以下文件和配置。

    1.7K21编辑于 2025-12-23
  • 来自专栏创作是最好的自我投资

    通用模型VS垂直模型

    在人工智能这个充满无限可能的领域内,通用模型和垂直模型各有千秋。就我个人而言,在二者之间的选择上,并不存在偏向某一方的倾向。我觉得应当依据实际应用场景的具体需求,来挑选最为契合的模型。 通用模型通用模型,乃是旨在应对多种任务与数据类型的庞然物级人工智能模型。 在知识覆盖的广度方面,通用模型无疑具有明显的优势。当我们对于当下所需模型所涉及的精确专业领域的界限感到模糊不清时,选择通用模型无疑是一种明智之举。垂直模型接下来谈谈垂直模型。 然而,由于垂直模型的训练内容聚焦于当前行业,其涉猎的范围更集中,数据针对性更强,所以在提供专业咨询时往往更加精准、细致,这也正是垂直模型的独特价值所在。 因此,对于通用模型或者垂直模型,更倾向于哪一方不取决于个人想法,而是取决于用户需要。

    78101编辑于 2024-12-30
  • 来自专栏小洁叫你mysql

    【AI模型】训练Al模型

    模型超越AI 目前所指的模型,是“大规模深度学习模型”的简称,指具有大量参数和复杂结构的机器学习模型,可以处理大规模的数据和复杂的问题,多应用于自然语言处理、计算机视觉、语音识别等领域。 本文将探讨模型的概念、训练技术和应用领域,以及与模型相关的挑战和未来发展方向。 模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数,而模型则可能拥有数亿或数十亿个参数。 训练模型的挑战 训练模型需要应对一系列挑战,包括: 以下是与模型相关的一些代码示例: 计算资源需求: import tensorflow as tf # 指定使用GPU进行训练 with tf.device 更智能的模型压缩技术:模型压缩和加速技术将继续发展,以减小模型的计算和存储开销。 更好的计算平台支持:为了支持训练和部署模型,计算平台将继续改进,提供更强大的计算资源和工具。

    1.5K30编辑于 2023-10-10
  • 评测腾讯混元模型,python调用混元生文接口

    想丰富腾讯混元python sdk 调用混元模型的实例。下面介绍python实现混元生文接口ChatCompletions实例。 975098478c96","Usage":{"PromptTokens":40,"CompletionTokens":1,"TotalTokens":41}}好的例子二:hunyuan-functioncall模型如何用流式方式调用接口 例子三:hunyuan-functioncall模型多轮对话如何调用接口,调用工具import jsonimport osfrom tencentcloud.common import credentialfrom 示例三多轮问答中调用查询天气工具时,混元模型回答的有问题。 工具查询的天气情况是:北京今天的天气情况如下:温度:35℃风向:西南风天气状况:暴雨深圳今天的天气情况如下:温度:20℃风向:西北风天气状况:晴模型回答的结果是:北京今天的天气情况如下:温度:35℃风向

    1.5K20编辑于 2024-09-13
  • 来自专栏IT从业者张某某

    模型模型的幻觉问题

    参考 模型中的涌现 OpenAI 科学家:幻觉是模型与生俱来的特性,而非缺陷 模型「幻觉」,看这一篇就够了|哈工大华为出品 模型 什么是模型 语言模型(LLM)是基于海量文本数据训练的深度学习模型 模型模型发展如下图 涌现 参考:模型中的涌现 什么是涌现?先从蚂蚁开始说起。蚂蚁是自然界中一种个体非常简单,但是群体能力非常强大的生物。 如何解决模型的「幻觉」问题? 方向一:什么是模型「幻觉」 模型出现幻觉,简而言之就是“胡说八道”。 用文中的话来讲,是指模型生成的内容与现实世界事实或用户输入不一致的现象。 OpenAI 科学家 Andrej Karpathy关于模型幻觉 在 Karpathy 看来: 从某种意义上说,语言模型的全部工作恰恰就是制造幻觉,模型就是「造梦机」。 只有模型助手存在幻觉问题。 方向二:造成大模型「幻觉」的原因 那么致使模型产生幻觉的原因都有哪些?

    1.8K11编辑于 2024-01-04
  • 来自专栏数据派THU

    原创 | 模型扫盲系列——初识模型

    为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了模型这一概念。本文将从模型的原理、训练过程、prompt和相关应用介绍等方面进行分析,帮助读者初步了解模型。 为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了模型这一概念。本文讨论的模型将以平时指向比较多的语言模型为例来进行相关介绍。 训练三步骤 初步认识了模型长什么样了,接下来一起来看看如何训练出一个模型。 除这些外还包括算法优化、隐私和数据安全以及模型可解释性等方面的研究和应用,每天还有很多大模型的应用正在不断涌现,模型在未来仍然有很大的发展潜力,国内的优秀模型代表例如百度文心模型也正在搭建全系统产业化的模型全景 模型挑战 模型也存在一些现实挑战: 1.数据安全隐患:一方面模型训练需要大量的数据支持,但很多数据涉及到机密以及个人隐私问题,如客户信息、交易数据等。

    21.2K29编辑于 2023-11-22
  • 来自专栏人工智能极简应用

    【AI模型】Transformers模型库(八):模型微调之LoraConfig

    一、引言 这里的Transformers指的是huggingface开发的模型库,为huggingface上数以万计的预训练模型提供预测、训练等服务。 你可以直接使用一个框架训练你的模型然后用另一个加载和推理。 LoRA是一种用于微调大型语言模型的轻量级方法,它通过添加低秩矩阵到预训练模型的权重上来实现适应性调整,从而在不显著增加模型大小的情况下提升特定任务的性能。 task_type: 指定任务类型,如'CAUSAL_LM',以确保LoRA适应正确应用到模型的相应部分。 get_peft_model(model, config) print_trainable_parameters(model) 三、总结 本文简要介绍LoraConfig的配置参数情况,具体的机遇peft对模型进行微调后面单独开一页详细讲解

    96410编辑于 2024-08-13
  • 来自专栏学习

    开源模型与闭源模型

    在人工智能(AI)和机器学习(ML)的快速发展过程中,模型(Large Models)已经成为推动技术进步的重要力量。当前,业界存在两种主要的模型开发模式:开源模型和闭源模型。 一、开源模型 开源模型是指开发者将模型的代码和训练数据公开,使得任何人都可以访问、修改和使用这些资源。 二、闭源模型 闭源模型是指模型的代码和数据不对外公开,通常由商业公司开发和维护。代表性的闭源模型包括OpenAI的GPT-3和Google的BERT。 三、开源模型与闭源模型的对比 1.透明性与可控性: 开源模型的透明性更高,任何人都可以查看和验证其代码和数据,确保模型的行为符合预期。这对于学术研究和技术验证非常重要。 闭源模型通过控制代码和数据的访问,能够更好地保护用户隐私和数据安全,降低被恶意利用的风险。 五、总结 开源模型和闭源模型各有优缺点,适合不同的应用场景和需求。

    1.7K10编辑于 2024-10-09
  • 来自专栏机器学习入门

    【AI模型】LLM主流开源模型介绍

    学习目标 了解LLM主流开源模型. 掌握ChatGLM、LLaMA、Bloom等基础模型的原理 LLM主流模型类别 随着ChatGPT迅速火爆,引发了模型的时代变革,国内外各大公司也快速跟进生成式AI市场,近百款模型发布及应用 目前,市面上已经开源了各种类型的语言模型,本章节我们主要介绍其中的三类: ChatGLM-6B:衍生的模型(wenda、ChatSQL等) LLaMA:衍生的模型(Alpaca、Vicuna BLOOM模型 BLOOM系列模型是由 Hugging Face公司的BigScience 团队训练的语言模型。 小结 本小节主要介绍了LLM主流的开源模型,对不同模型架构、训练目标、优缺点进行了分析和总结。

    1.2K10编辑于 2024-09-24
  • 来自专栏IT从业者张某某

    语言模型-1.2-模型技术基础

    简介 1.2 模型技术基础 语言模型 预训练阶段会得到base model,本质上就是一个互联网文本模拟器,这个阶段需要上万台服务器训练几个月的时间,这个生成的模型可以认为是互联网的有损压缩。 构建一个语言模型 语言模型预训练(Pre-training) 使用与下游任务无关的大规模数据进行模型参数的初始训练 ➢ 基于Transformer解码器架构,进行下一个词预测 ➢ 数据数量、数据质量都非常关键 人类对齐(Human Alignment) ➢ 将语言模型与人类的期望、需求以及价值观对齐 ➢ 基于人类反馈的强化学习对齐方法(RLHF) 模型的研发已经成为一项系统工程 扩展定律( Scaling Law) ➢ 通过扩展参数规模、数据规模和计算算力,语言模型的能力会出现显著提升 ➢ 扩展定律在本次大模型浪潮中起到了重要作用 语言模型采用了与小型预训练语言模型相似的神经网络结构 ,从而获得更可靠的答案 涌现能力与扩展定律的关系 ➢ 涌现能力和扩展定律是两种描述规模效应的度量方法 模型核心技术 ➢ 规模扩展:扩展定律奠定了早期模型的技术路线,产生了巨大的性能提升

    53810编辑于 2025-03-15
  • 来自专栏测试开发技术

    推荐一个DeepSeek 模型的免费 API 项目!兼容OpenAI接口

    在AI技术飞速发展的今天,语言模型(LLM)的应用越来越广泛,但高昂的使用成本常常让个人开发者和小型团队望而却步。 今天,我要为大家介绍一个非常实用的开源项目——DeepSeek-Free-API,它能够让你免费接入DeepSeek模型,轻松实现各种AI功能。 它提供了一个API服务,让开发者可以免费调用DeepSeek语言模型的能力。 该项目的主要特点包括: 支持高速流式输出:能够快速响应,提升用户体验。 4、API使用说明 DeepSeek-Free-API提供了与OpenAI兼容的/v1/chat/completions接口。开发者可以使用与OpenAI或其他兼容的客户端来调用这个接口。 5、小结 DeepSeek-Free-API为开发者提供了一个免费且强大的工具,可以快速接入DeepSeek模型。无论你是想进行AI编程、智能对话还是其他AI应用开发,这个项目都能满足你的需求。

    16.3K10编辑于 2025-02-19
  • 来自专栏人工智能极简应用

    【AI模型】Transformers模型库(十二):Evaluate模型评估

    一、引言 这里的Transformers指的是huggingface开发的模型库,为huggingface上数以万计的预训练模型提供预测、训练等服务。 你可以直接使用一个框架训练你的模型然后用另一个加载和推理。 本文重点介绍Evaluate模型评估。 二、Evaluate模型评估 2.1 概述 Transformers库中的evaluate API主要用于评估模型在特定数据集上的性能。 下面是一个使用Python和Transformers库进行模型评估的基本步骤,假设你已经有了一个预训练模型和相应的数据集处理器。 评估结果将包含各种指标,如准确率,具体指标还要取决于你的模型

    1.1K10编辑于 2024-08-13
  • 来自专栏muller的测试分享

    MetaLlama模型

    llama 模型介绍我们介绍 LLaMA,这是一个基础语言模型的集合,参数范围从 7B 到 65B。 我们在数万亿个Token上训练我们的模型,并表明可以专门使用公开可用的数据集来训练最先进的模型,而无需诉诸专有的和无法访问的数据集。 特别是,LLaMA-13B 在大多数基准测试中都优于 GPT-3 (175B),llama2 模型介绍我们开发并发布了 Llama 2,这是一组经过预训练和微调的大型语言模型 (LLM),其参数规模从 我们经过微调的语言模型(称为 Llama 2-Chat)针对对话用例进行了优化。 //huggingface.co/meta-llama/Llama-2-7bhttps://huggingface.co/docs/transformers/model_doc/llamallama 语言模型提供的主要模型列表

    45610编辑于 2024-09-02
  • 来自专栏muller的测试分享

    mixtral模型

    简介Mixtral 是一种具有开放权重的高质量稀疏专家混合模型 (SMoE)。根据 Apache 2.0 许可。 它是最强大的开放权重模型,具有宽松的许可证,也是成本/性能权衡方面的最佳模型。特别是,它在大多数标准基准测试中匹配或优于 GPT3.5。Mixtral 的特点可以优雅地处理 32k 令牌的上下文。 请为google编写web自动化测试用例,使用pytest page object设计模式,断言使用hamcrest') debug(r)总结Mixtral 是一种具有开放权重的高质量稀疏专家混合模型

    22910编辑于 2024-10-16
  • 来自专栏AI

    模型微调

    # 模型微调的主流方式、核心区别与底层原理 微调(Fine-tuning)的核心底层共性:基于预训练模型的知识迁移,冻结预训练模型的大部分通用特征参数,仅针对具体任务优化少量参数/引入轻量模块/设计提示特征 核心特点 优点:任务适配性最强,能充分挖掘任务数据的特征,效果理论上最优; 缺点:算力/数据需求极高(需千万级以上任务数据,模型全量微调需上百张GPU)、易过拟合、模型存储成本高(一个任务一个模型)、 核心特点:效果接近全量微调,是工业级模型的主流选择,参数量仍控制在5%以内。 特点:少样本适配(百/千级样本),效果优于硬提示,无推理延迟,适合超大规模模型。 ; 避免全量/部分微调:针对Transformer模型的两段式端到端架构,全量/部分微调的算力成本极高,且多任务适配时模型存储成本不可接受。

    60810编辑于 2026-02-09
  • 模型 RAG】

    模型 RAG(Retrieval-Augmented Generation)是指结合检索和生成技术的模型,在生成任务中引入了检索的过程。 在学术界,研究者通常会在模型 RAG 的基础上提出新的模型结构、训练方法和评估指标等方面的创新。他们会通过论文发表、学术研讨会等方式将研究成果传播给其他研究人员,推动该领域的发展。 而在工业界,企业通常会将模型 RAG 技术应用到实际的产品和应用中,解决一些实际问题。 学术界与工业界可以进行合作研究项目,共同开展模型 RAG 技术的研究与探索。学术界可以提供理论指导和算法创新,工业界可以提供实际数据和场景需求。 总之,模型 RAG 场景下的产学结合是学术界和工业界合作研究和应用模型 RAG 技术的一种方式,通过合作与交流,推动该领域的发展和应用。

    30410编辑于 2025-08-29
  • 来自专栏phodal

    语言接口:探索模型优先架构的新一代 API 设计

    过去的两三个月里,在开发基于语言模型的软件时,也一直在思考如何设计一个模型优先架构。 而随着越来越多的团队加入到这场竞赛里,我们会发现:基于语言模型的软件架构与过去的不同之处,诸如于:我们需要新一代的 API。 我暂时将这一代 API 称为:语言接口/语言 API(大概会有大佬来发起新的名称),原因是:自然语言只是人机的接口,DSL 是 AI 与机器的接口、机器与机器的接口。 适用场景:以自然语言作为沟通媒介 示例:在我们习惯了模型的能力之后,也开始接受了自然语言作为一种 API。 模式:语言显式化重试 意图:提高大语言模型生成结果的准确性,并保持历史消息,以便进行对话记录和可视化。 适用场景:由于语言模型的不确定性,生成的结果往往不够准确。

    1.2K30编辑于 2023-08-11
领券