搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏锤子代码
Nginx反向代理大模型推理接口(SSE)
Nginx作用这么大？在后台写了一个接口，用来调用第三方的AI接口，SSE方式返回。用普通的Nginx代理配置接口返回特别慢。找了下原因，发现是代理配置有问题。接口总算丝滑了。 http://192.168.0.105:228866 这个地址是你对应第三方AI大模型返回数据的接口。
1.1K10编辑于 2025-04-04
来自专栏大模型应用
大模型应用：大模型的本地 API 服务：FastAPI 封装与接口鉴权.44
一、引言大模型的里里外外我们都进行了很多细节的讲解，但大模型的部署引用还没有涉及太多，今天我们重点讲一下模型的接口发布，以及利用Postman工具的鉴权调试，Postman 是一款轻量、让不同程序（比如 APP、网页）都能按统一规则跟大模型沟通，而且这个窗口响应快、还会自动生成使用说明。接口鉴权：给 "服务窗口" 装一把 "安全锁"。核心作用：把大模型的 "推理功能"（比如文本生成、问答），包装成 "可网络调用的接口"。2.3 接口鉴权的核心目的身份验证：确认调用者是 "自己人"，不是恶意攻击者。定义接口函数：写一个 Python 函数，接收用户请求，比如提示词，调用大模型生成结果，再返回给用户。启动服务：用 Uvicorn（ASGI 服务器）运行应用，大模型就变成了可网络访问的 API 服务。3. 接口鉴权原理3.1 调用 API Key 鉴权的接口本质：验证 "调用者凭证" 的有效性。
48153编辑于 2026-03-13
来自专栏韩曙亮的移动开发专栏
【AI 大模型】函数调用 Function Calling ① ( 人机交互接口与应用程序编程接口 | 语言界面接口 | AI 大模型缺陷与补救措施 | 函数调用为大模型赋能真逻辑 )
应用程序编程接口发展问题 , 短时间内实现的可能性不大 ; 二、AI 大模型缺陷与补救措施 - 函数调用 Function Calling 引入 1、AI 大模型原理 GPT 大模型 ( Generative ; 根据现有提示词 , 后面生成每个词的概率中 , sat 的概率是 0.5 , 概率最大 , 则生成 sat 单词 ; 2、AI 大模型缺陷 AI 大模型有如下缺陷 : 并非全知全能 : AI 大模型上述三种缺陷 , 因此需要有一种机制 , 使得 AI 大模型需要与外部进行交互 , 为 AI 大模型对接各种接口 ; 特定领域的知识或消息 , 如 : 非公开信息等 ; 专业领域的接口 , 数据输入进去 , 跟炼丹一样 , 得到一个结果 , 不知道具体的推理步骤和过程 ; GPT 大模型并没有逻辑推理能力 ; 5、函数调用 Function Calling 为大模型赋能 " 解决各种具体的问题 ; 函数调用 Function Calling 就是使用代码实现的 " 真逻辑 " , 嵌入到 AI 大模型中 , 在大模型的概率生成文本的基础上增加确定性的 "
1.8K10编辑于 2024-07-14
从零到一：使用pycharm搭建API接口调用大模型
从零到一：使用pycharm搭建API接口调用大模型【前言】随着人工智能技术的快速发展，大语言模型（LLM）已成为许多应用场景的核心技术。本文将详细介绍如何使用PyCharm开发环境搭建API接口调用大模型的完整流程，包括两种主流调用方式、模型列表查看方法，以及一个完整的求职岗位查询实战案例。【任务】1.掌握使用OpenAI库和requests库调用大模型API的方法。2.学会查看和展示可用的大模型列表。3.实现基于大模型的求职岗位查询系统。4.掌握API调用的错误处理和结果展示技巧。 By:不吃花椒的喵酱一.大模型调用大模型调用有两种方式，一种通过openai库进行调用，一种通过requests库进行调用。 () 图4：获取模型列表表格形式代码示例三.通过pycharm调用API接口，实现大模型求职岗位查询第一步：准备工作在运行代码之前，请确保你的项目目录下有以下文件和配置。
1.7K21编辑于 2025-12-23
来自专栏创作是最好的自我投资
通用大模型VS垂直大模型
在人工智能这个充满无限可能的领域内，通用大模型和垂直大模型各有千秋。就我个人而言，在二者之间的选择上，并不存在偏向某一方的倾向。我觉得应当依据实际应用场景的具体需求，来挑选最为契合的大模型。通用大模型通用大模型，乃是旨在应对多种任务与数据类型的庞然大物级人工智能模型。在知识覆盖的广度方面，通用大模型无疑具有明显的优势。当我们对于当下所需模型所涉及的精确专业领域的界限感到模糊不清时，选择通用大模型无疑是一种明智之举。垂直大模型接下来谈谈垂直大模型。然而，由于垂直大模型的训练内容聚焦于当前行业，其涉猎的范围更集中，数据针对性更强，所以在提供专业咨询时往往更加精准、细致，这也正是垂直大模型的独特价值所在。因此，对于通用大模型或者垂直大模型，更倾向于哪一方不取决于个人想法，而是取决于用户需要。
78101编辑于 2024-12-30
来自专栏小洁叫你mysql
【AI大模型】训练Al大模型
大模型超越AI 目前所指的大模型，是“大规模深度学习模型”的简称，指具有大量参数和复杂结构的机器学习模型，可以处理大规模的数据和复杂的问题，多应用于自然语言处理、计算机视觉、语音识别等领域。本文将探讨大模型的概念、训练技术和应用领域，以及与大模型相关的挑战和未来发展方向。大模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数，而大模型则可能拥有数亿或数十亿个参数。训练大模型的挑战训练大模型需要应对一系列挑战，包括：以下是与大模型相关的一些代码示例：计算资源需求： import tensorflow as tf # 指定使用GPU进行训练 with tf.device 更智能的模型压缩技术：模型压缩和加速技术将继续发展，以减小大模型的计算和存储开销。更好的计算平台支持：为了支持训练和部署大模型，计算平台将继续改进，提供更强大的计算资源和工具。
1.5K30编辑于 2023-10-10
评测腾讯混元大模型，python调用混元生文接口
想丰富腾讯混元python sdk 调用混元大模型的实例。下面介绍python实现混元生文接口ChatCompletions实例。 975098478c96","Usage":{"PromptTokens":40,"CompletionTokens":1,"TotalTokens":41}}好的例子二：hunyuan-functioncall模型如何用流式方式调用接口例子三：hunyuan-functioncall模型多轮对话如何调用接口，调用工具import jsonimport osfrom tencentcloud.common import credentialfrom 示例三多轮问答中调用查询天气工具时，混元大模型回答的有问题。工具查询的天气情况是：北京今天的天气情况如下：温度：35℃风向：西南风天气状况：暴雨深圳今天的天气情况如下：温度：20℃风向：西北风天气状况：晴大模型回答的结果是：北京今天的天气情况如下：温度：35℃风向
1.5K20编辑于 2024-09-13
来自专栏IT从业者张某某
大模型与大模型的幻觉问题
参考大模型中的涌现 OpenAI 科学家：幻觉是大模型与生俱来的特性，而非缺陷大模型「幻觉」，看这一篇就够了｜哈工大华为出品大模型什么是大模型大语言模型（LLM）是基于海量文本数据训练的深度学习模型大模型的模型发展如下图涌现参考：大模型中的涌现什么是涌现？先从蚂蚁开始说起。蚂蚁是自然界中一种个体非常简单，但是群体能力非常强大的生物。如何解决大模型的「幻觉」问题？方向一：什么是大模型「幻觉」大模型出现幻觉，简而言之就是“胡说八道”。用文中的话来讲，是指模型生成的内容与现实世界事实或用户输入不一致的现象。 OpenAI 科学家 Andrej Karpathy关于大模型幻觉在 Karpathy 看来：从某种意义上说，大语言模型的全部工作恰恰就是制造幻觉，大模型就是「造梦机」。只有大模型助手存在幻觉问题。方向二：造成大模型「幻觉」的原因那么致使大模型产生幻觉的原因都有哪些？
1.8K11编辑于 2024-01-04
来自专栏数据派THU
原创 | 大模型扫盲系列——初识大模型
为了提高模型的性能，研究者们不断尝试增加模型的参数数量，从而诞生了大模型这一概念。本文将从大模型的原理、训练过程、prompt和相关应用介绍等方面进行分析，帮助读者初步了解大模型。为了提高模型的性能，研究者们不断尝试增加模型的参数数量，从而诞生了大模型这一概念。本文讨论的大模型将以平时指向比较多的大语言模型为例来进行相关介绍。训练三步骤初步认识了大模型长什么样了，接下来一起来看看如何训练出一个大模型。除这些外还包括算法优化、隐私和数据安全以及模型可解释性等方面的研究和应用，每天还有很多大模型的应用正在不断涌现，大模型在未来仍然有很大的发展潜力，国内的优秀大模型代表例如百度文心大模型也正在搭建全系统产业化的大模型全景大模型挑战大模型也存在一些现实挑战： 1.数据安全隐患：一方面大模型训练需要大量的数据支持，但很多数据涉及到机密以及个人隐私问题，如客户信息、交易数据等。
21.2K29编辑于 2023-11-22
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。 LoRA是一种用于微调大型语言模型的轻量级方法，它通过添加低秩矩阵到预训练模型的权重上来实现适应性调整，从而在不显著增加模型大小的情况下提升特定任务的性能。 task_type: 指定任务类型，如'CAUSAL_LM'，以确保LoRA适应正确应用到模型的相应部分。 get_peft_model(model, config) print_trainable_parameters(model) 三、总结本文简要介绍LoraConfig的配置参数情况，具体的机遇peft对大模型进行微调后面单独开一页详细讲解
96410编辑于 2024-08-13
来自专栏学习
开源大模型与闭源大模型
在人工智能（AI）和机器学习（ML）的快速发展过程中，大模型（Large Models）已经成为推动技术进步的重要力量。当前，业界存在两种主要的大模型开发模式：开源大模型和闭源大模型。一、开源大模型开源大模型是指开发者将模型的代码和训练数据公开，使得任何人都可以访问、修改和使用这些资源。二、闭源大模型闭源大模型是指模型的代码和数据不对外公开，通常由商业公司开发和维护。代表性的闭源大模型包括OpenAI的GPT-3和Google的BERT。三、开源大模型与闭源大模型的对比 1.透明性与可控性：开源大模型的透明性更高，任何人都可以查看和验证其代码和数据，确保模型的行为符合预期。这对于学术研究和技术验证非常重要。闭源大模型通过控制代码和数据的访问，能够更好地保护用户隐私和数据安全，降低被恶意利用的风险。五、总结开源大模型和闭源大模型各有优缺点，适合不同的应用场景和需求。
1.7K10编辑于 2024-10-09
来自专栏机器学习入门
【AI大模型】LLM主流开源大模型介绍
学习目标了解LLM主流开源大模型. 掌握ChatGLM、LLaMA、Bloom等基础大模型的原理 LLM主流大模型类别随着ChatGPT迅速火爆，引发了大模型的时代变革，国内外各大公司也快速跟进生成式AI市场，近百款大模型发布及应用目前，市面上已经开源了各种类型的大语言模型，本章节我们主要介绍其中的三大类： ChatGLM-6B：衍生的大模型（wenda、ChatSQL等） LLaMA：衍生的大模型（Alpaca、Vicuna BLOOM模型 BLOOM系列模型是由 Hugging Face公司的BigScience 团队训练的大语言模型。小结本小节主要介绍了LLM主流的开源大模型，对不同模型架构、训练目标、优缺点进行了分析和总结。
1.2K10编辑于 2024-09-24
来自专栏IT从业者张某某
大语言模型-1.2-大模型技术基础
简介 1.2 大模型技术基础大语言模型预训练阶段会得到base model，本质上就是一个互联网文本模拟器，这个阶段需要上万台服务器训练几个月的时间，这个生成的模型可以认为是互联网的有损压缩。构建一个大语言模型大语言模型预训练（Pre-training）使用与下游任务无关的大规模数据进行模型参数的初始训练 ➢ 基于Transformer解码器架构，进行下一个词预测 ➢ 数据数量、数据质量都非常关键人类对齐（Human Alignment） ➢ 将大语言模型与人类的期望、需求以及价值观对齐 ➢ 基于人类反馈的强化学习对齐方法（RLHF）大模型的研发已经成为一项系统工程扩展定律（ Scaling Law) ➢ 通过扩展参数规模、数据规模和计算算力，大语言模型的能力会出现显著提升 ➢ 扩展定律在本次大模型浪潮中起到了重要作用大语言模型采用了与小型预训练语言模型相似的神经网络结构，从而获得更可靠的答案涌现能力与扩展定律的关系 ➢ 涌现能力和扩展定律是两种描述规模效应的度量方法大模型核心技术 ➢ 规模扩展：扩展定律奠定了早期大模型的技术路线，产生了巨大的性能提升
53810编辑于 2025-03-15
来自专栏测试开发技术
推荐一个DeepSeek 大模型的免费 API 项目！兼容OpenAI接口！
在AI技术飞速发展的今天，大语言模型（LLM）的应用越来越广泛，但高昂的使用成本常常让个人开发者和小型团队望而却步。今天，我要为大家介绍一个非常实用的开源项目——DeepSeek-Free-API，它能够让你免费接入DeepSeek大模型，轻松实现各种AI功能。它提供了一个API服务，让开发者可以免费调用DeepSeek大语言模型的能力。该项目的主要特点包括：支持高速流式输出：能够快速响应，提升用户体验。 4、API使用说明 DeepSeek-Free-API提供了与OpenAI兼容的/v1/chat/completions接口。开发者可以使用与OpenAI或其他兼容的客户端来调用这个接口。 5、小结 DeepSeek-Free-API为开发者提供了一个免费且强大的工具，可以快速接入DeepSeek大模型。无论你是想进行AI编程、智能对话还是其他AI应用开发，这个项目都能满足你的需求。
16.3K10编辑于 2025-02-19
来自专栏人工智能极简应用
【AI大模型】Transformers大模型库（十二）：Evaluate模型评估
一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。你可以直接使用一个框架训练你的模型然后用另一个加载和推理。本文重点介绍Evaluate模型评估。二、Evaluate模型评估 2.1 概述 Transformers库中的evaluate API主要用于评估模型在特定数据集上的性能。下面是一个使用Python和Transformers库进行模型评估的基本步骤，假设你已经有了一个预训练模型和相应的数据集处理器。评估结果将包含各种指标，如准确率，具体指标还要取决于你的模型。
1.1K10编辑于 2024-08-13
来自专栏muller的测试分享
MetaLlama大模型
llama 大模型介绍我们介绍 LLaMA，这是一个基础语言模型的集合，参数范围从 7B 到 65B。我们在数万亿个Token上训练我们的模型，并表明可以专门使用公开可用的数据集来训练最先进的模型，而无需诉诸专有的和无法访问的数据集。特别是，LLaMA-13B 在大多数基准测试中都优于 GPT-3 (175B)，llama2 大模型介绍我们开发并发布了 Llama 2，这是一组经过预训练和微调的大型语言模型 (LLM)，其参数规模从我们经过微调的大语言模型（称为 Llama 2-Chat）针对对话用例进行了优化。 //huggingface.co/meta-llama/Llama-2-7bhttps://huggingface.co/docs/transformers/model_doc/llamallama 大语言模型提供的主要模型列表
45610编辑于 2024-09-02
来自专栏muller的测试分享
mixtral大模型
简介Mixtral 是一种具有开放权重的高质量稀疏专家混合模型 (SMoE)。根据 Apache 2.0 许可。它是最强大的开放权重模型，具有宽松的许可证，也是成本/性能权衡方面的最佳模型。特别是，它在大多数标准基准测试中匹配或优于 GPT3.5。Mixtral 的特点可以优雅地处理 32k 令牌的上下文。请为google编写web自动化测试用例，使用pytest page object设计模式，断言使用hamcrest') debug(r)总结Mixtral 是一种具有开放权重的高质量稀疏专家混合模型
22910编辑于 2024-10-16
来自专栏AI
大模型微调
# 大模型微调的主流方式、核心区别与底层原理微调（Fine-tuning）的核心底层共性：基于预训练模型的知识迁移，冻结预训练模型的大部分通用特征参数，仅针对具体任务优化少量参数/引入轻量模块/设计提示特征核心特点优点：任务适配性最强，能充分挖掘任务数据的特征，效果理论上最优；缺点：算力/数据需求极高（需千万级以上任务数据，大模型全量微调需上百张GPU）、易过拟合、模型存储成本高（一个任务一个模型）、核心特点：效果接近全量微调，是工业级大模型的主流选择，参数量仍控制在5%以内。特点：少样本适配（百/千级样本），效果优于硬提示，无推理延迟，适合超大规模大模型。；避免全量/部分微调：针对Transformer大模型的两段式端到端架构，全量/部分微调的算力成本极高，且多任务适配时模型存储成本不可接受。
60810编辑于 2026-02-09
【大模型 RAG】
大模型 RAG（Retrieval-Augmented Generation）是指结合检索和生成技术的模型，在生成任务中引入了检索的过程。在学术界，研究者通常会在大模型 RAG 的基础上提出新的模型结构、训练方法和评估指标等方面的创新。他们会通过论文发表、学术研讨会等方式将研究成果传播给其他研究人员，推动该领域的发展。而在工业界，企业通常会将大模型 RAG 技术应用到实际的产品和应用中，解决一些实际问题。学术界与工业界可以进行合作研究项目，共同开展大模型 RAG 技术的研究与探索。学术界可以提供理论指导和算法创新，工业界可以提供实际数据和场景需求。总之，大模型 RAG 场景下的产学结合是学术界和工业界合作研究和应用大模型 RAG 技术的一种方式，通过合作与交流，推动该领域的发展和应用。
30410编辑于 2025-08-29
来自专栏phodal
语言接口：探索大模型优先架构的新一代 API 设计
过去的两三个月里，在开发基于大语言模型的软件时，也一直在思考如何设计一个大模型优先架构。而随着越来越多的团队加入到这场竞赛里，我们会发现：基于大语言模型的软件架构与过去的不同之处，诸如于：我们需要新一代的 API。我暂时将这一代 API 称为：语言接口/语言 API（大概会有大佬来发起新的名称），原因是：自然语言只是人机的接口，DSL 是 AI 与机器的接口、机器与机器的接口。适用场景：以自然语言作为沟通媒介示例：在我们习惯了大模型的能力之后，也开始接受了自然语言作为一种 API。模式：语言显式化重试意图：提高大语言模型生成结果的准确性，并保持历史消息，以便进行对话记录和可视化。适用场景：由于大语言模型的不确定性，生成的结果往往不够准确。
1.2K30编辑于 2023-08-11

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Nginx反向代理大模型推理接口(SSE)

大模型应用：大模型的本地 API 服务：FastAPI 封装与接口鉴权.44

【AI 大模型】函数调用 Function Calling ① ( 人机交互接口与应用程序编程接口 | 语言界面接口 | AI 大模型缺陷与补救措施 | 函数调用为大模型赋能真逻辑 )

从零到一：使用pycharm搭建API接口调用大模型

通用大模型VS垂直大模型

【AI大模型】训练Al大模型

评测腾讯混元大模型，python调用混元生文接口

大模型与大模型的幻觉问题

原创 | 大模型扫盲系列——初识大模型

【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig

开源大模型与闭源大模型

【AI大模型】LLM主流开源大模型介绍

大语言模型-1.2-大模型技术基础

推荐一个DeepSeek 大模型的免费 API 项目！兼容OpenAI接口！

【AI大模型】Transformers大模型库（十二）：Evaluate模型评估

MetaLlama大模型

mixtral大模型

大模型微调

【大模型 RAG】

语言接口：探索大模型优先架构的新一代 API 设计

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

Nginx反向代理大模型推理接口(SSE)

大模型应用：大模型的本地 API 服务：FastAPI 封装与接口鉴权.44

【AI 大模型】函数调用 Function Calling ① ( 人机交互接口 与 应用程序编程接口 | 语言界面接口 | AI 大模型缺陷与补救措施 | 函数调用为大模型赋能 真逻辑 )

从零到一：使用pycharm搭建API接口调用大模型

通用大模型VS垂直大模型

【AI大模型】训练Al大模型

评测腾讯混元大模型，python调用混元生文接口

大模型与大模型的幻觉问题

原创 | 大模型扫盲系列——初识大模型

【AI大模型】Transformers大模型库（八）：大模型微调之LoraConfig

开源大模型与闭源大模型

【AI大模型】LLM主流开源大模型介绍

大语言模型-1.2-大模型技术基础

推荐一个DeepSeek 大模型的免费 API 项目！兼容OpenAI接口！

【AI大模型】Transformers大模型库（十二）：Evaluate模型评估

MetaLlama大模型

mixtral大模型

大模型微调

【大模型 RAG】

语言接口：探索大模型优先架构的新一代 API 设计

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

【AI 大模型】函数调用 Function Calling ① ( 人机交互接口与应用程序编程接口 | 语言界面接口 | AI 大模型缺陷与补救措施 | 函数调用为大模型赋能真逻辑 )