首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI

    AI 语音模型调用

    AI 语音模型(AILM)通常作为云服务 API 提供给开发者,这使得我们无需部署昂贵的硬件,就能在应用程序中集成高性能的语音功能。调用过程涵盖了身份认证、数据传输和参数配置等关键环节。1. 核心调用流程与模型选择调用 AILM API 的基本流程可以概括为:认证 → 数据输入 → 参数配置 → 接收输出。2. 2.2 实时语音转文本(ASR)的调用ASR 服务通常提供流式 API 和批处理 API 两种调用方式。流式调用(Streaming ASR): 适用于实时语音输入(如语音聊天、实时字幕)。 phrase_hints 或 context_boost: 提供专有名词、行业术语或人名列表,帮助模型提高对特定词汇的识别准确率。 通过遵循这些步骤和最佳实践,您可以高效且安全地将 AI 语音模型的功能集成到您的应用程序中。

    63210编辑于 2025-09-29
  • 来自专栏go

    go调用腾讯混元模型

    go-easy-llm 点击 github go-easy-llm 查看更多 一个满足你的调用多种模型API的轮子,支持目前市面多家第三方模型,包含ChatGPT、通义千问、文心模型、混元、盘古、 百川智能等; 一套写法兼容所有平台,简单配置即可灵活使用第三方模型API。 简单几步即可使用第三方模型API 混元模型调用 创建密钥 点击我 进行密钥创建 通过这一步,你就会拿到腾讯的 secretId、secretKey,主要用于鉴权使用 引入go-easy-llm go Chat 模式模型 一次性回复 NormalChat resp, reply, err := client.NormalChat(context.Background(), &easyai.ChatRequest Message: "介绍一下你自己", }) for content := range resp { fmt.Println(content) } 通过以上简单几步,你就可以轻松的调用腾讯混元模型

    45810编辑于 2024-09-02
  • 来自专栏软件测试学习

    怎么通过API调用AI模型获取响应结果

    要通过api在代码里面去调用模型,需要先申请模型的api key,以deepseek官网为例,apikey的申请地址:https://platform.deepseek.com/api_keys 目前 ,deepseek通过apikey调用是要收费的,注册后需要充值使用,也可以用其他第三方平台的apikey调用的方式进行接入,代码都是差不多的,改一下相关的配置就行。 代码案例的话,deepseek官网就有提供最简单的案例: https://api-docs.deepseek.com/zh-cn/ 调用上面的代码,需要安装依赖: pip install openai 通过上面2篇文章,一个是可以将模型切换为其他第三方平台的api进行调用,有的平台注册会赠送一定的体验额度,可以临时用于代码调试啥的,另一篇文章的话,是可以将代码里面的apikey以及对应的api地址等信息放到配置文件里面 模型列表可以参考:https://huggingface.co/deepseek-ai/models https://modelscope.cn/models

    5.1K10编辑于 2025-06-23
  • 来自专栏人工智能应用

    模型本地部署与应用调用的技术指南

    本地部署模型是指将预训练好的语言模型下载到本地设备(个人电脑、服务器或边缘设备)上,并通过特定的推理框架进行加载和调用的过程。 本文将帮助您克服这些挑战,实现模型的高效本地部署。 目前主流的开源模型包括: 1. 智谱AI的GLM系列 GLM-4:最新一代开源模型 许可证:允许非商业使用 优势:中文理解能力强,指令遵循度高 模型下载与准备 模型获取途径 Hugging Face:最主要的模型分发平台 随着开源模型质量的提升和部署技术的成熟,本地LLM应用将变得越来越普及。希望本指南能帮助您成功部署自己的模型应用,探索AI技术的无限可能。

    4.4K10编辑于 2025-08-01
  • Java接入AI模型:适配与稳定调用实践指南

    然而,当Java企业尝试将AI模型融入现有架构时,多模型统一适配与生产级稳定调用成为两核心障碍。 一、Java接入AI模型的核心挑战当前Java企业在AI模型接入阶段,主要面临适配成本高与调用不稳定两结构性问题,直接影响项目落地效率与系统安全性。 1.2 生产环境的调用稳定性问题模型本身具有响应时延不确定、资源消耗高的特性,在生产高并发场景下易引发系统故障:• 资源耗尽风险:模型调用耗时较长,若采用同步阻塞模式,易导致Tomcat连接池、线程池耗尽 二、Java接入AI模型的技术架构设计解决上述问题的核心思路是构建解耦的统一接入层,通过标准化接口与工程化设计,实现多模型兼容与高可用调用。 2.2.2 稳定调用保障模块为应对模型调用的不确定性,该模块需构建全链路容错机制:• 异步非阻塞调用:基于Java NIO或异步框架(如Spring WebFlux)设计调用逻辑,避免同步阻塞占用大量线程资源

    44010编辑于 2026-03-13
  • 来自专栏代码简单说

    StepFun API快速接入教程(Python+cURL调用模型

    StepFun API快速接入教程(Python+cURL调用模型) 关键词:StepFun API教程、阶跃星辰API调用、Step-3.5-flash使用、AI模型接入、Python调用模型、 curl调用AI接口 前言 最近在做AI项目选型时,我发现不少开发者只知道OpenAI接口,其实国内也有很多可直接接入的模型平台。 这篇文章手把手带你从0到1接入 StepFun 模型 API,包括: API Key申请 Python 调用 cURL 调用 stream流式返回解析 常见报错说明 看完即可直接在项目中落地。 CentOS sudo yum install curl CentOS 8+ sudo dnf install curl macOS brew install curl 四、发送第一个请求 接下来开始正式调用模型 85, "completion_tokens": 340, "total_tokens": 425 } } 重点字段 字段 作用 choices.message.content 模型回答

    6110编辑于 2026-06-16
  • 手把手教你用【Go】语言调用DeepSeek模型

    标点符号,模型会把你输入的文字拆成这种小单元处理。 二、模型区别:选哪个? 模型名称 适合场景 核心功能 一句话总结 deepseek-chat 日常对话、简单问答 支持生成 JSON、调用工具 聊天机器人,能帮你写简短文案、查信息 deepseek-reasoner 复杂推理 先看费用结构:花的钱 = 输入 token 数 × 单价 + 输出 token 数 × 单价 (输入:你发给模型的文字;输出:模型回复你的文字) 1. 借鉴资料: 1、DeepSeek API 文档 2、【GoLang】手把手教你用Go语言调用DeepSeek-R1模型

    79010编辑于 2025-10-22
  • 来自专栏有文化的技术人

    你还在为模型调用费发愁吗?

    ❞ 一、先搞清楚钱花在哪了 模型的计费逻辑其实很简单:「按 Token 数收费」,输入输出分开算。 但问题来了——很多场景下,你的输入其实在重复。 二、各家的缓存机制 目前主流模型都支持某种形式的缓存。我把它们分成三类: 第一类:自动缓存(OpenAI、Gemini) 这类最省心,「你什么都不用做,系统自动帮你缓存」。 KV Cache:Transformer 的"记忆本" 要理解 Prompt 缓存,首先得知道模型推理时有个东西叫 「KV Cache」。 七、写在最后 模型的缓存机制,本质上是在帮你做一件事:「为重复的工作只付一次钱」。 它不是什么高深的技术优化,而是实实在在的成本控制手段。 对于月调用量上百万 Token 的应用来说,用好缓存省下的钱,可能比换一个便宜模型还多。

    28910编辑于 2026-05-19
  • 从零到一:使用pycharm搭建API接口调用模型

    从零到一:使用pycharm搭建API接口调用模型【前言】随着人工智能技术的快速发展,语言模型(LLM)已成为许多应用场景的核心技术。 本文将详细介绍如何使用PyCharm开发环境搭建API接口调用模型的完整流程,包括两种主流调用方式、模型列表查看方法,以及一个完整的求职岗位查询实战案例。 【任务】1.掌握使用OpenAI库和requests库调用模型API的方法。2.学会查看和展示可用的模型列表。3.实现基于模型的求职岗位查询系统。4.掌握API调用的错误处理和结果展示技巧。 By:不吃花椒的喵酱一.模型调用模型调用有两种方式,一种通过openai库进行调用,一种通过requests库进行调用。 我们在实际开发中,调用模型API时,错误处理和结果展示是非常关键的两个环节。

    2.3K21编辑于 2025-12-23
  • 来自专栏DotNet NB && CloudNative

    基于ChatGPT函数调用来实现C#本地函数逻辑链式调用助力模型落地

    通过这项能力模型在需要的时候可以调用函数并生成对应的 JSON 对象作为输出。 这使开发人员能更准确地从模型获取结构化数据,实现从自然语言到 API 调用或数据库查询的转换,也可以用于从文本中提取结构化数据。 ,无疑在稳定性(基于三方库的函数调用主要是依赖提示词实现,其稳定性和提示词质量高度相关)和易用性上都上了一台阶。    今天我们就以一个具体的案例来讲一下什么是函数调用,基于函数调用我们可以实现哪些能力,从而将一个只能聊天的语言模型落地到更加真实的业务场景中。 但是现在基于语言模型和函数调用,以上这些功能只需要单个开发者用极短的时间即可实现。因为基于语言模型本身的逻辑思维,它可以选择调用哪些函数来实现功能,而我们要做的仅仅是告诉它有哪些功能而已。   

    79440编辑于 2023-08-30
  • 来自专栏韩曙亮的移动开发专栏

    【AI 模型】函数调用 Function Calling ① ( 人机交互接口 与 应用程序编程接口 | 语言界面接口 | AI 模型缺陷与补救措施 | 函数调用模型赋能 真逻辑 )

    应用程序编程接口 发展问题 , 短时间内实现的可能性不大 ; 二、AI 模型缺陷与补救措施 - 函数调用 Function Calling 引入 1、AI 模型原理 GPT 模型 ( Generative ; 根据现有提示词 , 后面生成每个词的概率中 , sat 的概率是 0.5 , 概率最大 , 则生成 sat 单词 ; 2、AI 模型缺陷 AI 模型有如下 缺陷 : 并非全知全能 : AI 模型 Function Calling 实现 ; 函数调用 Function Calling 是 模型 与 真实世界的实际业务 进行联系交互的纽带 , 使用 函数调用 可以将 模型 与 实际业务 进行关联 , 肯定无法达到这个要求 ; 可读性 : 不能像神经元网络一样 , 数据输入进去 , 跟炼丹一样 , 得到一个结果 , 不知道具体的推理步骤和过程 ; GPT 模型 并没有 逻辑推理能力 ; 5、函数调用 , 是 " 真逻辑 " , 可以 确定性的 解决各种具体的问题 ; 函数调用 Function Calling 就是 使用代码 实现的 " 真逻辑 " , 嵌入到 AI 模型中 , 在 模型

    2K10编辑于 2024-07-14
  • 来自专栏苏三说技术

    别再用HTTP调用模型了,大厂都在用Spring AI?

    前言 最近有位小伙伴问了我一个问题:“三哥,我们现在项目中要接入模型,我看网上很多教程都是直接用RestTemplate调用OpenAI或者DeepSeek的API,代码也简单,为啥大家都在说Spring 先带大家感受一下,绝大多数Java开发者第一次接入模型时都是怎么写的。 模型API的响应结构经常会更新,每次更新都意味着全量回归测试。 第六,缺少可观测性。 没有埋点、没有日志、没有调用链追踪,线上出问题时根本没法定位。 1.2 尝试封装一下? 在企业级应用中,一个最大的痛点是如何让模型调用”我们已有的业务代码——比如查库存、下单、查物流状态等。 / result.label -> "POSITIVE", result.score -> 0.95 3.5 Function Calling:企业应用的核心能力 Function Calling让模型能够动态调用外部的业务

    24410编辑于 2026-05-29
  • 模型 API 接入工程实践:基于 Python SDK 的标准调用教程

    ​在生成式AI应用的开发中,通过统一的API网关接入模型(LLM)是业界的标准工程实践。这种架构能够将应用层与底层的模型供应商解耦,便于统一管理鉴权、网络路由以及并发并发配额。 针对兼容OpenAISDK的调用,通常需要在根域名后追加`/v1`。 不同的分组对应后端的不同算力池或模型渠道。必须确保你选择的分组包含了你即将调用的目标模型,否则将导致404或无权限错误。-**ModelID(模型标识)**:指定你要调用的具体模型名称。 在终端中执行以下命令安装:Bash展开代码语言:TXTAI代码解释pipinstallopenai三、代码实现:标准流式调用(Streaming)在LLM应用中,由于模型推理耗时较长,通常采用SSE(Server-SentEvents 在调用前,需查阅网关的API技术文档,确认其是否开放了原生协议端点。​

    21910编辑于 2026-05-29
  • 评测腾讯混元模型,python调用混元生文接口

    想丰富腾讯混元python sdk 调用混元模型的实例。下面介绍python实现混元生文接口ChatCompletions实例。 975098478c96","Usage":{"PromptTokens":40,"CompletionTokens":1,"TotalTokens":41}}好的例子二:hunyuan-functioncall模型如何用流式方式调用接口 例子三:hunyuan-functioncall模型多轮对话如何调用接口,调用工具import jsonimport osfrom tencentcloud.common import credentialfrom 示例三多轮问答中调用查询天气工具时,混元模型回答的有问题。 工具查询的天气情况是:北京今天的天气情况如下:温度:35℃风向:西南风天气状况:暴雨深圳今天的天气情况如下:温度:20℃风向:西北风天气状况:晴模型回答的结果是:北京今天的天气情况如下:温度:35℃风向

    1.8K20编辑于 2024-09-13
  • 来自专栏创作是最好的自我投资

    通用模型VS垂直模型

    在人工智能这个充满无限可能的领域内,通用模型和垂直模型各有千秋。就我个人而言,在二者之间的选择上,并不存在偏向某一方的倾向。我觉得应当依据实际应用场景的具体需求,来挑选最为契合的模型。 通用模型通用模型,乃是旨在应对多种任务与数据类型的庞然物级人工智能模型。 在知识覆盖的广度方面,通用模型无疑具有明显的优势。当我们对于当下所需模型所涉及的精确专业领域的界限感到模糊不清时,选择通用模型无疑是一种明智之举。垂直模型接下来谈谈垂直模型。 然而,由于垂直模型的训练内容聚焦于当前行业,其涉猎的范围更集中,数据针对性更强,所以在提供专业咨询时往往更加精准、细致,这也正是垂直模型的独特价值所在。 因此,对于通用模型或者垂直模型,更倾向于哪一方不取决于个人想法,而是取决于用户需要。

    85201编辑于 2024-12-30
  • 来自专栏小洁叫你mysql

    【AI模型】训练Al模型

    模型超越AI 目前所指的模型,是“大规模深度学习模型”的简称,指具有大量参数和复杂结构的机器学习模型,可以处理大规模的数据和复杂的问题,多应用于自然语言处理、计算机视觉、语音识别等领域。 本文将探讨模型的概念、训练技术和应用领域,以及与模型相关的挑战和未来发展方向。 模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数,而模型则可能拥有数亿或数十亿个参数。 训练模型的挑战 训练模型需要应对一系列挑战,包括: 以下是与模型相关的一些代码示例: 计算资源需求: import tensorflow as tf # 指定使用GPU进行训练 with tf.device 更智能的模型压缩技术:模型压缩和加速技术将继续发展,以减小模型的计算和存储开销。 更好的计算平台支持:为了支持训练和部署模型,计算平台将继续改进,提供更强大的计算资源和工具。

    1.7K30编辑于 2023-10-10
  • 来自专栏大模型应用

    模型应用:RAG与向量数据库结合Ollama调用模型深度融合全解析.27

    核心解决的问题:模型存在知识滞后,受限于训练数据截止时间、易产生幻觉编造虚假信息、领域知识不足、微调成本高等痛点,RAG 通过实时调用外部知识,无需重新训练模型即可弥补这些缺陷。 先检索外部相关知识,再将知识作为上下文补充给模型,最后由模型生成准确回答。2. 向量数据库向量数据库是专门用于存储、管理和高效检索高维向量数据的数据库系统。 Ollama介绍Ollama 是一款开源、轻量级的本地大模型运行与管理工具,核心定位是让普通开发者和中小企业能够以极低的成本、零门槛在本地环境部署和使用主流模型。 它并非自研模型,而是搭建了一套简洁的模型运行框架,将模型下载、环境配置、参数调优、服务启动等复杂流程封装为简单的命令行操作,大幅降低了模型本地化落地的技术门槛。Ollama 的价值体现:1. 无论是验证模型应用逻辑,还是搭建私有化智能问答系统,Ollama 都能以“低成本、易操作、高安全”的特性,成为连接模型与实际业务的高效桥梁。4.

    1.4K44编辑于 2026-02-24
  • 精细化Prompt工程:低成本缩减模型API调用Token开销

    模型API调用费用以Token消耗量为核心计费单位,输入提示词、输出回复、上下文对话记忆均会产生Token损耗。 一、Token消耗核心逻辑与无效损耗来源模型API调用Token分为输入Token与输出Token两类,计费权重一致。 二、基础提示词精简:剔除无效Token损耗基础精简是成本优化的第一步,无需专业Prompt能力,仅通过标准化文本整改,即可实现20%以上的Token降幅,适配所有模型API调用场景。 星宇智算GPU云主机针对模型推理、API服务部署做专属优化,服务器算力调度稳定性达99.6%,可有效降低网络波动、算力过载导致的调用重试问题,减少无效重复调用产生的额外Token消耗。 依托标准化Prompt模板与稳定算力部署,能够长期控制模型调用成本,提升AI业务商业化落地的性价比与稳定性。

    18510编辑于 2026-05-27
  • 来自专栏大模型应用

    模型应用:模型本地化部署与API调用:打包迁移到服务器的多种方式实践.47

    一、引言 在过往的系列分享中,无论是轻量型向量模型的实操应用,还是语言模型的生成推理与落地调试,我们始终围绕模型本地化调用这一核心场景展开,从环境搭建、参数优化到功能适配,逐步带领大家打通了本地跑通模型的全流程 但随着应用场景的升级,单一设备的本地化调用已难以满足多用户协同访问、高并发处理、长期稳定运行的需求,同时,将开源或自定义模型封装为可网络访问的 API 接口,部署到服务器上实现稳定调用,已成为企业级应用 今天,我们将聚焦模型从本地可用到云端可调用的全链路实操,沿着基础 API 调用、自动化接口文档生成、多方案打包部署上线的完整脉络,进行细致拆解与深度剖析,真正实现从技术跑通到场景落地的无缝衔接。 存储:模型文件体积,6B 参数模型约 10GB,13B 模型约 20GB,需预留至少 50GB 硬盘空间,推荐 SSD,加载速度更快。2. .tar七、总结 模型 API 服务器部署的核心是环境适配、便捷调用 、稳定运行,不同方式各有侧重:Docker 容器化是企业级首选,兼顾稳定性和扩展性,EXE 打包适合 Windows

    4K103编辑于 2026-03-16
  • 来自专栏AI智能体从入门到实践

    构建AI智能体:初识腾讯混元AI模型与API调用

    申请成功后下方列表会多出来一条apikey信息:3.获取到key后就可以在模型广场,查看、挑选我们需要的模型,进行体验或选择使用了。4. 腾讯混元模型API接口调用详细说明:5. 混元 OpenAI 兼容接口相关调用示例: 调用说明 模型调用通常采用Python,需对Python语言有基础的掌握,Python技术生态丰富,拥有完善的深度学习框架和数据处理工具,能覆盖从训练到微调的整个流程 主要通过腾讯的腾讯云模型API提供的混元模型API和SDK来实现模型的应用,混元模型支持文本模型和生图模型,通过API的方式方便开发者调用,可通过腾讯云SDK方式接入或使用OpenAI SDK方式接入 由于腾讯云的OCR服务返回的结果是文本,我们需要将其组织成合适的提示词输入给混元模型。代码结构:定义OCR函数,提取图片中的文字。定义调用混元模型的函数。 , "填表人": "", "日期": ""}3.通过混元模型兼容的OpenAI接口使用API-KEY的base-url进行模型调用import jsonimport osfrom openai import

    3.3K11编辑于 2025-12-10
领券