首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI

    Jetbrains官宣全新AI CLI:Gemini模型费用

    JunieCLI支持目前主流的模型:OpenAI(Codex/GPT系列)Anthropic(Claude系列)Google(Gemini,含最新Flash3)⚫Grok(xAI)官方还放了个福利:新用户默认赠送 BYOK定价:自己的钥匙开自己的锁JetBrains这次在定价上很"开源精神":BYOK(BringYourOwnKey):用你自己的模型APIKey,JetBrains不收额外平台费或直接用JetBrainsAI 订阅:已有许可证的用户无缝接入团队友好:支持按合规/成本/性能需求灵活选模型,不影响企业治理个人锐评:这招很聪明——既降低尝鲜门槛,又避免被单一模型厂商"绑定",开发者终于有"模型自由"了✨跨平台工作流

    89910编辑于 2026-03-20
  • 来自专栏Java实战博客

    自建Sub2API – Ollama 自建模型API管理页 – AI IDE – CodeX使用本地模型

    Sub2API 就是给 Ollama 套了一层 “企业级门面”,让你本地跑的模型,能像商用 API(OpenAI 格式)一样被各种软件直接调用,还能管权限、控流量、做多模型调度。 Ollama启动 本篇不强调Ollama,因为很多Windows平台的电脑,跑模型性能很差。这里只描述的Ollama启动,供Sub2API使用。 Ollama本地启动服务。 Sub2API启动 Sub2API 是一个开源的 AI API 网关与管理平台,核心是把你本地(如 Ollama)或云端(如 OpenAI、Claude)的 AI 模型,统一转换成标准的 OpenAI 登录后界面是: 创建分组 Sub2API 的「分组(Group)」,核心是按「接口类型 / 模型来源 / 用途」把上游账号(如 Ollama、OpenAI、Claude)归类隔离,实现独立调度、权限控制与负载均衡 简单说:分组 = 模型资源池 + 调度单元 + 权限边界。 随便起个名字就好 这个其实分组,没啥太大意义,只要是用于后续 创建Sub2API的秘钥,配置外部API信息都需要绑定我们的分组。

    5.7K30编辑于 2026-04-20
  • IDEA 官宣全新AI CLI:Gemini模型费用

    Junie CLI 支持目前主流的模型: OpenAI(Codex / GPT 系列) Anthropic(Claude 系列) Google(Gemini,含最新 Flash 3) ⚫ Grok BYOK :自己的钥匙开自己的锁 JetBrains 这次在定价上很"开源精神": BYOK(Bring Your Own Key):用你自己的模型 API Key,JetBrains 不收额外平台费 或直接用 JetBrains AI 订阅:已有许可证的用户无缝接入 团队友好:支持按合规/成本/性能需求灵活选模型,不影响企业治理 个人锐评:这招很聪明——既降低尝鲜门槛,又避免被单一模型厂商" 绑定",开发者终于有"模型自由"了✨ 跨平台工作流:一个智能体,处处可用 现代开发早就不止在 IDE 里了: 现在,同一个 Junie 智能体可以: ️ 在你本地终端跑重构任务 在 GitHub Actions

    95210编辑于 2026-03-31
  • 被 OpenClaw API 费用吓到?Hermes Agent 免费开源 + 国产模型省钱方案

    费用对比方案月API费用(估算)说明OpenClaw+Claude$30-80ClaudeAPI价格高OpenClaw+GPT-4o$20-60GPTAPI中等Hermes+DeepSeek¥10-30 费用只来自于模型API调用,而你可以自由选择最便宜的方案。 输出¥2/百万token$15/百万token$15/百万token同样的使用量,DeepSeek的费用约为Claude的5%。 立即前往腾讯云官网选购HermesAgent专属云服务器FAQ:Q1:国产模型和Claude/GPT的质量差距吗? Q2:用免费模型会影响HermesAgent的学习能力吗?A:技能创建和记忆管理与模型能力正相关。建议至少使用7B以上的模型以保证学习质量。Q3:可以按月切换模型提供商吗?

    2.5K30编辑于 2026-04-16
  • 来自专栏新智元

    300亿参数模型费用,网友:真香

    · 用户界面/集成:开放式助手提供了API、webhooks和其他整合方法,使对话式人工智能更容易嵌入到不同的应用程序中。 这两种模型的语言系统都是基于一个300亿个参数的LLaMA模型。与Alpaca或Vicuna一样,这些模型是经过「指令微调」的,与ChatGPT不同,没有通过人类反馈的强化学习(RLHF)进行改进。 但未来不好说,可能会有一个选项,以优化为目的,和模型供应商分享用户的聊天数据。 网友评论 英伟达大神Jim Fan在推特表达了自己的看法,他认为HuggingChat这个300亿参数的开源模型,简直就是ChatGPT的平替。 实际上,Hugging Face和OpenAI相比有一个优势,那就是,商店里的APP可以是已经由Hugging Face发布的多模态模型

    52920编辑于 2023-05-09
  • 来自专栏星哥的AI自留地

    DeepSeek-R1-70B的模型费用

    今年年初最火的模型非DeepSeek莫属,如果想要使用Deepseek的接口就需要购买,而今天星哥给大家一个免费白嫖的DeepSeek-R1-70B的方法。 OpenRouter介绍OpenRouter是一个统一的API服务平台,它能把各种大型语言模型和服务集成到一个统一的接口中。 用户通过简单的配置和调用,就能访问多个预训练的模型,不用自己部署和维护这些模型。不过它也有一些限制,除了标识为Free的免费模型外,其他模型的调用都会产生费用,而且目前不支持微信、支付宝等支付方式。 2.搜索free点击左上角搜索框,下拉列表就会显示模型列表。注意带Free的,就是可以免费使用的,其他的是要支付美元使用的。 填写API密钥2.输入添加模型点击“添加”填写:deepseek/deepseek-r1-distill-llama-70b:free3.测试然后点击聊天,选择模型deepseek/deepseek-r1

    1.9K01编辑于 2025-05-01
  • 来自专栏时来之笔

    2026 模型 API 免费额度汇总

    ,适合预算敏感型无穹 Infini-AI 服务平台2026 模型 API 免费额度汇总清单 国家超算平台国家超算平台为开发者提供了极为丰厚的新用户注册福利,支持调用多款当前最新的前沿模型。 领取地址: 百度智能云千帆控制台️ 领取步骤:访问千帆模型平台阅读并同意用户协议后,系统将自动开通千帆模型平台并发放新用户免费Tokens额度。 其他: Kimi-K2-Instruct、bge-large (向量模型)、qianfan-sug-8k。 右上角选择点击 "Get API Key" 即可获得API key进行调用。 ,kimi-k2等开源模型永久代金券,API 响应快kimi开放平台科大讯飞每个模型 20 万 Tokens星火 Ultra, Max, Pro涵盖长文本 128K 版本讯飞星火-懂我的AI助手魔搭社区每天

    49.8K340编辑于 2026-03-17
  • 使用API运行Llama 2语言模型

    使用API运行Llama 2Llama 2是某机构AI开发的语言模型。它是首个与某机构模型同等水平的开源语言模型。通过某平台,可以用一行代码在云端运行Llama 2。 },): print(str(event), end="")使用cURL运行Llama 2可以通过cURL等工具直接调用HTTP API:curl -s -X POST \ -H "Authorization 如何选择模型某平台上有四种Llama 2模型变体,各有优势:某机构/llama-2-70b-chat:700亿参数的聊天优化模型。如需构建最佳准确度的聊天机器人,可选择此模型。 某机构/llama-2-70b:700亿参数的基础模型。如需进行其他类型的语言补全(如补全用户写作),可选择此模型。某机构/llama-2-13b-chat:130亿参数的聊天优化模型。 如需构建聊天机器人且更注重速度和成本,可选择此模型。某机构/llama-2-7b-chat:70亿参数的聊天优化模型。这是更小、更快的模型

    17910编辑于 2026-02-21
  • 来自专栏开源技术小栈

    快速接入讯飞星火认知模型2.0,200万令牌免费用

    导言 随着国内的语言模型不断兴起,科大讯飞的星火大模型,阿里的通义千问,百度的文心一言等。这些模型给我提供了很好的便利。 同时星火大模型提供了开放 API 功能,同时提供更多SDK,使得我们能够将模型接入到我们自己的项目当中。 星火大模型 星火认知模型(Starfire Cognitive Mode1)是一种基于人工智能技术的认知模型,旨在模拟人类的思维和认知过程。 该模型结合了自然语言处理、机器学习和知识图谱等技术,能够理解和处理自然语言,并具有一定的推理和判断能力。 星火认知模型的核心思想是通过对大量的语料进行训练和学习,从而使其具备理解和回答问题的能力。 准备工作 星火认知模型访问地址:https://xinghuo.xfyun.cn/ API免费试用 注意:这里必须要先注册账号(有账号直接略过) 1、创建一个新应用,绑定应用产品(默认创建了一个应用)

    2.2K20编辑于 2023-10-26
  • 来自专栏OI

    YbtOJ 594「费用流」图书馆

    YbtOJ 594「费用流」图书馆 题目链接:YbtOJ #594 小 A 新开了一个图书馆(初始里面没有书)。 书的类型有 n 种,其中第 i 种书的价格为 c_i。 为了消去存下来再次使用的书的强制购买费用,考虑定义一个“卖书”操作,即如果在强制购买之前手上已经有需要的书了,可以把手上这本卖了。具体地,将花费减去 c_i,并将这本书提交到上一次需要这本书的那天。 q.push_back(to):q.push_front(to),0),vis[to]=1); return C[T]<inf; } I void MCMF(){//最小费用最大流 RI

    1.8K20编辑于 2022-09-19
  • 来自专栏AI相关

    模型API的token是如何计算的?

    今天来讲一个比较简单且常见的话题:模型调用时token数量是如何计算的? 在我们日常使用语言模型(LLM)API时,比如OpenAI、Anthropic或其他厂商的接口,token数量几乎是一个绕不开的问题。 无论是控制调用成本,还是预估模型上下文长度,都离不开对token计算方式的理解。比如我在某个平台调用模型API的时候就会有一些相关的参数:看着这些参数有时我会不禁发问:token到底是什么? 例如:GPT系列使用tiktoken(基于BPE编码)Claude使用AnthropictokenizerGemini使用自家SentencePiece编码器输入与输出Token的计算方式在调用模型API 理解它,才能真正掌握模型API的成本和性能。希望这篇文章能帮你在与LLM的交互中,更“省钱”、也更“聪明”。

    3.6K20编辑于 2025-11-10
  • 来自专栏Soul Joy Hub

    模型AIGC系列课程 3-2】国产开源模型:ChatGLM

    GLM https://arxiv.org/pdf/2103.10360.pdf GLM是General Language Model的缩写,是一种通用的语言模型预训练框架。 具体来说,GLM通过随机遮盖文本中连续的标记,并训练模型按顺序重新生成这些遮盖的部分。这种自回归的空白填充目标使得GLM能够更好地捕捉上下文中标记之间的依赖关系,并且能够处理可变长度的空白。 这个图示说明了GLM预训练的过程,具体解释如下: a) 原始文本:给定一个原始文本,例如[x1, x2, x3, x4, x5, x6]。 在生成过程中,模型可以根据之前生成的词片段和Part A中的上下文来预测下一个词片段。 d) 自注意力掩码:为了限制模型的注意力范围,

    83820编辑于 2023-08-28
  • 来自专栏大模型应用

    模型应用:模型的本地 API 服务:FastAPI 封装与接口鉴权.44

    核心概念模型本地 API 服务:把本地电脑或服务器上的模型,变成一个 "可随时呼叫的工具人"。不用连云端,本地就能通过指令调用它干活,数据全程不泄露。 只允许有钥匙的人调用,防止陌生人随便用、滥用模型资源。2. 模型本地运行原理前提:本地设备(电脑/服务器)已安装模型,如 Llama 2、Qwen 等开源模型,并能通过 Python 脚本运行。 单例模式:确保整个应用中只存在一个模型实例,减少内存占用2. FastAPI 封装原理加载模型:启动服务时,把模型加载到内存,避免每次调用都重新加载,提速。 API 的内存资源不会被无限占用;轻量化:令牌是字符串,传输快,适配模型 API 的低延迟需求。

    62753编辑于 2026-03-13
  • 来自专栏大模型成长之路

    模型学习 | BERT 量化实战(2) 】

    BERT 量化实战分析前言:在【模型学习 | 量化实战(1)】-腾讯云开发者社区-腾讯云中基于BERT实现了情感分析系统以及量化的实现,但是量化的结果导致了模型的精确度急剧下降,从90%降到了54%, 未出现截断情况(即分布区域超过量化上下限)、分布近似 scale过大scale的计算如下所示:scale=\frac{max(w)-min(w)}{255} , 个别层的权重有离群值,会导致scale非常, Sensitive Layers:") for r in results[:5]: print(f"{r[0]:40s} | Acc: {r[1]:.4f} | ΔAcc: {r[2] :.4f}") return results 其他分析方法层级 fallback 到 FP32与敏感性分析相关,该方法是将原模型逐层量化,观察精度下降情况误差传播分析对 float32 模型模型 vs INT8 模型输出差异有多大

    83310编辑于 2025-06-27
  • 来自专栏大模型成长之路

    模型学习 | BLIP2原理】

    BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models 作者提出一种从离线、梯度冻结的图像、语言模型中提升图文的预训练模型。为了联系两个不同模态预训练模型,作者提出一种使用两个阶段预训练模型Querying Transformer (Q-Former)。 一、预训练方法这种预训练方法分为了两个阶段 (1)视觉语言特征表示学习阶段 (2)视觉到文本的生成学习阶段 1.1 Q-Former主要作用就是对齐两个不同模态的冻结预训练模型 Q-Former包含了两个 transformer子模块:(1)Image Transformer (特征提取) (2) Text transformer (作为文本编码器和解码器) ; 一组可学习的查询嵌入向量作为 Image 作者尝试了两种LLM冻结模型:(1) decoder-based LLMs : query 表征作为 LLM 的输入前缀(prefix) → LLM 自己完成文本生成(2) encoder-decoder-based

    1.2K00编辑于 2025-07-01
  • 来自专栏机器之心

    费用!阿里通义模型上新,超逼真音视频生成SOTA!

    背景 近年来,随着语言模型的迅速发展,虚拟主播、虚拟助手等应用得到了广泛的推广与使用。 受启发于 LLM 的上下文学习能力,以及多模态 DiT 在文生图中的优势,我们提出了如图 2 所示的模型架构。 该架构有三个核心部分:(1)三个嵌入模块来分别捕捉参考音视频的动态特征以及文本信息,(2)一个双流 DiT 模型用于音视频并行建模,以及 (3) 一个音视频特征融合模块来确保音视频特征的紧密同步。 2. 关于模型结构,我们方法的核心在于建模视频、音频和文本模态之间的交互,旨在生成既连贯又同步的音视频内容。 表 2. THG 性能对比 表 2 展示了 OmniTalker 在视觉生成方面的卓越性能。

    1.2K10编辑于 2025-04-16
  • 来自专栏前端西瓜哥的前端文章

    动态规划模型:背包二维费用问题

    在阅读本文之前,建议先看看我的另一篇文章(只关注 “重量” 一个维度): 《动态规划模型:0-1背包问题》 背包二维费用问题,是在原本 “重量” 的单一维度上,加上 “价值” 维度。 结尾 二维费用问题,需要将值用来保存最大价格,并在更新状态时做装入和不装入两种情况的比较,取其中比较大的。 我是前端西瓜哥,欢迎关注我,学习更多前端知识。 ----

    57010编辑于 2022-12-21
  • 来自专栏软件测试学习

    怎么通过API调用AI模型获取响应结果

    要通过api在代码里面去调用模型,需要先申请模型api key,以deepseek官网为例,apikey的申请地址:https://platform.deepseek.com/api_keys 目前 代码案例的话,deepseek官网就有提供最简单的案例: https://api-docs.deepseek.com/zh-cn/ 调用上面的代码,需要安装依赖: pip install openai 通过上面2篇文章,一个是可以将模型切换为其他第三方平台的api进行调用,有的平台注册会赠送一定的体验额度,可以临时用于代码调试啥的,另一篇文章的话,是可以将代码里面的apikey以及对应的api地址等信息放到配置文件里面 模型列表可以参考:https://huggingface.co/deepseek-ai/models https://modelscope.cn/models

    5K10编辑于 2025-06-23
  • 来自专栏叶子的数据科技专栏

    使用自己的模型 api 在表格中生成

    免费当然很好,但是当你薅了几千次 qwen 之后,他会不断的给你显示"等待中"。那么,花钱行不行呢?问题来了,他是免费的...想花钱也没地方花... 本项目用来解决下面几个痛点: 在线表格无法选择 api 供应商 在线表格可能会触发大型批量使用限制 效果展示 GitHub - sandy9707/ai-cellfill-excel 使用方式 首先需要完成配置 ,在.config文件里面输入自己的模型 api 和密钥,然后把需要启用的 api 的 ENABLED 改成 true. 第一列是自动生成的,包含了获取到的系统提示词文件和调用到的 api 模型名称。 第二列是需要填写的用户提示词,写入后将依次调用 api 回答。 第三列是是否需要生成,主要用于对结果不满意需要重新生成的情况,通过填入合适的数字决定是否调用 api 进行生成或重复生成。 第四列是生成结果。

    52510编辑于 2025-05-23
  • 来自专栏LLM API

    Gemini 3 Pro 国内怎么购买 API Key 及模型 LLM API 试用指南

    摘要:Google再次刷新了多模态模型的上限。本文将为您权威解读Gemini3Pro的核心特性(超长上下文、原生多模态),并为国内开发者提供一份详尽的GoogleGeminiAPI购买与接入教程。 作为模型领域的“原生多模态”霸主,Gemini系列一直以其恐怖的上下文窗口(ContextWindow)和对视频、音频、图像的“全知全能”理解力著称。 3.聚合:不仅是GPT,更是您的Gemini专属通道模型API聚合平台早在Gemini1.0时代就已完成了与GoogleVertexAI的深度对接。 拥有了聚合提供的稳定API,您可以构建前所未有的应用:全自动会议纪要:上传2小时的录音文件,Gemini能在30秒内生成带时间戳的精准摘要。 金融研报分析:一次性扔进去50份PDF年报,让模型进行横向对比分析。5.常见问题(FAQ)Q:我现在能通过聚合用上Gemini3Pro吗?

    6.8K20编辑于 2026-01-24
领券