首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI

    Jetbrains官宣全新AI CLI:Gemini模型费用

    JunieCLI支持目前主流的模型:OpenAI(Codex/GPT系列)Anthropic(Claude系列)Google(Gemini,含最新Flash3)⚫Grok(xAI)官方还放了个福利:新用户默认赠送 BYOK定价:自己的钥匙开自己的锁JetBrains这次在定价上很"开源精神":BYOK(BringYourOwnKey):用你自己的模型APIKey,JetBrains不收额外平台费或直接用JetBrainsAI 订阅:已有许可证的用户无缝接入团队友好:支持按合规/成本/性能需求灵活选模型,不影响企业治理个人锐评:这招很聪明——既降低尝鲜门槛,又避免被单一模型厂商"绑定",开发者终于有"模型自由"了✨跨平台工作流

    89910编辑于 2026-03-20
  • OpenAI 正式发布最强模型 GPT-5 !人人免费用

    模型在编码、创意写作和健康咨询三领域实现突破,并首次向所有免费用户开放,微软已抢先将其整合至全产品线。 官方新闻稿中补充声明称,GPT-5 它是一个统一的系统(由智能高效模型+深度推理模型(GPT-5 thinking)+实时路由器组成),能够识别何时快速响应,何时需要更长时间的思考以提供专家级的应答,不必由用户手动选择使用常规语言模型还是推理系统 核心升级 三领域突破性提升! 编程能力:一键生成复杂应用 前端开发:GPT-5可仅凭自然语言提示生成美观、响应式的网站、应用程序和游戏,支持复杂的前端交互设计(如贪吃蛇游戏嵌入语言学习工具)。 GPT-5今日起开始向免费用户和付费用户逐步推出,付费用户拥有更高的使用限额。 推出四种预设聊天风格(愤世嫉俗者、机器人、倾听者、书呆子),用户可随时调整,未来将扩展至语音交互。 Pro订阅者可无限访问GPT-5,并能使用GPT-5 Pro;Plus用户可将其作为日常问题的默认模型,使用量显著高于免费用户。 GPT-5 也在微软平台上线了。 综合看来,GPT-5如何?

    63610编辑于 2026-03-24
  • IDEA 官宣全新AI CLI:Gemini模型费用

    Junie CLI 支持目前主流的模型: OpenAI(Codex / GPT 系列) Anthropic(Claude 系列) Google(Gemini,含最新 Flash 3) ⚫ Grok BYOK :自己的钥匙开自己的锁 JetBrains 这次在定价上很"开源精神": BYOK(Bring Your Own Key):用你自己的模型 API Key,JetBrains 不收额外平台费 或直接用 JetBrains AI 订阅:已有许可证的用户无缝接入 团队友好:支持按合规/成本/性能需求灵活选模型,不影响企业治理 个人锐评:这招很聪明——既降低尝鲜门槛,又避免被单一模型厂商" 绑定",开发者终于有"模型自由"了✨ 跨平台工作流:一个智能体,处处可用 现代开发早就不止在 IDE 里了: 现在,同一个 Junie 智能体可以: ️ 在你本地终端跑重构任务 在 GitHub Actions

    95210编辑于 2026-03-31
  • 被 OpenClaw API 费用吓到?Hermes Agent 免费开源 + 国产模型省钱方案

    费用对比方案月API费用(估算)说明OpenClaw+Claude$30-80ClaudeAPI价格高OpenClaw+GPT-4o$20-60GPTAPI中等Hermes+DeepSeek¥10-30 费用只来自于模型API调用,而你可以自由选择最便宜的方案。 省钱方案一:DeepSeekAPIDeepSeek-V3是目前性价比最高的模型之一:价格DeepSeek-V3Claude3.5GPT-4o输入¥1/百万token$3/百万token$5/百万token 输出¥2/百万token$15/百万token$15/百万token同样的使用量,DeepSeek的费用约为Claude的5%。 立即前往腾讯云官网选购HermesAgent专属云服务器FAQ:Q1:国产模型和Claude/GPT的质量差距吗?

    2.5K30编辑于 2026-04-16
  • 来自专栏数据结构与算法

    Day5费用

    算法 zkw费用流:多路增广,增光 的边 无源汇上下界最小费用可行流 每次强行增加下界的流量 类似网络流,拆边 原边的费用为c,拆出来的边费用为0 负边和负圈 直接应用 SDOI2016数字配对 我的思路 : 建出 个点,如果ai是aj的质数倍,从bi个点向bj个点连边 跑有上下界可行费用最大流(woc这是个什么东西。。) 正解 两个数能够配对,分解后指数之和差为1则可以匹配 按照差值分为两类 不断增广 WF2011 有上下界最大费用最大流 ——》限制相等的情况,可以通过加一维费用来解决 时间复杂度: 回路问题 TJOI2013 找出入度不为1的点, 枚举是否更改(好傻逼) 正解 黑白染色,建二分图 从一个点向四个方向连边,(1,0) (1,1)(1,1) (1,1) Topcoder 黑白染色后对度数进行限制 考虑如何处理费用 拆点,把一个点拆成两个,连流量为1的边,如果是直的,那么一定会经过中间的边,问题便可以得到解决 费用递增 美食节 JSOI2009球队XX 平方的性质满足费用递增 WC2007 签到问题  二分图模型

    6.9K60发布于 2018-04-11
  • 来自专栏新智元

    300亿参数模型费用,网友:真香

    · 用户界面/集成:开放式助手提供了API、webhooks和其他整合方法,使对话式人工智能更容易嵌入到不同的应用程序中。 这两种模型的语言系统都是基于一个300亿个参数的LLaMA模型。与Alpaca或Vicuna一样,这些模型是经过「指令微调」的,与ChatGPT不同,没有通过人类反馈的强化学习(RLHF)进行改进。 但未来不好说,可能会有一个选项,以优化为目的,和模型供应商分享用户的聊天数据。 网友评论 英伟达大神Jim Fan在推特表达了自己的看法,他认为HuggingChat这个300亿参数的开源模型,简直就是ChatGPT的平替。 实际上,Hugging Face和OpenAI相比有一个优势,那就是,商店里的APP可以是已经由Hugging Face发布的多模态模型

    52920编辑于 2023-05-09
  • 来自专栏星哥的AI自留地

    DeepSeek-R1-70B的模型费用

    今年年初最火的模型非DeepSeek莫属,如果想要使用Deepseek的接口就需要购买,而今天星哥给大家一个免费白嫖的DeepSeek-R1-70B的方法。 OpenRouter介绍OpenRouter是一个统一的API服务平台,它能把各种大型语言模型和服务集成到一个统一的接口中。 用户通过简单的配置和调用,就能访问多个预训练的模型,不用自己部署和维护这些模型。不过它也有一些限制,除了标识为Free的免费模型外,其他模型的调用都会产生费用,而且目前不支持微信、支付宝等支付方式。 复制下来保存在文本里5.设置默认模型点击“Settings”再到 “Default Model”设置默认模型为DeepSeek: R1 Distill Llama 70B(free)。 填写API密钥2.输入添加模型点击“添加”填写:deepseek/deepseek-r1-distill-llama-70b:free3.测试然后点击聊天,选择模型deepseek/deepseek-r1

    1.9K01编辑于 2025-05-01
  • 来自专栏时来之笔

    2026 模型 API 免费额度汇总

    、Kimi K2.5 等每日10点限量抢购腾讯云模型平台阿里云百炼¥40(Lite Plan)1.8万次 / 月Qwen 3.5、GLM-5、MiniMax 等每日9:30限量抢购阿里云百炼 Coding )40次 / 5小时M2.5 系列非常适合 OpenClawMiniMax 开放平台无问芯穹¥19.9(入门档)1000次 / 5小时GLM、Kimi、MiniMax 等模型更新稍慢,适合预算敏感型无穹 Infini-AI 服务平台2026 模型 API 免费额度汇总清单 国家超算平台国家超算平台为开发者提供了极为丰厚的新用户注册福利,支持调用多款当前最新的前沿模型。 领取地址: 百度智能云千帆控制台️ 领取步骤:访问千帆模型平台阅读并同意用户协议后,系统将自动开通千帆模型平台并发放新用户免费Tokens额度。 右上角选择点击 "Get API Key" 即可获得API key进行调用。

    49.8K340编辑于 2026-03-17
  • 什么是API?进行API对接的5常见误区!

    接下来就为你清晰拆解API的核心概念、重要价值、实用对接方法以及常见误区。一、APIAPI对接是什么什么是API?我们总是听说API是多么有价值,他们将对业务产生重大影响。然而,API的定义是什么? 提升用户体验通过API对接,企业可以将不同系统之间的数据整合在一起,提供更加完整、准确、及时的信息,从而提升用户体验。5. 四、如何进行API对接进行API对接需要平台具备较强的兼容性,比如我常用的数据集成平台Finedatalink,它具有强大的ETL功能和多种技术架构支持,可以连接七类型、30+种数据源,通过GET和POST 方式在url后面拼接参数,只能以文本的形式传递参数;(2)传递的数据量小,4kb左右,虽然不同浏览器可能会有细微差异;(3)安全性低,会将信息显示在地址栏;(4)速度快,通常用于对安全性要求不高的请求;(5) (5)未充分考虑流量控制与配额①误区: 对接时未了解API的调用频率限制(Rate Limiting)或使用配额(Quota),导致请求被限流或拒绝,返回HTTP 429等,影响业务。

    83410编辑于 2025-09-26
  • 5模型Agent模式

    模型中的5种AI Agent模式在模型中,AI Agent(人工智能代理)模式是一种重要的应用方式,可以从以下几个方面来理解:1. 在模型的背景下,AI Agent 是基于大规模预训练模型(如 GPT 等)构建的智能代理,能够利用模型的语言理解和生成能力来完成复杂的任务。 智能性:它基于模型的强大语言理解能力,能够理解自然语言指令,并生成自然语言响应。这种智能性使其能够处理复杂的语言任务,如对话、写作、翻译等。 工作原理感知与理解:AI Agent 首先通过输入(如用户指令、环境数据等)感知外部信息,然后利用模型的语言理解能力解析这些信息,确定任务目标。 下面介绍5种常见的AI Agent模式:1.

    4.6K10编辑于 2025-05-07
  • 来自专栏天意云&天意科研云&天意生信云

    ChatGPT-5更新曝光!免费用户能升级GPT-4了?

    尽管Sam Altman曾明确表示GPT-5不会那么快推出,而且还有许多其他产品将先行发布,但随着Claude 3、Llama 3等强大模型的相继问世,ChatGPT的更新备受期待。 虽然市场上对GPT-5的消息依然稀缺,但据我观察,OpenAI的新版本ChatGPT已经在运作中,并且已经可以公开访问。 GPT数据的能力 多模型支持和内存功能 ChatGPT现支持多个模型,包括GPT-3.5(Sahara-V)和GPT-4 Lite(Scallion) 系统能够在这些模型间自动路由请求 为免费用户提供从 多模型支持和内存功能 ChatGPT现支持多个模型,包括GPT-3.5(Sahara-V)和GPT-4 Lite(Scallion) 系统能够在这些模型间自动路由请求 为免费用户提供从GPT-3.5到GPT 新的智能体上线一定是颠覆性的产品~ 不过由于GPT-5上线,天意ChatGPT网站的算力和维护成本的必定增加。届时现有套餐资费大概率上调!

    59010编辑于 2025-03-06
  • 来自专栏JAVA乐园

    提高 API 性能的 5 常见方法

    提高 API 性能的 5 常见方法 结果分页 此方法用于通过将大型结果集流式传输回客户端来优化大型结果集,从而增强服务响应能力和用户体验。 API 密钥流 第三方开发人员在开发人员门户上注册。 门户颁发 API 密钥。 密钥还存储在安全密钥存储中,以供以后验证。 开发者应用发送未来的 API 请求,并在标头中包含 API 密钥。 API 网关拦截请求并将密钥发送到 API 密钥验证服务。 验证服务验证密钥存储中的密钥并做出响应。 对于有效的 API 密钥,网关会将请求转发到公共 API 服务。 使数据库查询超快的 5 种数据结构 B-Tree 索引B-Tree 索引使用平衡的树结构,其中键和数据指针存在于内部节点和叶节点中。它们通过有序遍历支持高效的范围和点查询。 https://blog.bytebytego.com/p/ep172-top-5-common-ways-to-improve

    37000编辑于 2025-08-03
  • 来自专栏开源技术小栈

    快速接入讯飞星火认知模型2.0,200万令牌免费用

    导言 随着国内的语言模型不断兴起,科大讯飞的星火大模型,阿里的通义千问,百度的文心一言等。这些模型给我提供了很好的便利。 同时星火大模型提供了开放 API 功能,同时提供更多SDK,使得我们能够将模型接入到我们自己的项目当中。 星火大模型 星火认知模型(Starfire Cognitive Mode1)是一种基于人工智能技术的认知模型,旨在模拟人类的思维和认知过程。 该模型结合了自然语言处理、机器学习和知识图谱等技术,能够理解和处理自然语言,并具有一定的推理和判断能力。 星火认知模型的核心思想是通过对大量的语料进行训练和学习,从而使其具备理解和回答问题的能力。 准备工作 星火认知模型访问地址:https://xinghuo.xfyun.cn/ API免费试用 注意:这里必须要先注册账号(有账号直接略过) 1、创建一个新应用,绑定应用产品(默认创建了一个应用)

    2.2K20编辑于 2023-10-26
  • 来自专栏啄木鸟软件测试

    模型测试:性能优化的5实战策略

    引言 随着ChatGLM、Qwen、DeepSeek及Llama系列语言模型在金融、政务、医疗等关键场景加速落地,模型测试已远超传统‘功能是否正确’的范畴——性能成为决定能否上线的核心瓶颈。 这些并非个例,而是模型测试进入深水区的典型信号:性能不是附加项,而是可信AI的第一道防线。 一、明确性能基线:拒绝‘拍脑袋’指标 模型性能测试首要误区是套用小模型标准。 二、分层注入式压测:从单卡到集群的穿透验证 传统压力测试常止步于API层,而模型性能瓶颈常藏于框架底层。 推荐采用‘四层注入法’: 1)API层:模拟真实用户请求分布(如80%短提示+15%中长提示+5%对抗性长上下文),避免均匀负载失真; 2)Engine层:直连vLLM/Triton推理引擎,注入不同 结语 模型性能测试的本质,是构建‘可测量、可归因、可演进’的效能反馈闭环。

    34410编辑于 2026-03-31
  • 来自专栏OI

    YbtOJ 594「费用流」图书馆

    YbtOJ 594「费用流」图书馆 题目链接:YbtOJ #594 小 A 新开了一个图书馆(初始里面没有书)。 书的类型有 n 种,其中第 i 种书的价格为 c_i。 为了消去存下来再次使用的书的强制购买费用,考虑定义一个“卖书”操作,即如果在强制购买之前手上已经有需要的书了,可以把手上这本卖了。具体地,将花费减去 c_i,并将这本书提交到上一次需要这本书的那天。 q.push_back(to):q.push_front(to),0),vis[to]=1); return C[T]<inf; } I void MCMF(){//最小费用最大流 RI

    1.8K20编辑于 2022-09-19
  • 来自专栏AI相关

    模型API的token是如何计算的?

    今天来讲一个比较简单且常见的话题:模型调用时token数量是如何计算的? 在我们日常使用语言模型(LLM)API时,比如OpenAI、Anthropic或其他厂商的接口,token数量几乎是一个绕不开的问题。 无论是控制调用成本,还是预估模型上下文长度,都离不开对token计算方式的理解。比如我在某个平台调用模型API的时候就会有一些相关的参数:看着这些参数有时我会不禁发问:token到底是什么? 例如:GPT系列使用tiktoken(基于BPE编码)Claude使用AnthropictokenizerGemini使用自家SentencePiece编码器输入与输出Token的计算方式在调用模型API 理解它,才能真正掌握模型API的成本和性能。希望这篇文章能帮你在与LLM的交互中,更“省钱”、也更“聪明”。

    3.6K20编辑于 2025-11-10
  • 模型微调】一文掌握5模型微调的方法

    (Prompt Tuning)在内的5种主流方法。 模型微调究竟是什么?直观上,模型微调即是指通过输入特定领域或任务的数据,并有选择性地调整模型参数的技术过程。 我们所讨论的5种微调方法,本质上都是对这个基础架构中自注意力机制与前馈神经网络等核心组件的参数进行优化的不同策略。 5、提示调整-轻量级的参数优化提示调整(Prompt Tuning)是一种“润物细无声”的微调,不改变模型自身,而是通过优化输入提示词的嵌入表示来引导模型输出。 适用场景:当我们面对一个通过API访问的、无法改动其权重的黑盒模型时,提示调整是唯一可行的“微调”手段。可以通过优化软提示,来让该模型更好地适应特定的任务风格或领域术语。

    4.2K40编辑于 2025-10-23
  • 来自专栏大模型应用

    模型应用:模型的本地 API 服务:FastAPI 封装与接口鉴权.44

    核心概念模型本地 API 服务:把本地电脑或服务器上的模型,变成一个 "可随时呼叫的工具人"。不用连云端,本地就能通过指令调用它干活,数据全程不泄露。 基础了解2.1 本地 API 服务的优势解决云端痛点:云端模型有隐私泄露风险、要付调用费、没网用不了,本地 API 服务完美规避这些问题。 降低使用门槛:封装后,不懂模型底层的开发者,也能通过简单指令调用模型能力。2.2 FastAPI 是什么轻量高效的 Python 框架:专门用来搭建 API 服务,比传统框架快很多,支持并发请求。 5. 验证结果处理: 如果令牌有效,服务器执行业务逻辑(例如,使用模型生成文本)。如果令牌无效(如签名错误、已过期等),则返回401错误。6. API 的内存资源不会被无限占用;轻量化:令牌是字符串,传输快,适配模型 API 的低延迟需求。

    62753编辑于 2026-03-13
  • 来自专栏机器之心

    费用!阿里通义模型上新,超逼真音视频生成SOTA!

    背景 近年来,随着语言模型的迅速发展,虚拟主播、虚拟助手等应用得到了广泛的推广与使用。 至于视频解码,我们设计了一个 GAN 模型(复用 ChatAnyone),它根据从参考视频中随机选取的参考帧为基础,并按照 DiT 模型预测的头部姿态和混合形状系数生成新的视频帧。 该模型能以 30FPS 的速度生成分辨率为 512×512 的帧,满足实时推理的需求。 在 TTS 方面,我们挑选了三种代表性方法:MaskGCT、F5TTS 和 CosyVoice,并针对错词率(WER)和声音相似度(SIM)进行了对比评估。 值得注意的是,通过对比包含和不包含运动分支(Ours w/o motion)的模型表现,可以看出完整模型实现了更低的 WER,这证明了结合视觉监督能有效提升生成音频的感知质量。

    1.2K10编辑于 2025-04-16
  • 来自专栏张俊红

    5 常用机器学习模型类型总结

    本文介绍了 5 常用机器学习模型类型:集合学习算法,解释型算法,聚类算法,降维算法,相似性算法,并简要介绍了每种类型中最广泛使用的算法模型。我们希望本文可以做到以下三点: 1、应用性。 所以我们希望通过给出模型的一般类别,让你更好地了解这些模型应当如何应用。 2、相关性。 因此,与其创建模型来预测响应变量的值,不如创建解释性模型来帮助我们理解模型中变量之间的关系。 如果你不能解释一个模型是如何工作的,那么这个模型就很难取信于人,自然也就不会被人们应用。 参考链接: https://towardsdatascience.com/all-machine-learning-algorithms-you-should-know-in-2022-db5b4ccdf32f

    3.6K20编辑于 2022-03-29
领券