首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI

    Jetbrains官宣全新AI CLI:Gemini模型费用

    JunieCLI支持目前主流的模型:OpenAI(Codex/GPT系列)Anthropic(Claude系列)Google(Gemini,含最新Flash3)⚫Grok(xAI)官方还放了个福利:新用户默认赠送 BYOK定价:自己的钥匙开自己的锁JetBrains这次在定价上很"开源精神":BYOK(BringYourOwnKey):用你自己的模型APIKey,JetBrains不收额外平台费或直接用JetBrainsAI 订阅:已有许可证的用户无缝接入团队友好:支持按合规/成本/性能需求灵活选模型,不影响企业治理个人锐评:这招很聪明——既降低尝鲜门槛,又避免被单一模型厂商"绑定",开发者终于有"模型自由"了✨跨平台工作流

    89910编辑于 2026-03-20
  • IDEA 官宣全新AI CLI:Gemini模型费用

    Junie CLI 支持目前主流的模型: OpenAI(Codex / GPT 系列) Anthropic(Claude 系列) Google(Gemini,含最新 Flash 3) ⚫ Grok BYOK :自己的钥匙开自己的锁 JetBrains 这次在定价上很"开源精神": BYOK(Bring Your Own Key):用你自己的模型 API Key,JetBrains 不收额外平台费 或直接用 JetBrains AI 订阅:已有许可证的用户无缝接入 团队友好:支持按合规/成本/性能需求灵活选模型,不影响企业治理 个人锐评:这招很聪明——既降低尝鲜门槛,又避免被单一模型厂商" 绑定",开发者终于有"模型自由"了✨ 跨平台工作流:一个智能体,处处可用 现代开发早就不止在 IDE 里了: 现在,同一个 Junie 智能体可以: ️ 在你本地终端跑重构任务 在 GitHub Actions

    95210编辑于 2026-03-31
  • 被 OpenClaw API 费用吓到?Hermes Agent 免费开源 + 国产模型省钱方案

    费用对比方案月API费用(估算)说明OpenClaw+Claude$30-80ClaudeAPI价格高OpenClaw+GPT-4o$20-60GPTAPI中等Hermes+DeepSeek¥10-30 国产模型超高性价比Hermes+Qwen¥10-30阿里通义千问Hermes+Ollama¥0本地模型零成本关键差异HermesAgent本身完全免费(MIT开源协议)。 费用只来自于模型API调用,而你可以自由选择最便宜的方案。 包含服务器在内的总月费:方案服务器API总计Lighthouse+DeepSeek8.25元~15元23.25元/月Lighthouse+Ollama52.5元(4C8G10M)052.5元/月本地电脑 立即前往腾讯云官网选购HermesAgent专属云服务器FAQ:Q1:国产模型和Claude/GPT的质量差距吗?

    2.5K30编辑于 2026-04-16
  • 来自专栏langchain

    2025-09-10langchain学习-01使用API Key访问语言模型

    从官网获取API Key 将API Key添加至环境变量 环境配置 pip install langchain pip install langchain-openai 代码如下 import os from langchain_openai import ChatOpenAI OPENAI_API_KEY=os.getenv("OPEN_API_KEY") llm=ChatOpenAI(openai_api_key =OPENAI_API_KEY) respone=llm.invoke("一般来说,编程初学者打印在控制台的一句话是什么? 不用解释") print(respone) 如果使用的是通义千问 import os import openai client=OpenAI( api_key=os.getenv("DASHSCPOE_API_KEY

    48310编辑于 2025-09-10
  • 来自专栏新智元

    300亿参数模型费用,网友:真香

    · 用户界面/集成:开放式助手提供了API、webhooks和其他整合方法,使对话式人工智能更容易嵌入到不同的应用程序中。 这两种模型的语言系统都是基于一个300亿个参数的LLaMA模型。与Alpaca或Vicuna一样,这些模型是经过「指令微调」的,与ChatGPT不同,没有通过人类反馈的强化学习(RLHF)进行改进。 但未来不好说,可能会有一个选项,以优化为目的,和模型供应商分享用户的聊天数据。 网友评论 英伟达大神Jim Fan在推特表达了自己的看法,他认为HuggingChat这个300亿参数的开源模型,简直就是ChatGPT的平替。 实际上,Hugging Face和OpenAI相比有一个优势,那就是,商店里的APP可以是已经由Hugging Face发布的多模态模型

    52920编辑于 2023-05-09
  • 来自专栏星哥的AI自留地

    DeepSeek-R1-70B的模型费用

    今年年初最火的模型非DeepSeek莫属,如果想要使用Deepseek的接口就需要购买,而今天星哥给大家一个免费白嫖的DeepSeek-R1-70B的方法。 OpenRouter介绍OpenRouter是一个统一的API服务平台,它能把各种大型语言模型和服务集成到一个统一的接口中。 用户通过简单的配置和调用,就能访问多个预训练的模型,不用自己部署和维护这些模型。不过它也有一些限制,除了标识为Free的免费模型外,其他模型的调用都会产生费用,而且目前不支持微信、支付宝等支付方式。 如图选择“DeepSeek: R1 Distill Llama 70B (free)”3.新建API点击API,创建API。3.填写API的名字然后输入名字deepseek,名字可以随意。 填写API密钥2.输入添加模型点击“添加”填写:deepseek/deepseek-r1-distill-llama-70b:free3.测试然后点击聊天,选择模型deepseek/deepseek-r1

    1.9K01编辑于 2025-05-01
  • 来自专栏时来之笔

    2026 模型 API 免费额度汇总

    、Kimi K2.5 等每日10点限量抢购腾讯云模型平台阿里云百炼¥40(Lite Plan)1.8万次 / 月Qwen 3.5、GLM-5、MiniMax 等每日9:30限量抢购阿里云百炼 Coding ,适合预算敏感型无穹 Infini-AI 服务平台2026 模型 API 免费额度汇总清单 国家超算平台国家超算平台为开发者提供了极为丰厚的新用户注册福利,支持调用多款当前最新的前沿模型。 领取地址: 百度智能云千帆控制台️ 领取步骤:访问千帆模型平台阅读并同意用户协议后,系统将自动开通千帆模型平台并发放新用户免费Tokens额度。 ☁️ 腾讯云 (Tencent Cloud)腾讯云对混元 (Hunyuan) 全系列模型提供了试用包。 免费福利:通用资源包:10 款主力模型共享 100 万 Tokens(有效期 1 年)。 2000 次 调用社区全模型需绑定阿里云,单个模型上限 500 次魔搭社区Cloudflare每天 10,000 神经元各类开源小模型计费模式特殊,适合轻量工具Workers AI Cloudflare

    49.8K340编辑于 2026-03-17
  • 来自专栏技术趋势

    windows10搭建llama模型

    背景 随着人工时代的到来及日渐成熟,模型已慢慢普及,可以为开发与生活提供一定的帮助及提升工作及生产效率。所以在新的时代对于开发者来说需要主动拥抱变化,主动成长。 LLAMA介绍 llama全称:Large Language Model Meta AI是由meta(原facebook)开源的一个聊天对话模型。 ~all~sobaiduend~default-1-106591160-null-null.142^v88^control,239^v2^insert_chatgpt&utm_term=windows10% Linux图: 下载羊驼模型(有点) 先建一个文件夹:path_to_original_llama_root_dir 在里面再建一个7B文件夹并把tokenizer.model挪进来。 -f prompts/alpaca.txt -ins -c 2048 --temp 0.2 -n 256 --repeat_penalty 1.3 结果 最后 我知道很多同学可能觉得学习模型需要懂

    1.6K30编辑于 2023-09-12
  • 来自专栏Apikit

    改变数字经济的 10 API 趋势

    在本文中,我们提出了 10 个新兴 API 趋势,我们相信这些趋势将为企业、IT 团队和消费者带来最大的好处。 1. 新颖、小众的 API 变得更加可用 越来越多的 API 协议正在被采纳,新一代诸如 GraphQL、Async API 和 gRPC 等 API 与现已逐渐衰落但仍占主导地位的 REST API 竞争。 此外, 金融科技平台日益寻求能使其尽快进入市场的 API ,因此减少法规和安全复杂性 的 API 将会更受欢迎。 8. API 管理成为焦点 API 是帮助企业适应、发展和创新的关键商业资产。 10. 对 API 投资增加 目前,有越来越多的企业投资于 API ,预计到这种趋势还会继续。  小结 随着 API 价值的彰显,可以预见到越来越多的企业将采用新兴 API 来优化其业务绩效和效率,并通过探索 API 的价值边界。也因此,API 管理成为焦点。

    49930编辑于 2023-07-20
  • 来自专栏开源技术小栈

    快速接入讯飞星火认知模型2.0,200万令牌免费用

    导言 随着国内的语言模型不断兴起,科大讯飞的星火大模型,阿里的通义千问,百度的文心一言等。这些模型给我提供了很好的便利。 同时星火大模型提供了开放 API 功能,同时提供更多SDK,使得我们能够将模型接入到我们自己的项目当中。 星火大模型 星火认知模型(Starfire Cognitive Mode1)是一种基于人工智能技术的认知模型,旨在模拟人类的思维和认知过程。 该模型结合了自然语言处理、机器学习和知识图谱等技术,能够理解和处理自然语言,并具有一定的推理和判断能力。 星火认知模型的核心思想是通过对大量的语料进行训练和学习,从而使其具备理解和回答问题的能力。 准备工作 星火认知模型访问地址:https://xinghuo.xfyun.cn/ API免费试用 注意:这里必须要先注册账号(有账号直接略过) 1、创建一个新应用,绑定应用产品(默认创建了一个应用)

    2.2K20编辑于 2023-10-26
  • 来自专栏喔家ArchiSelf

    模型应用设计的10个思考

    技术不是万能的,但没有技术却可能是万万不能的,对于模型可能也是如此。 基于模型的应用设计需要聚焦于所解决的问题,在自然语言处理领域,模型本身在一定程度上只是将各种NLP任务统一成了sequence 到 sequence 的模型。 利用模型, 我们是在解决具体的生产和生活中的问题,产品和技术上的设计仍然不可或缺。 那么,如果模型正在重新构建软件工程的未来,我们是否应该遵循一些基本原则呢? 1. 因此,只要我们对模型进行适当的控制和引导,它就能成为我们工作中得力的“助手”。而这种控制的基础,就是我们对模型内部机制和特点的深入了解和掌握。 10. 因此,我们在使用模型时,应该保持理性和谨慎的态度,既要欣赏它们所带来的便利和进步,也要警惕它们的局限性和潜在风险。这样,才能更好地利用这些模型,推动基于模型应用的健康发展。

    64410编辑于 2023-12-04
  • 来自专栏喔家ArchiSelf

    模型应用的10个架构挑战

    基于笔者近年来的探索与实践,这里列举了面向模型应用系统架构设计的10个挑战。 1. 生产环境的挑战——推理框架的选择 对于模型应用而言,生成环境的运行时是一个推理架构。 幻觉问题的解决:由于训练数据的不完整或偏差,Agent也会产生幻觉,即输出不存在的API或错误的代码。这要求接口设计能够具备一定的验证和纠错机制,以减少或避免这类问题的发生。 尽管我们已经有了一些探索,例如《模型应用的10个架构模式》(https://mp.weixin.qq.com/s? 适用性挑战——模型的应用边界 模型在人工智能领域确实展现出了强大的能力,它们在各种控制平面和应用场景中都发挥着重要作用。然而,尽管模型的应用范围广泛,但并不意味着它们是无所不能的。 虽然模型在人工智能领域具有广泛的应用前景,但并不是所有场景都适合使用模型。在设计系统架构时,我们需要根据具体需求和技术挑战来判断是否需要引入模型,以确保系统的高效性和可靠性。 10.

    1.2K10编辑于 2024-12-24
  • 来自专栏机器学习/数据可视化

    机器学习分类模型10评价指标

    公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~机器学习分类模型的评价指标是在衡量模型在未知数据集上的性能表现,通常基于混淆矩阵和相关的评价指标。 样本的真实类别是负类,但模型将其识别为正类。True Negative(TN):真负类。样本的真实类别是负类,并且模型将其识别为负类。 ,精确率越高,表示模型越好。 ,也就是说精确率是模型在某个类别上的判断。 下图是来自维基百科对ROC-AUC的解释:图片通过对分类阈值$\theta$(默认情况下是0.5,范围是0到1)从到小或者从小到大排列,就可以得到多组TPR和FPR的取值,在二维坐标系中绘制出来就可以得到一条

    1.6K10编辑于 2023-10-13
  • 来自专栏OI

    YbtOJ 594「费用流」图书馆

    YbtOJ 594「费用流」图书馆 题目链接:YbtOJ #594 小 A 新开了一个图书馆(初始里面没有书)。 书的类型有 n 种,其中第 i 种书的价格为 c_i。 1\leq n,k\leq 1000,1\leq a_i\leq n,0\leq c_i\leq 10^6。 Solution 强制每天都买书,每天都需要提交书。 为了消去存下来再次使用的书的强制购买费用,考虑定义一个“卖书”操作,即如果在强制购买之前手上已经有需要的书了,可以把手上这本卖了。具体地,将花费减去 c_i,并将这本书提交到上一次需要这本书的那天。 (pc(x+'0'),0):(write(x/10),pc(x%10+'0'),0);} Tp I void writeln(Cn Ty& x){write(x),pc('\n');} }using q.push_back(to):q.push_front(to),0),vis[to]=1); return C[T]<inf; } I void MCMF(){//最小费用最大流 RI

    1.8K20编辑于 2022-09-19
  • 来自专栏AI相关

    模型API的token是如何计算的?

    在我们日常使用语言模型(LLM)API时,比如OpenAI、Anthropic或其他厂商的接口,token数量几乎是一个绕不开的问题。 无论是控制调用成本,还是预估模型上下文长度,都离不开对token计算方式的理解。比如我在某个平台调用模型API的时候就会有一些相关的参数:看着这些参数有时我会不禁发问:token到底是什么? 例如:GPT系列使用tiktoken(基于BPE编码)Claude使用AnthropictokenizerGemini使用自家SentencePiece编码器输入与输出Token的计算方式在调用模型API 看似便宜,但若你每天调用10万次,就会有显著成本差异。 理解它,才能真正掌握模型API的成本和性能。希望这篇文章能帮你在与LLM的交互中,更“省钱”、也更“聪明”。

    3.6K20编辑于 2025-11-10
  • 来自专栏大模型应用

    模型应用:模型性能评估指标:CLUE任务与数据集详解.10

    ,应运而生,它就像一把精准的尺子,为中文模型的性能评估提供了标准化方案。 同样,没有CLUE这样的基准,我们也难以比较不同模型的优劣。CLUE不仅填补了中文自然语言处理评估的空白,更为模型研发提供了明确的方向指引。二. CLUE基准概述1. label] = metrics['f1-score'] if f1_scores: labels = list(f1_scores.keys())[:10 : 完整的评估流程8.2 完整的评估指标准确率、精确率、召回率、F1分数精确匹配率(阅读理解)NER任务的序列标注指标置信度分析七、总结 CLUE基准作为中文模型评估的重要标准,不仅为技术发展提供了明确的导向 随着人工智能技术的不断演进,CLUE基准也将持续完善,更好地服务于模型的研发和应用。 正如一句古语所说:"工欲善其事,必先利其器。"CLUE基准就是我们评估和提升模型能力的利器。

    58032编辑于 2026-02-07
  • 来自专栏大模型应用

    模型应用:模型的本地 API 服务:FastAPI 封装与接口鉴权.44

    核心概念模型本地 API 服务:把本地电脑或服务器上的模型,变成一个 "可随时呼叫的工具人"。不用连云端,本地就能通过指令调用它干活,数据全程不泄露。 基础了解2.1 本地 API 服务的优势解决云端痛点:云端模型有隐私泄露风险、要付调用费、没网用不了,本地 API 服务完美规避这些问题。 降低使用门槛:封装后,不懂模型底层的开发者,也能通过简单指令调用模型能力。2.2 FastAPI 是什么轻量高效的 Python 框架:专门用来搭建 API 服务,比传统框架快很多,支持并发请求。 服务器接收请求后,先验证凭证是否正确,比如 API Key 是否存在、未过期,验证通过才让模型处理请求。核心流程:1. API 的内存资源不会被无限占用;轻量化:令牌是字符串,传输快,适配模型 API 的低延迟需求。

    62753编辑于 2026-03-13
  • 来自专栏机器之心

    费用!阿里通义模型上新,超逼真音视频生成SOTA!

    背景 近年来,随着语言模型的迅速发展,虚拟主播、虚拟助手等应用得到了广泛的推广与使用。 关于模型结构,我们方法的核心在于建模视频、音频和文本模态之间的交互,旨在生成既连贯又同步的音视频内容。 至于视频解码,我们设计了一个 GAN 模型(复用 ChatAnyone),它根据从参考视频中随机选取的参考帧为基础,并按照 DiT 模型预测的头部姿态和混合形状系数生成新的视频帧。 该模型能以 30FPS 的速度生成分辨率为 512×512 的帧,满足实时推理的需求。 值得注意的是,通过对比包含和不包含运动分支(Ours w/o motion)的模型表现,可以看出完整模型实现了更低的 WER,这证明了结合视觉监督能有效提升生成音频的感知质量。

    1.2K10编辑于 2025-04-16
  • 来自专栏Java实战博客

    自建Sub2API – Ollama 自建模型API管理页 – AI IDE – CodeX使用本地模型

    Sub2API 就是给 Ollama 套了一层 “企业级门面”,让你本地跑的模型,能像商用 API(OpenAI 格式)一样被各种软件直接调用,还能管权限、控流量、做多模型调度。 Ollama启动 本篇不强调Ollama,因为很多Windows平台的电脑,跑模型性能很差。这里只描述的Ollama启动,供Sub2API使用。 Ollama本地启动服务。 Sub2API启动 Sub2API 是一个开源的 AI API 网关与管理平台,核心是把你本地(如 Ollama)或云端(如 OpenAI、Claude)的 AI 模型,统一转换成标准的 OpenAI 登录后界面是: 创建分组 Sub2API 的「分组(Group)」,核心是按「接口类型 / 模型来源 / 用途」把上游账号(如 Ollama、OpenAI、Claude)归类隔离,实现独立调度、权限控制与负载均衡 简单说:分组 = 模型资源池 + 调度单元 + 权限边界。 随便起个名字就好 这个其实分组,没啥太大意义,只要是用于后续 创建Sub2API的秘钥,配置外部API信息都需要绑定我们的分组。

    5.7K30编辑于 2026-04-20
  • 来自专栏喔家ArchiSelf

    模型应用的10种架构模式

    作为一位老码农,我在这里整理总结了一些针对模型应用的设计方法和架构模式,试图应对和解决模型应用实现中的一些挑战,如成本问题、延迟问题以及生成的不准确性等。 2.模型代理模式 想象一个生态系统,其中多个专门针对特定任务的生成式AI模型各自作为其领域内的专家,并行工作以处理查询。 此外,更广泛的数据集和服务也能用于访问更全面的知识图谱,包括开源的企业知识图谱API、PyKEEN数据集以及Wikidata等等。 7. 10. 双重安全模式 围绕大型语言模型(LLM)的核心安全性至少包含两个关键组件:一是用户组件,我们将其称为用户Proxy代理;二是防火墙,它为模型提供了保护层。 随着我们们继续探索和创新,还会涌现出很多新的架构模式,而且这里的10个架构模式以及新涌现的架构模式可能成为人工智能服务的表现形态。

    5.3K11编辑于 2024-04-03
领券