首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏GiantPandaCV

    星辰AI模型TeleChat-7B评测

    前言 受中电信 AI 科技有限公司的邀请,为他们近期开源的TeleChat-7B模型做一个评测。 TeleChat-7B是由中电信 AI 科技有限公司发的第一个千亿级别模型,基于transformer decoder架构和清洗后的1TB高质量数据训练而成,取得了相同参数量级别的SOTA性能,并且将推理代码和清洗后的训练数据都进行了开源 最后,我们可以从TeleChat-7B开源项目在文创方面展示的例子看到它具有不错的文创能力和一定的代码能力,可以作为开发者来使用的一个不错的基础模型。 总结 总的来说,TeleChat-7B具有一定的文创能力和代码能力,对于本次测试的大多数prompt可以生成较为合理的答案。但模型本身也存在模型幻觉,指令跟随能力一般以及回答有概率重复的问题。 此外,TeleChat-7B在开源方面是相当有诚意的,将清洗之后的训练数据进行开源是在之前的模型开源中比较难见到的,如果想了解更多的数据清洗细节以及模型训练的细节可以阅读官方放出的技术报告:https

    76920编辑于 2024-02-22
  • 构建可靠AI模型7核心技术

    稳健与脆弱AI国际标准化组织将AI稳健性定义为“AI系统在任何情况下保持性能水平的能力”。在稳健模型中,训练错误率、测试错误率和操作错误率几乎相同。 模型性能是否会下降?在什么情况下模型不再可行?当环境中的微小变化导致功能和准确性发生巨大变化时,模型就被认为是非弹性或“脆弱”的。脆弱性是软件工程中的已知概念,也适用于AI。 最终,所有AI模型都在某种程度上是脆弱的。开发可靠AI可靠AI即使在遇到训练数据中未包含的输入(称为分布外输入)时也能按预期执行。这些数据点与训练集不同,可靠AI必须能够检测数据是否为分布外输入。 为了更深入地了解AI如何运行,有一些工具允许模型在预测或输出旁边报告不确定程度。这朝着信任稳健系统迈进。如果模型报告高度不确定性,这对人类操作员或其他网络AI是有价值的洞察。 变化较慢、低优先级的模型可以在更长的时间线上检查,在某些情况下使用API进行功能自动评估。这些检查的结果应促使对任何异常、差异和意外结果进行调查和解决。

    41800编辑于 2025-08-30
  • 来自专栏软件测试学习

    怎么通过API调用AI模型获取响应结果

    要通过api在代码里面去调用模型,需要先申请模型api key,以deepseek官网为例,apikey的申请地址:https://platform.deepseek.com/api_keys 目前 代码案例的话,deepseek官网就有提供最简单的案例: https://api-docs.deepseek.com/zh-cn/ 调用上面的代码,需要安装依赖: pip install openai 通过上面2篇文章,一个是可以将模型切换为其他第三方平台的api进行调用,有的平台注册会赠送一定的体验额度,可以临时用于代码调试啥的,另一篇文章的话,是可以将代码里面的apikey以及对应的api地址等信息放到配置文件里面 模型列表可以参考:https://huggingface.co/deepseek-ai/models https://modelscope.cn/models

    5.1K10编辑于 2025-06-23
  • 来自专栏AI智能体从入门到实践

    构建AI智能体:初识腾讯混元AI模型API调用

    闲话少叙,本集合文章是作者对模型一路的笔记和从业后的回顾,希望能和大家一起成长交流,将从初学模型基础到AI智能体的搭建一步步开启AI模型时代的开端。 1.首先登录腾讯云模型API的管理后台,申请API-key;2. 主要通过腾讯的腾讯云模型API提供的混元模型API和SDK来实现模型的应用,混元模型支持文本模型和生图模型,通过API的方式方便开发者调用,可通过腾讯云SDK方式接入或使用OpenAI SDK方式接入 **语言翻译**:AI模型可以实现多种语言之间的自动翻译,帮助人们跨越语言障碍,促进国际交流与合作。\n\n5. **图像识别与生成**:结合计算机视觉技术,AI模型可以识别图像中的物体、场景和人脸等信息,也可以生成符合特定主题和风格的图像。\n\n7.

    3.5K11编辑于 2025-12-10
  • 来自专栏Java实战博客

    自建Sub2API – Ollama 自建模型API管理页 – AI IDE – CodeX使用本地模型

    Sub2API 就是给 Ollama 套了一层 “企业级门面”,让你本地跑的模型,能像商用 API(OpenAI 格式)一样被各种软件直接调用,还能管权限、控流量、做多模型调度。 Ollama启动 本篇不强调Ollama,因为很多Windows平台的电脑,跑模型性能很差。这里只描述的Ollama启动,供Sub2API使用。 Ollama本地启动服务。 Sub2API启动 Sub2API 是一个开源的 AI API 网关与管理平台,核心是把你本地(如 Ollama)或云端(如 OpenAI、Claude)的 AI 模型,统一转换成标准的 OpenAI 简单说:分组 = 模型资源池 + 调度单元 + 权限边界。 随便起个名字就好 这个其实分组,没啥太大意义,只要是用于后续 创建Sub2API的秘钥,配置外部API信息都需要绑定我们的分组。 配置CodeX使用Sub2API 找到 API秘钥 - 创建秘钥 填写基本信息 使用 看到CodeX配置信息,按照要求创建文件,或者修改文件内容即可! 如果你有其他AI IDE也可以介入。

    9.2K30编辑于 2026-04-20
  • 来自专栏小洁叫你mysql

    AI模型】训练Al模型

    模型超越AI 目前所指的模型,是“大规模深度学习模型”的简称,指具有大量参数和复杂结构的机器学习模型,可以处理大规模的数据和复杂的问题,多应用于自然语言处理、计算机视觉、语音识别等领域。 本文将探讨模型的概念、训练技术和应用领域,以及与模型相关的挑战和未来发展方向。 模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数,而模型则可能拥有数亿或数十亿个参数。 训练模型的挑战 训练模型需要应对一系列挑战,包括: 以下是与模型相关的一些代码示例: 计算资源需求: import tensorflow as tf # 指定使用GPU进行训练 with tf.device 更智能的模型压缩技术:模型压缩和加速技术将继续发展,以减小模型的计算和存储开销。 更好的计算平台支持:为了支持训练和部署模型,计算平台将继续改进,提供更强大的计算资源和工具。

    1.7K30编辑于 2023-10-10
  • 来自专栏司钰秘籍

    AI模型学习

    通过不断优化模型结构和算法,AI模型学习能够不断提升模型的准确性和效率,为人类生活和工作带来更多便利。 AI模型学习的理论基础 数学基础: 线性代数:AI 模型中大量使用向量和矩阵运算,如矩阵乘法、向量点积等,用于表示和操作数据。 7. 早停法:根据验证集上的性能,在合适的时候停止训练,避免过拟合。 8. 迁移学习:利用已有的预训练模型,在新的任务上进行微调,加快训练过程。 9. AI模型在特定领域的应用 在自然语言处理领域,AI 模型如 GPT-3 被广泛应用于文本生成、机器翻译、问答系统等。 此外,模型的性能也受到计算资源、数据质量和算法优化等因素的影响 AI模型学习的伦理与社会影响 AI 模型学习确实带来了一些伦理和社会问题,我们需要认真对待: 1.

    73910编辑于 2024-04-04
  • 零基础学AI模型之读懂AI模型

    模型知识,因此希望可以通过自己学习然后以写文章的形式向大家同样想零基础学习模型的同学进行互相交流,欢迎大家在评论区打出自己的疑问或者本文不正确的地方,我们一起学习 零基础学AI模型之读懂AI模型 甚至企业里说的“开发模型”,真的是从头造一个“大脑”吗? 今天就用通俗的语言,把AI模型的核心逻辑、能力边界和落地场景讲透,最后再给大家一份主流模型的选择指南。 一、什么是AI模型? 这时候,AI智能体(Agent) 才是模型的“落地形态”。 企业真正要开发的是AI智能体:模型的“升级版” 所谓“AI智能体(Agent)”,是给模型加上“手脚”“记忆”和“规划能力”,让它从“聊天工具”变成“能干活的助手”。 (70B)对硬件配置要求较高 最后:AI模型的核心不是“越复杂越好”,而是“越实用越好” 看完这些,你会发现:AI模型的本质是“用海量规律解决问题”,而它的落地关键是“智能体”——把“语言能力”变成

    1.6K20编辑于 2025-12-22
  • 来自专栏机器学习入门

    AI模型】LLM主流开源模型介绍

    学习目标 了解LLM主流开源模型. 掌握ChatGLM、LLaMA、Bloom等基础模型的原理 LLM主流模型类别 随着ChatGPT迅速火爆,引发了模型的时代变革,国内外各大公司也快速跟进生成式AI市场,近百款模型发布及应用 目前,市面上已经开源了各种类型的语言模型,本章节我们主要介绍其中的三类: ChatGLM-6B:衍生的模型(wenda、ChatSQL等) LLaMA:衍生的模型(Alpaca、Vicuna 闻达:大型语言模型调用平台,基于 ChatGLM-6B 实现了类 ChatPDF 功能 LLaMA模型 LLaMA(Large Language Model Meta AI),由 Meta AI 于2023 年发布的一个开放且高效的大型基础语言模型,共有 7B、13B、33B、65B(650 亿)四种版本。

    1.4K10编辑于 2024-09-24
  • 来自专栏Michael阿明学习之路

    AI模型全栈工程师课程笔记 -Assistant API

    选择模型:gpt-3.5-turbo-1106 添加函数: { "name": "ask_database", "description": "Use this function to answer /utils/.env')) # 初始化 OpenAI 服务 client = OpenAI() # openai >= 1.3.0 起,OPENAI_API_KEY 和 OPENAI_BASE_URL "param": null, "code": null } } 参看:https://cookbook.openai.com/examples/assistants_api_overview_python

    86610编辑于 2023-12-10
  • 国内模型API选型:别让接口选择拖垮你的AI应用

    国内模型API选型:别让接口选择拖垮你的AI应用 如果你正在开发AI应用,或者负责企业内部的模型接入,你大概率已经遇到过这个问题:市面上国内模型API五花八门,从文心一言到通义千问,从讯飞星火到豆包 为什么国内模型API这么多,但选起来这么费劲? 说实话,我从2023年开始接触模型API,那时候选择还比较少,主要就是百度文心一言和阿里通义千问。现在呢? IDC在2025年的报告里提到,中国企业级AI应用中有67%优先选择国产模型,主要原因是数据安全和响应速度。 未来趋势:如何让模型API选型更简单? 我个人觉得,明年我们会看到更多大模型聚合平台出现,它们类似AI API聚合服务,帮你比价、调度、监控。 作者:郑成功 发布日期:2026年7月1日

    8310编辑于 2026-07-01
  • 来自专栏时来之笔

    2026 模型 API 免费额度汇总

    OpenClawMiniMax 开放平台无问芯穹¥19.9(入门档)1000次 / 5小时GLM、Kimi、MiniMax 等模型更新稍慢,适合预算敏感型无穹 Infini-AI 服务平台2026 模型 API 免费额度汇总清单 国家超算平台国家超算平台为开发者提供了极为丰厚的新用户注册福利,支持调用多款当前最新的前沿模型。 领取地址: 百度智能云千帆控制台️ 领取步骤:访问千帆模型平台阅读并同意用户协议后,系统将自动开通千帆模型平台并发放新用户免费Tokens额度。 , 4.5永久额度,国产自研强项智谱AI开放平台硅基流动新用户 2000 万 TokensDeepSeek, Llama 等开源模型永久额度,API 响应比较快硅基流动kimi新用户送15元代金券kimi-k2.5 ,kimi-k2等开源模型永久代金券,API 响应快kimi开放平台科大讯飞每个模型 20 万 Tokens星火 Ultra, Max, Pro涵盖长文本 128K 版本讯飞星火-懂我的AI助手魔搭社区每天

    55.2K342编辑于 2026-03-17
  • 来自专栏帅云霓的技术小屋

    模型AI底层技术揭秘 (7) 卡车搬运的数据

    在开篇之初,我们提到了最简单的AI算法:线性回归 (Linear Regression)。 实际上,一元线性回归是最简单的AI算法。 = np.float32(np.random.rand(2, 100)) # 随机输入 y_data = np.dot([0.100, 0.200], x_data) + 0.300 # 构造一个线性模型 又调用CUDA库,将常见的机器学习算法进行封装,使得数学水平没有那么好的工程师们也可以简单快速地开发AI/ML应用。 让我们再回到《模型AI底层技术揭秘 (2) 人妖之间的国度》中提到的“算盘打出原子弹”的故事。实际上,这是一个典型的分布式并发计算的场景。Tensorflow也提供了分布式训练的能力。

    51420编辑于 2023-10-30
  • 来自专栏量子位

    AI模型时代 ≠ 只有模型AI时代

    从这个规律来看,语言模型(简称LLM)出现后虽然霸占了所有与AI相关的关键词,吸引了所有人的注意力,但这并不代表“LLM之前无AI”。 所以,AI不是只有模型AI模型时代也 ≠ 只有模型AI时代。 成熟的AI,早就已经上岗了 或许你还不敢相信,现在哪怕小小的快递背后,都已经有AI技术在加持了。 然而,这些仅仅是已经成熟上岗的AI技术在英特尔®️ 平台得到的优化,英特尔的能力还远不止如此。 这就要说回模型了。 对于参数量为70亿的较小模型BLOOMZ-7B,在Gaudi®️2的单设备时延约为第一代Gaudi®️ 的37.21%;而当设备数量都增加为8后,这一百分比进一步下降至约24.33%。 更多《英特尔平台上的行业AI实战与模型优化》相关内容,可扫描下方海报中的二维码获取。点击原文链接,阅读英特尔《最“in”模型》专栏的所有文章。 — 完 —

    80210编辑于 2023-09-27
  • 来自专栏猫头虎博客专区

    小米MiMo:7B模型逆袭AI模型战场的技术密码

    小米MiMo:7B模型逆袭AI模型战场的技术密码 在模型竞争愈发激烈的2025年4月30日,小米以一款名为 MiMo-7B 的开源模型强势突围,在数学推理与代码能力评测中表现亮眼,不仅与规模更大的模型正面对抗 最终,MiMo累计训练了 25万亿 tokens,这一数据在7B模型中堪称顶级,为其强悍能力打下坚实基础。 2. 2024年底,95后AI大佬 罗福莉 加盟小米,以千万年薪领导模型研发团队。 这将反哺模型优化,形成闭环进化的AI生态试验田。 结语:小米的新角色,是AI生态的创变者 MiMo的发布,不仅标志着小米在模型赛道的技术跃升,更意味着其正在从“智能终端制造商”迈向“AI生态运营者”。

    1.6K10编辑于 2025-05-02
  • 来自专栏人工智能极简应用

    AI模型】Transformers模型库(八):模型微调之LoraConfig

    一、引言 这里的Transformers指的是huggingface开发的模型库,为huggingface上数以万计的预训练模型提供预测、训练等服务。 Transformers 提供了便于快速下载和使用的API,让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。 你可以直接使用一个框架训练你的模型然后用另一个加载和推理。 LoRA是一种用于微调大型语言模型的轻量级方法,它通过添加低秩矩阵到预训练模型的权重上来实现适应性调整,从而在不显著增加模型大小的情况下提升特定任务的性能。 get_peft_model(model, config) print_trainable_parameters(model) 三、总结 本文简要介绍LoraConfig的配置参数情况,具体的机遇peft对模型进行微调后面单独开一页详细讲解

    1K10编辑于 2024-08-13
  • 来自专栏人工智能极简应用

    AI模型】Transformers模型库(二):AutoModelForCausalLM

    一、引言 这里的Transformers指的是huggingface开发的模型库,为huggingface上数以万计的预训练模型提供预测、训练等服务。 Transformers 提供了便于快速下载和使用的API,让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。 这里使用了Auto自动模型,transformers包括管道pipeline、自动模型auto以及具体模型三种模型实例化方法,如果同时有配套的分词工具(Tokenizer),需要使用同名调度。 管道(Pipline)方式:高度集成的使用方式,几行代码就可以实现一个NLP任务 自动模型(AutoModel)方式:自动载入并使用BERT等模型 具体模型方式:在使用时需要明确具体的模型,并按照特定参数进行调试 同时,列举了管道模型、自动模型、具体模型等三种transformers预训练模型实例化方法。期待大家三连。

    3.1K11编辑于 2024-08-13
  • 来自专栏人工智能极简应用

    AI模型】Transformers模型库(四):AutoTokenizer

    一、引言 这里的Transformers指的是huggingface开发的模型库,为huggingface上数以万计的预训练模型提供预测、训练等服务。 Transformers 提供了便于快速下载和使用的API,让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。 这意味着,当你知道模型的名称时,你可以使用AutoTokenizer自动获取与该模型匹配的分词器,而不需要了解分词器的具体实现细节。 2.2 主要特点 模型兼容性:通过模型名称自动匹配合适的分词器,支持BERT、RoBERTa、Albert、DistilBERT、T5等众多模型。 这意味着,当知道模型的名称时,可以使用AutoTokenizer自动获取与该模型匹配的分词器。

    2.1K10编辑于 2024-08-13
  • 来自专栏人工智能极简应用

    AI模型】Transformers模型库(十二):Evaluate模型评估

    一、引言 这里的Transformers指的是huggingface开发的模型库,为huggingface上数以万计的预训练模型提供预测、训练等服务。 Transformers 提供了便于快速下载和使用的API,让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。 二、Evaluate模型评估 2.1 概述 Transformers库中的evaluate API主要用于评估模型在特定数据集上的性能。 虽然Transformers库本身没有直接提供一个名为evaluate的独立API函数,但通常通过Trainer类的evaluate方法来实现模型评估。 model, args=training_args, train_dataset=train_dataset, eval_dataset=eval_dataset ) 2.2.7 步骤7:

    1.2K10编辑于 2024-08-13
  • 来自专栏人工智能领域

    AI模型学习

    AI模型学习 在当前技术环境下,AI模型学习不仅要求研究者具备深厚的数学基础和编程能力,还需要对特定领域的业务场景有深入的了解。 方向一:AI模型学习的理论基础 AI 模型学习的理论基础涉及深度学习、神经网络、优化算法等多个方面。 ———————————————— 方向二:AI模型的训练与优化 AI 模型学习的理论基础涉及深度学习、神经网络、优化算法等多个方面。 ———————————————— 方向三:AI模型在特定领域的应用 AI模型的训练与优化是深度学习领域中至关重要的一部分。 ———————————————— 方向四:AI模型学习的伦理与社会影响 AI模型学习的伦理与社会影响是一个备受关注的话题,以下是一些关于这个方向的重要内容: 数据隐私:AI模型需要大量的数据来训练

    72810编辑于 2024-12-18
领券