首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏6G

    6G,AI , 与模型?

    6G与AI融合的未来方向 6G 网络的内生 AI 设计将赋能网络的AI模型,同时使网络能够支持 AI 模型的训练和服务。 另外,从小模型模型,生产效率跨越式提升基础通用模型具有泛化性,网络智能化将从用例驱动转变为能力驱动,迅速降低应用开发门槛,加速 AI 工程化、规模化落地。 6G 网络将承担数据采集、预处理等数据服务,为云AI训练提供更好的支持。此外,6G 网络的分布式部署将使得 AI 模型更靠近用户侧,从而在时延方面具有潜在优势。 6G 网络面临如何有效采集适合AI模型训练的数据的挑战。而在构建 AI 模型的路径上,需要分阶段探索,从离线小规模模型开始,逐步过渡到实时大规模模型,最终实现统一的网络 AI 模型。 本文摘自于中国移动的“6G内生AI架构及AI模”汇报材料。

    51010编辑于 2024-04-24
  • 来自专栏软件测试学习

    怎么通过API调用AI模型获取响应结果

    要通过api在代码里面去调用模型,需要先申请模型api key,以deepseek官网为例,apikey的申请地址:https://platform.deepseek.com/api_keys 目前 代码案例的话,deepseek官网就有提供最简单的案例: https://api-docs.deepseek.com/zh-cn/ 调用上面的代码,需要安装依赖: pip install openai 通过上面2篇文章,一个是可以将模型切换为其他第三方平台的api进行调用,有的平台注册会赠送一定的体验额度,可以临时用于代码调试啥的,另一篇文章的话,是可以将代码里面的apikey以及对应的api地址等信息放到配置文件里面 模型列表可以参考:https://huggingface.co/deepseek-ai/models https://modelscope.cn/models

    5.1K10编辑于 2025-06-23
  • 来自专栏小洁叫你mysql

    AI模型】训练Al模型

    模型超越AI 目前所指的模型,是“大规模深度学习模型”的简称,指具有大量参数和复杂结构的机器学习模型,可以处理大规模的数据和复杂的问题,多应用于自然语言处理、计算机视觉、语音识别等领域。 本文将探讨模型的概念、训练技术和应用领域,以及与模型相关的挑战和未来发展方向。 模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数,而模型则可能拥有数亿或数十亿个参数。 训练模型的挑战 训练模型需要应对一系列挑战,包括: 以下是与模型相关的一些代码示例: 计算资源需求: import tensorflow as tf # 指定使用GPU进行训练 with tf.device 更智能的模型压缩技术:模型压缩和加速技术将继续发展,以减小模型的计算和存储开销。 更好的计算平台支持:为了支持训练和部署模型,计算平台将继续改进,提供更强大的计算资源和工具。

    1.7K30编辑于 2023-10-10
  • 来自专栏Java实战博客

    自建Sub2API – Ollama 自建模型API管理页 – AI IDE – CodeX使用本地模型

    Sub2API 就是给 Ollama 套了一层 “企业级门面”,让你本地跑的模型,能像商用 API(OpenAI 格式)一样被各种软件直接调用,还能管权限、控流量、做多模型调度。 Ollama启动 本篇不强调Ollama,因为很多Windows平台的电脑,跑模型性能很差。这里只描述的Ollama启动,供Sub2API使用。 Ollama本地启动服务。 Sub2API启动 Sub2API 是一个开源的 AI API 网关与管理平台,核心是把你本地(如 Ollama)或云端(如 OpenAI、Claude)的 AI 模型,统一转换成标准的 OpenAI | grep "admin password" sub2api | Generated admin password (one-time): 790d9c820cde6a2c265457ac8b875669 配置CodeX使用Sub2API 找到 API秘钥 - 创建秘钥 填写基本信息 使用 看到CodeX配置信息,按照要求创建文件,或者修改文件内容即可! 如果你有其他AI IDE也可以介入。

    9.2K30编辑于 2026-04-20
  • 来自专栏帅云霓的技术小屋

    模型AI底层技术揭秘 (6) 分割与征服

    所谓的分治,就是将一个而复杂的问题,拆分为小而容易解决的问题。

    46420编辑于 2023-10-25
  • 来自专栏量子位

    AI模型时代 ≠ 只有模型AI时代

    从这个规律来看,语言模型(简称LLM)出现后虽然霸占了所有与AI相关的关键词,吸引了所有人的注意力,但这并不代表“LLM之前无AI”。 所以,AI不是只有模型AI模型时代也 ≠ 只有模型AI时代。 成熟的AI,早就已经上岗了 或许你还不敢相信,现在哪怕小小的快递背后,都已经有AI技术在加持了。 然而,这些仅仅是已经成熟上岗的AI技术在英特尔®️ 平台得到的优化,英特尔的能力还远不止如此。 这就要说回模型了。 例如最近大火的ChatGLM-6B,其借助第四代至强®️ 可扩展处理器内置的英特尔®️ AMX,让模型微调计算速度得以大幅提升;利用至强®️ CPU Max系列处理器集成的HBM,满足模型微调所需的大内存带宽 更多《英特尔平台上的行业AI实战与模型优化》相关内容,可扫描下方海报中的二维码获取。点击原文链接,阅读英特尔《最“in”模型》专栏的所有文章。 — 完 —

    80310编辑于 2023-09-27
  • 来自专栏Michael阿明学习之路

    AI模型全栈工程师课程笔记 -Assistant API

    选择模型:gpt-3.5-turbo-1106 添加函数: { "name": "ask_database", "description": "Use this function to answer /utils/.env')) # 初始化 OpenAI 服务 client = OpenAI() # openai >= 1.3.0 起,OPENAI_API_KEY 和 OPENAI_BASE_URL , ) msg 格式 { "id": "msg_****InY6fsmPcBTtLU3GkS2y", "assistant_id": null, "content": [ "param": null, "code": null } } 参看:https://cookbook.openai.com/examples/assistants_api_overview_python

    86710编辑于 2023-12-10
  • 分享6类10种政务AI模型应用场景

    模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。模型的设计目的是提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。 模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。 6类政务AI模型的应用场景:政务咨询领域:通过构建具备深厚专业知识的智能助手,针对财务、环保等专业领域,提供精确的咨询和解答服务。这有助于提升企业和公众的办事体验,同时增强政府机构的工作效率。 城市治理领域:模型专注于快速响应民意诉求、智能分类问题、高效处理事件工单等城市治理需求,开发特色应用,提高城市事件处理的效率,提升城市治理的智能化水平。 机关运行优化:利用模型技术,通过人机协作,减少公务人员在日常工作中的重复性劳动,使他们能更专注于核心职责,从而提升工作效率。

    2.9K10编辑于 2024-08-06
  • 来自专栏大模型&AIGC

    6模型微调技术

    值得一提的是,通过使用T5模型进行模型大小的消融实验,我们展示了提示微调随着规模的增加变得更加具有竞争力:当模型参数超过数十亿时,我们的方法“缩小了差距”并达到了模型微调(即调整所有模型权重)的强大性能 input和target,则使用原始的input embedding(5) 使用方式离散和连续template token混合时,显示地插入一下anchor(离散的token)有助于template的优化(6) ,无需verbalizer(4) 特点在小、模型上,效果均优于P-tuning。 当参数量达10B,效果相当于FT6.LoRA(2021)(1) 论文信息来自论文:《LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS》(2)摘要自然语言处理的一个重要范式包括在通用领域数据上进行大规模预训练 Model),学习目标为而加入LoRA后,学习目标为:(6) 配置在多个部位$(Q/K/V/Output)$同时添加$\bigtriangleup W$ ,会比只在单一部分上添加权重$\bigtriangleup

    3.1K00编辑于 2025-05-08
  • 来自专栏AI智能体从入门到实践

    构建AI智能体:初识腾讯混元AI模型API调用

    闲话少叙,本集合文章是作者对模型一路的笔记和从业后的回顾,希望能和大家一起成长交流,将从初学模型基础到AI智能体的搭建一步步开启AI模型时代的开端。 1.首先登录腾讯云模型API的管理后台,申请API-key;2. 主要通过腾讯的腾讯云模型API提供的混元模型API和SDK来实现模型的应用,混元模型支持文本模型和生图模型,通过API的方式方便开发者调用,可通过腾讯云SDK方式接入或使用OpenAI SDK方式接入 **语言翻译**:AI模型可以实现多种语言之间的自动翻译,帮助人们跨越语言障碍,促进国际交流与合作。\n\n5. **语音识别与合成**:AI模型可以将语音转换为文本,也可以将文本转换为语音,实现语音交互功能,提高人机交互的便捷性和智能化水平。\n\n6.

    3.5K11编辑于 2025-12-10
  • 来自专栏人工智能领域

    AI模型学习

    AI模型学习 在当前技术环境下,AI模型学习不仅要求研究者具备深厚的数学基础和编程能力,还需要对特定领域的业务场景有深入的了解。 方向一:AI模型学习的理论基础 AI 模型学习的理论基础涉及深度学习、神经网络、优化算法等多个方面。 ———————————————— 方向二:AI模型的训练与优化 AI 模型学习的理论基础涉及深度学习、神经网络、优化算法等多个方面。 ———————————————— 方向三:AI模型在特定领域的应用 AI模型的训练与优化是深度学习领域中至关重要的一部分。 ———————————————— 方向四:AI模型学习的伦理与社会影响 AI模型学习的伦理与社会影响是一个备受关注的话题,以下是一些关于这个方向的重要内容: 数据隐私:AI模型需要大量的数据来训练

    72810编辑于 2024-12-18
  • 零基础学AI模型之读懂AI模型

    模型知识,因此希望可以通过自己学习然后以写文章的形式向大家同样想零基础学习模型的同学进行互相交流,欢迎大家在评论区打出自己的疑问或者本文不正确的地方,我们一起学习 零基础学AI模型之读懂AI模型 甚至企业里说的“开发模型”,真的是从头造一个“大脑”吗? 今天就用通俗的语言,把AI模型的核心逻辑、能力边界和落地场景讲透,最后再给大家一份主流模型的选择指南。 一、什么是AI模型? 这时候,AI智能体(Agent) 才是模型的“落地形态”。 企业真正要开发的是AI智能体:模型的“升级版” 所谓“AI智能体(Agent)”,是给模型加上“手脚”“记忆”和“规划能力”,让它从“聊天工具”变成“能干活的助手”。 (70B)对硬件配置要求较高 最后:AI模型的核心不是“越复杂越好”,而是“越实用越好” 看完这些,你会发现:AI模型的本质是“用海量规律解决问题”,而它的落地关键是“智能体”——把“语言能力”变成

    1.6K20编辑于 2025-12-22
  • 国内模型API选型:别让接口选择拖垮你的AI应用

    国内模型API选型:别让接口选择拖垮你的AI应用 如果你正在开发AI应用,或者负责企业内部的模型接入,你大概率已经遇到过这个问题:市面上国内模型API五花八门,从文心一言到通义千问,从讯飞星火到豆包 为什么国内模型API这么多,但选起来这么费劲? 说实话,我从2023年开始接触模型API,那时候选择还比较少,主要就是百度文心一言和阿里通义千问。现在呢? 这时候,你就需要一个多模型统一接入的方案,让应用能灵活切换底层模型,而不需要改代码。 我见过一个教育行业的案例:对方做AI写作API,初期只用了文心一言,但后来发现对古诗词解析不够好。 IDC在2025年的报告里提到,中国企业级AI应用中有67%优先选择国产模型,主要原因是数据安全和响应速度。 未来趋势:如何让模型API选型更简单? 我个人觉得,明年我们会看到更多大模型聚合平台出现,它们类似AI API聚合服务,帮你比价、调度、监控。

    10610编辑于 2026-07-01
  • 来自专栏星哥的AI自留地

    免费获得模型Api-Key的方法:英伟达提供GLM-4.7、Minimax M2.1模型和GitHub的AI模型API申请

    今天就给大家介绍英伟达和Github的免费模型APIKey的获取方法。 传送门:OpenRouter提供的DeepSeek-R1-70B的模型免费用获取各大人工智能AI工具通过API和KEY调用的方法英伟达-Nvidia的免费APIKey说到英伟达,大家的第一反应可能是" 6.创建APIKeys点击“APIKeys”进入管理页面点击“GenerateAPIKey”创建API密钥输入KeyName过期默认选择,按照需求选择,可以选择12个月,也可以选择永不过期最后“GenerateKey -3.1检测,yi-large检测失败3.选择模型点击“管理”搜索模型,我这里先oss、glm、minimax的关键字再添加对应的模型4.测试问题回到助手选择英伟达模型问它一个问题,看是否能回答。 模型,如OpenAI、deepseek、DeepSeek等。

    13210编辑于 2026-06-16
  • 零基础学AI模型AI模型常见概念

    模型 零基础学AI模型之SpringAI 前情摘要: 1、零基础学AI模型之读懂AI模型 2、零基础学AI模型之从0到1调用模型API 3、零基础学AI模型之SpringAI 零基础学 AI模型AI模型常见概念 一、先搞懂:什么是AI模型? 二、AI模型6个核心概念 如果把AI模型比作“智能大脑”,下面这些概念就是它的“神经中枢”——决定了它“怎么思考”“怎么干活”“怎么不犯错”。 1. 6. 工具调用(Tool Calling/Function Call) 模型本身不能查天气、查股票,但工具调用能让它“调用外部API”,获取实时数据或执行操作,相当于给模型装了“外接大脑”。 价值:让模型从“只懂理论”变成“能做实事”,比如自动查物流、生成实时报表。 6. AI模型概念总结 觉得有用请点赞收藏! 如果有相关问题,欢迎评论区留言讨论~

    95911编辑于 2025-12-22
  • 来自专栏NLP/KG

    模型应用:模型AI Agent在企业应用中的6种基础类型,企业智慧升级必备

    模型应用:模型AI Agent在企业应用中的6种基础类型,企业智慧升级必备 AI Agent 智能体在企业应用中落地的价值、场景、成熟度做了分析,并且探讨了未来企业 IT 基础设施与架构如何为未来 简单地将模型的生成能力通过 API 集成到其他应用与业务流程中,替代或简化原来由人工完成的部分工作。 在构建企业基于模型的应用助手时,有一些工程问题是需要考虑的,这些问题在做原型或者测试时容易被忽视: 企业中 API 过多的优化方案。 Assistants API:这是 OpenAI 官方最新放出构建 AI 助手的 API,如果你条件具备,也可以基于此构建企业 AI 助手,充分利用其强大的 gpt4 模型6.自定义流程助手 最后一种 AI Agent 严格来说是上面的几种基础 Agent 能力的组合。

    3.3K33编辑于 2024-05-07
  • 来自专栏人工智能极简应用

    AI模型】Transformers模型库(二):AutoModelForCausalLM

    一、引言 这里的Transformers指的是huggingface开发的模型库,为huggingface上数以万计的预训练模型提供预测、训练等服务。 Transformers 提供了便于快速下载和使用的API,让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。 这里使用了Auto自动模型,transformers包括管道pipeline、自动模型auto以及具体模型三种模型实例化方法,如果同时有配套的分词工具(Tokenizer),需要使用同名调度。 管道(Pipline)方式:高度集成的使用方式,几行代码就可以实现一个NLP任务 自动模型(AutoModel)方式:自动载入并使用BERT等模型 具体模型方式:在使用时需要明确具体的模型,并按照特定参数进行调试 同时,列举了管道模型、自动模型、具体模型等三种transformers预训练模型实例化方法。期待大家三连。

    3.1K11编辑于 2024-08-13
  • 来自专栏人工智能极简应用

    AI模型】Transformers模型库(四):AutoTokenizer

    一、引言 这里的Transformers指的是huggingface开发的模型库,为huggingface上数以万计的预训练模型提供预测、训练等服务。 Transformers 提供了便于快速下载和使用的API,让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。 这意味着,当你知道模型的名称时,你可以使用AutoTokenizer自动获取与该模型匹配的分词器,而不需要了解分词器的具体实现细节。 2.2 主要特点 模型兼容性:通过模型名称自动匹配合适的分词器,支持BERT、RoBERTa、Albert、DistilBERT、T5等众多模型。 这意味着,当知道模型的名称时,可以使用AutoTokenizer自动获取与该模型匹配的分词器。

    2.1K10编辑于 2024-08-13
  • 来自专栏人工智能极简应用

    AI模型】Transformers模型库(一):Tokenizer

    一、引言 这里的Transformers指的是huggingface开发的模型库,为huggingface上数以万计的预训练模型提供预测、训练等服务。 Transformers 提供了数以千计的预训练模型,支持 100 多种语言的文本分类、信息抽取、问答、摘要、翻译、文本生成。它的宗旨是让最先进的 NLP 技术人人易用。 Transformers 提供了便于快速下载和使用的API,让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。 你可以直接使用一个框架训练你的模型然后用另一个加载和推理。 本文重点介绍Tokenizer类。 **编码**:将tokens转换为数字ID,这些ID是模型的输入。每个token在词汇表中有一个唯一的ID。 4.

    2K12编辑于 2024-08-13
  • 来自专栏人工智能极简应用

    AI模型】Transformers模型库(十二):Evaluate模型评估

    一、引言 这里的Transformers指的是huggingface开发的模型库,为huggingface上数以万计的预训练模型提供预测、训练等服务。 Transformers 提供了便于快速下载和使用的API,让你可以把预训练模型用在给定文本、在你的数据集上微调然后通过 model hub 与社区共享。 二、Evaluate模型评估 2.1 概述 Transformers库中的evaluate API主要用于评估模型在特定数据集上的性能。 虽然Transformers库本身没有直接提供一个名为evaluate的独立API函数,但通常通过Trainer类的evaluate方法来实现模型评估。 创建训练和评估数据集 train_dataset = encoded_dataset['train'] eval_dataset = encoded_dataset['test'] 2.2.6 步骤6:

    1.2K10编辑于 2024-08-13
领券