首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏云云众生s

    5个实际开源的多模态AI模型

    译自 5 Multimodal AI Models That Are Actually Open Source,作者 Kimberley Mok。 虽然市场上已经存在许多强大的、专有的多模态AI系统,但小型多模态AI模型和开源替代方案也正在迅速发展,因为用户不断寻求更易访问和更易适应的选项,并优先考虑透明度和协作。 Aria 最近推出的Aria AI模型来自Rhymes AI,被誉为世界首个开源的多模态原生专家混合 (MoE) 模型,它可以在一个架构中处理文本、代码、图像和视频。 5. xGen-MM 也被称为 BLIP-3,这是来自Salesforce 的一套最先进的开源多模态模型,它包含一系列变体,包括一个预训练基础模型,一个指令微调模型和一个旨在减少有害输出的安全微调模型。 结论 围绕开源 AI 的实际定义仍然存在持续的激烈争论,充斥着大型科技公司对其 AI 模型进行“开源洗白”以获得更广泛的信誉和声望的指控。

    2K10编辑于 2024-12-14
  • 来自专栏云云众生s

    5个小型多模态AI模型及其功能

    随着对多模态AI系统兴趣的增长,这些多功能工具的小型版本也随之增多。 译自 5 Small-Scale Multimodal AI Models and What They Can Do,作者 Kimberley Mok。 在本文的其余部分,我们将介绍五种最近备受关注的小型多模态AI工具。 1. 5. Mississippi 2B 和 Mississippi 0.8B 最近由H2O.ai发布,这两个多模态基础模型专为OCR和文档AI用例而设计。 结论 多模态模型以及大型语言模型的可访问性和成本效益仍然是主要问题。但随着越来越多的相对轻量级但功能强大的多模态AI选项可用,这意味着更多机构和小型企业将能够在其工作流程中采用AI

    70310编辑于 2024-12-04
  • 来自专栏C++开发学习交流

    AI模型AI模型部署概述

    AI模型部署方法 在AI深度学习模型的训练中,一般会用Python语言实现,原因是其灵活、可读性强。但在AI模型实际部署中,主要会用到C++,原因在于其语言自身的高效性。 AI模型部署框架 模型部署常见的推理框架有:ONNX、NCNN、OpenVINO、 TensorRT、Mediapipe。 通过短短几年的发展,已经成为表示深度学习模型的实际标准,并且通过ONNX-ML,可以支持传统非神经网络机器学习模型,大有一统整个AI模型交换标准的趋势。 AI模型部署平台 AI 模型部署是将训练好的 AI 模型应用到实际场景中的过程。 以下是一些常见的 AI 模型部署平台: 云端部署 云端部署是最流行的 AI 模型部署方式之一,通常使用云计算平台来托管模型和处理请求。

    1.8K10编辑于 2024-07-24
  • 来自专栏云云众生s

    用于训练多模态AI模型5个有用数据集

    译自 5 Useful Datasets for Training Multimodal AI Models,作者 Kimberley Mok。 例如,图像字幕任务需要一个结合图像和相关描述性文本的训练数据集,这可以用来训练AI模型。训练过程结束后,就可以部署AI模型,利用自然语言处理和计算机视觉技术识别新图像的内容并生成相关的文本。 这是因为多模态数据集使AI模型能够学习对象及其上下文之间更复杂的语义关系,从而提高模型的性能和准确性。 有如此多的多模态数据集公开可用,很难知道从哪里开始。 5. MINT-1T MINT-1T是一个庞大的开源数据集,来自Salesforce AI Research,包含一万亿文本标记和34亿张图像——几乎是下一个最大的开源数据集的十倍。 有如此多的选择,找到合适的训练AI模型的数据集相对容易。更多信息,请查看我们关于构建多模态AI应用程序的工具的帖子,以及一些开源和小型多模态AI模型

    1.6K10编辑于 2025-01-17
  • 来自专栏帅云霓的技术小屋

    模型AI底层技术揭秘 (5) 战争恶魔的末路

    “以色列现在已经是一个军事超级大国,欧洲任何一个国家的军队都不是我们的对手。” 阿利尔·沙龙在广播中趾高气扬地说。“我们能在一个星期之内征服从两河流域到阿尔及利亚这一广淼的地区,让以色列人收回这历史上属于犹太的土地!”

    41930编辑于 2023-10-23
  • 来自专栏悦思悦读

    AI 入行那些事儿(5)以模型为驱动学习机器学习

    2021 开年巨献 —— 系列文章《AI 入行那些事儿》,为您讲述: 人工智能的基础原理、发展历程、当前应用 成为 AI 技术人员所需的入门技能和学习途径 以及求职、面试的全过程 模型:机器学习三要素的核心 机器学习的三要素中,最核心的是模型。 无论算法还是数据都是为获得模型服务的。 建议读者在学习机器学习时,从模型函数入手,以数据处理、特征提取等知识为辅。通过推导模型的目标函数,来学习求解过程,并以此来学习算法。 ? 有监督学习 vs 无监督学习机 简单来说,机器学习模型可以分为两种:有监督的和无监督的。 有监督学习 前文提到的关于员工信息的模型就是有监督的模型,每一个训练数据样例都有一个人工打上的标签。 ? 有监督的模型可以分成多种类型,其中最常用的有回归模型和分类模型两种。回归模型的预测结果是连续的,它输出的是一个范围内的连续型任意值,而分类模型的预测结果是离散的,是几个有限的域离散值中的一个。

    66520发布于 2021-02-03
  • 只需5分钟,无需基础!轻松学会AI模型本地部署

    过去,本地部署AI模型往往意味着复杂的环境配置、繁琐的命令行操作,让普通电脑小白不知从何下手。但现在情况已经改变。 下面给大家分享一个非常简单的AI模型本地部署方法,5分钟就能学会,轻松将强大的AI模型部署到自己的电脑上,即使是完全不懂代码的小白也能轻松上手。 本地部署工具:【DS本地部署大师】这是一款对零基础用户非常友好的AI模型本地部署工具。它的核心目标就是将复杂的部署流程简化为几次鼠标点击,让每个人都能享受到本地AI的便利与安全。 多模型灵活选择:软件内集成了DeepSeek AI全系列的模型版本(如1.5b/7b/32b等)。用户可以根据自己电脑的硬件配置和实际需求,灵活选择不同参数规模的模型。 在模型选择栏中,选择你刚刚部署的本地模型(例如“快速模式”),可以在输入框中输入任何问题,体验由你自己的电脑驱动的AI服务了。

    2.5K20编辑于 2025-08-22
  • 来自专栏开源心路

    AI模型实战

    背景 通过示例梳理AI模型训练流程,示例比较简单,方便演示。 流程 机器学习实战步骤 定义问题 数据收集和预处理 选择算法并建立模型 训练模型 模型评估和优化 示例 定义问题 根据公开数据集预测加州房价分布 数据收集 import pandas as pd df_housing.drop("median_house_value",axis = 1) #构建特征集X y = df_housing.median_house_value #构建标签集y 选择算法并建立模型 #导入线性回归算法模型 model = LinearRegression() #使用线性回归算法 model.fit(X_train, y_train) #用训练集数据,训练机器,拟合函数,确定参数 211157.06335417 218581.64298574 465317.31295563 ... 201751.23969631 160873.51846958 138847.26913352] 模型评估

    33710编辑于 2023-06-30
  • 来自专栏服务端技术杂谈

    AI Agent:模型->工具->结果->模型

    Reddit上有人说,AI Agent就是:模型->工具->结果->模型。 从程序员角度来说,就是拼接参数json,调用LLM,处理返回值json。 不需要用什么复杂的框架,基本上只需要串联: 用户输入目标Prompt->将提示词传递给LLM->模型决定下一步->需要工具(API调用、爬取网页、操作API)执行->将结果反馈给模型进行下一步->直到任务完成 即:模型 → 工具 → 结果 → 模型 关于记忆,先用短期记忆,比如最近几条上下文消息。 如果需要跨会话记忆,可以从持久存储获取,比如向量数据库。

    13110编辑于 2026-03-11
  • 使用Spring AI调用AI模型

    简介Spring AI是Spring框架对人工智能和机器学习的支持模块,它提供了一套简单易用的API来集成各种AI服务和模型。 主要功能集成主流AI模型服务(如OpenAI、Azure、 Baidu千帆等)提供统一的API接口支持提示词工程内置向量存储功能支持文本嵌入和文本生成核心概念AI Client统一的客户端接口,用于调用 代码助手 代码解读复制代码spring.ai.openai.api-key=youkeyspring.ai.openai.base-url=https://api.deepseek.comspring.ai.openai.chat.options.model 对接阿里大模型Spring AI Alibaba 开源项目基于 Spring AI 构建,是阿里云通义系列模型及服务在 Java AI 应用开发领域的最佳实践,提供高层次的 AI API 抽象与云原生基础设施集成方案 ,帮助开发者快速构建 AI 应用。

    1.4K10编辑于 2025-03-27
  • 来自专栏数据猿

    5天6款AI模型,一场“蓄谋已久”的AI竞备赛

    5天6款AI模型,昆仑万维是在下一盘大棋。 大数据产业创新服务媒体 ——聚焦数据 · 改变商业 昆仑万维用一周的时间占满了科技头条。 但这场看似突如其来的密集发布,实际上早就埋下伏笔,也是昆仑万维在AI领域布局的“蓄谋已久”。也可以说是昆仑万维的长期AI投入,进入收获期。 5天发布6款模型 六大模型的发布都有哪些? 公司表示,Skywork Deep Research Agent自5月22日上线后,大幅重塑了大模型AI Office领域的角色,通过skywork.ai为用户产出了大量信息密度极高的优质文档、PPT 至此,昆仑万维用五天时间完成“视频-世界模型-多模态编辑-研究Agent-音乐”全栈布局。 “秀肌肉”背后,实则是“蓄谋已久” 5天连发6款大模型,外界看到的是高调技术“秀肌肉”。 技术周落幕,AI的“发令枪”才刚响起 技术周的镁光灯已经熄灭, 但AI的“发令枪”仿佛才刚刚响起。 如今,大模型技术进行密集迭代期,AI开始“卷应用”的窗口期到来。

    37810编辑于 2025-10-21
  • 来自专栏程序小小事

    OpenAI 的最新 AI 模型 GPT-5 现已在 GitHub Models 上提供!

    OpenAI 的最新 AI 模型 GPT-5 现已在 GitHub Models 上提供! GPT-5 是 OpenAI 最先进的模型,在推理、代码质量和用户体验方面进行了重大改进。 GPT-5 的以下模型变体可用:gpt-5:专为逻辑和多步骤任务而设计。GPT-5-mini:适用于成本敏感型应用的轻量级版本。gpt-5-nano:针对速度进行了优化,非常适合需要低延迟的应用程序。 gpt-5-chat:专为企业应用程序的高级、自然、多模式和上下文感知对话而设计。 选择模型后,可以尝试示例提示,完善您的想法,并在构建时迭代代码。 GitHub Copilot是普通人接触AI编程最简单、最轻松、最实惠的的方式,代码不再是鸿沟!除了GitHub Copilot,我们还提供有Cursor,Claude Code等高效AI编程工具!

    40210编辑于 2025-08-09
  • 来自专栏毛利学Python

    yolov5模型转换NCNN模型部署

    写作原因:最近看了下nihui大佬的ncnn,练习着将yolov5训练的模型转换成ncnn模型并部署,同时借鉴了网上优秀的博文,记录一下,如有不对的地方,请多多指教。 说明:pytorch模型转换成onnx模型,及onnx模型简化和转ncnn模型在引用的文章中都有详细的说明,可移步至引用文章中查看。 图1 其实yolov5 v1-v5版本在训练完后,使用onnx2ncnn.exe将简化后的onnx模型转换成ncnn模型时主要出现这个问题。 V6版本在输出上和前5个版本有一点不同,这里针对1-5版本。 下面说下修改的是什么,这样就可以知道自己的模型应该修改哪里了。

    3.1K20编辑于 2022-09-22
  • 来自专栏程序小小事

    OpenAI 的最新 AI 模型 GPT-5 现已在 GitHub Models 上提供!

    OpenAI 的最新 AI 模型 GPT-5 现已在 GitHub Models 上提供! GPT-5 是 OpenAI 最先进的模型,在推理、代码质量和用户体验方面进行了重大改进。 GPT-5 的以下模型变体可用: gpt-5:专为逻辑和多步骤任务而设计。 GPT-5-mini:适用于成本敏感型应用的轻量级版本。 选择模型后,可以尝试示例提示,完善您的想法,并在构建时迭代代码。 GitHub Copilot是普通人接触AI编程最简单、最轻松、最实惠的的方式,代码不再是鸿沟! 除了GitHub Copilot,我们还提供有Cursor,Claude Code等高效AI编程工具!

    46810编辑于 2025-08-11
  • 来自专栏量子位

    AI的大模型时代 ≠ 只有大模型AI时代

    从这个规律来看,大语言模型(简称LLM)出现后虽然霸占了所有与AI相关的关键词,吸引了所有人的注意力,但这并不代表“LLM之前无AI”。 所以,AI不是只有大模型AI的大模型时代也 ≠ 只有大模型AI时代。 成熟的AI,早就已经上岗了 或许你还不敢相信,现在哪怕小小的快递背后,都已经有AI技术在加持了。 而且也是专门针对英特尔硬件打造的优化框架,只需5行代码就可以完成原有框架的替换。 用户可以针对不同业务场景,来优化OpenVINO™️ 运行参数。 这便是英特尔在AI模型时代中的“加速之道”了。 还会带来怎样的变革? 纵观AI技术的发展之路,不难发现英特尔在其中履行着一条非常清晰的准则——用起来才是硬道理。 更多《英特尔平台上的行业AI实战与大模型优化》相关内容,可扫描下方海报中的二维码获取。点击原文链接,阅读英特尔《最“in”大模型》专栏的所有文章。 — 完 —

    64910编辑于 2023-09-27
  • 来自专栏云云众生s

    私有 AI 模型已死,私有 AI 模型万岁

    私有 AI 模型已死,私有 AI 模型万岁 翻译自 Proprietary AI Models Are Dead. Long Live Proprietary AI Models 。 因此,私有模型已死。 然后是谷歌 I/O 2023 。 Google Bard ,一个基于自己的专有数据集的生成式 AI 搜索引擎,受到好评如潮。引用最多的功能是它能够将实时数据合并到其模型中。 生成式 AI 成功的代价 事实证明,访问实时数据来构建模型是昂贵的。谷歌花费数十亿美元来构建基础设施,以实时索引网络以构建他们的生成模型,你可以打赌这将是私有的。 基础 AI 模型的未来 那么,这是否意味着每个生成式 AI 用例都需要一个基于私有实时数据构建的基础模型?否,但还有其他原因需要私有的基础模型: 私有的第一方数据集。 希望构建生成式 AI 的企业可能需要依赖大公司的基础模型,这些公司拥有支票簿来维护自己的实时数据基础设施和其他用例的开源基础模型。 企业所依赖的专有数据集也将越来越实时。

    35210编辑于 2024-03-27
  • 来自专栏云云众生s

    AI模型组合指南

    考虑一款旨在识别和分类野生动物照片的 AI 驱动的图像识别应用程序。您上传一张远足时拍摄的照片,几分钟后,该应用程序不仅识别出照片中的动物,还提供了有关其物种、栖息地和保护状态的详细信息。 这种分层方法提供了细致入微的分析,超出了单个 AI 模型的能力。 什么是模型组合? 从本质上讲,模型组合是一种机器学习策略,它结合了多个模型来解决一个复杂的难题,而单个模型无法轻松解决。 Boosting:顺序训练模型,其中每个模型都尝试纠正前一个模型所犯的错误。 Stacking:训练多个模型,然后使用一个更好的模型,该模型利用每个基础模型的优势来提高整体性能并结合它们的预测。 容器化:使用 容器部署 AI 模型可以帮助管理每个模型的依赖项和环境。容器编排工具(如 Kubernetes)可以帮助管理容器化模型的部署、扩展和网络。 但是,如上例所示,BentoML 和 BentoCloud 等平台可以通过允许开发人员高效地打包、部署和扩展多模型服务,帮助开发人员构建多个模型AI 应用程序。

    56710编辑于 2024-05-19
  • 来自专栏司钰秘籍

    AI模型学习

    AI模型学习的理论基础 数学基础: 线性代数:AI模型中大量使用向量和矩阵运算,如矩阵乘法、向量点积等,用于表示和操作数据。 模型压缩:采用压缩技术,如剪枝、量化等,减少模型的参数量和计算量,使其能够在资源有限的设备上运行。 5. 数据增强:通过数据增强技术,如翻转、旋转、缩放等,增加训练数据的多样性,提高模型的鲁棒性。 公众教育:提高公众对 AI 技术的理解和认识,促进公众参与和讨论。 4. 技术改进:不断研究和改进算法,减少偏见和风险。 5. 跨学科合作:促进不同领域的专家共同探讨和解决 AI 带来的问题。 分布式训练和边缘计算:利用分布式计算和边缘计算技术,加速模型训练和在边缘设备上的部署。 5. 与人类的协同合作:AI 与人类将更加紧密地合作,共同解决问题。 可解释性方法的研究:提高模型的可解释性,增加人们对模型决策的信任。 5. 对抗攻击和鲁棒性的研究:增强模型对恶意攻击的抵御能力。

    65610编辑于 2024-04-04
  • AI情绪预测模型

    模型设计概述 1.1 设计理念与目标 情绪预测模型的核心目标是通过分析个体的多维度生理信号、行为特征和主观体验数据,实现对当前情绪状态的智能识别与分类。 特征工程层是连接原始数据与预测模型的桥梁,负责将原始数据转换为模型可理解的特征向量。 预测模型层采用集成学习方法,综合多种机器学习算法的优势以提高预测准确率。模型将输出九种情绪类别的概率分布,并提供置信度评估。 4.2 模型优化与改进方向 当前的情绪预测模型主要基于知识驱动的方法,结合了图片中提供的情绪-特征映射关系。为了进一步提升模型的预测准确率和泛化能力,我们可以从以下几个方面进行优化。 未来的改进可以引入更多的解释性AI技术,如LIME(局部可解释模型-agnostic解释)和SHAP(SHapley Additive exPlanations),为用户提供详细的预测依据和置信度评估。

    21510编辑于 2026-01-20
  • 来自专栏小洁叫你mysql

    AI模型】训练Al大模型

    模型超越AI 目前所指的大模型,是“大规模深度学习模型”的简称,指具有大量参数和复杂结构的机器学习模型,可以处理大规模的数据和复杂的问题,多应用于自然语言处理、计算机视觉、语音识别等领域。 应用领域 首先来谈一谈大模型的·成就 大模型已经在许多应用领域取得了显著的成果,包括: 自然语言处理: import torch from transformers import T5Tokenizer , T5ForConditionalGeneration # 加载预训练模型和分词器 model = T5ForConditionalGeneration.from_pretrained('t5-base ') tokenizer = T5Tokenizer.from_pretrained('t5-base') # 输入文本 input_text = "Translate this text to French model = load_model('large_model.h5') # 进行模型压缩,例如剪枝操作 pruned_model = prune_model(model) # 保存压缩后的模型

    1.5K30编辑于 2023-10-10
领券