首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏韩曙亮的移动开发专栏

    AI模型】Meta Llama 3模型 ( Llama 3模型简介 | Ollama 软件下载安装 | Llama3 模型下载 | Llama 3模型 在线 离线 使用 )

    首先 , 安装 Ollama 软件 , 到 https://ollama.com/ 下载安装 ; 然后 , 运行 ollama run llama3 命令 , 即可开始使用 Llama3模型 ; 一 、Meta Llama 3模型安装 1、Llama 3模型简介 Llama 3模型 是 Meta 公司 发布的 大模型 , Meta 公司 就是 Facebook ; Llama 3模型 Llama3模型 ; 下载的模型放在了 C:\Users\用户名.ollama 目录中 , 在我的电脑上的路径是 C:\Users\octop.ollama ; 这个模型很大 , 有 4.7 G 安装完成后的效果 for help) 二、Meta Llama 3模型使用 1、Llama 3模型在线使用 在命令行中 , 可以直接进行对话 , 下面是对话内容 : D:\Llama>ollama run llama3 for help) 2、Llama 3模型离线使用 Llama 3模型 联网时 , 可以访问云端服务 , 可以生成更加丰富的文本 ; Llama 3模型 在 断网后也可以使用 , 下面是断开网络后

    1.7K12编辑于 2024-08-09
  • 第八章 AI模型质量-3

    8.4 AI模型的灰盒精准测试 本节我们将首先介绍下AI模型的可解释性,我们以计算机视觉领域为例,介绍一种可解释性的方案,即Grad-CAM热力图,最后我们将介绍如何利用AI模型的可解释性进行模型的灰盒精准测试 8.4.2 AI模型的可解释性 AI模型的可解释性是指我们能够理解和解释模型的决策过程和输出结果。这对于许多应用场景来说非常重要,尤其是在涉及关键决策和高风险领域,如医疗、金融和法律等。 AI模型对我们来说就像个黑盒子,缺少可解释性,我们不知道对一张图模型关注什么信息,也不知道图10 中的(1)为什么成功、图10中的(2)和(3)为什么失败。 图10 活体检测样本检测结果 所以对测试来说,AI模型的可解释性是一个非常重要的诉求,然而,AI模型的可解释性也面临着一些挑战: 模型复杂性:许多先进的AI模型,如深度学习模型,具有高度复杂的结构,这使得理解其决策过程变得非常困难 通过AI模型的热力图,我们能够了解到AI模型关注点在图像的哪些区域,比如:活体检测算法主要聚焦在人脸上,那么其他区域的扰动应该不会影响AI模型的结果输出。

    47410编辑于 2025-04-15
  • 来自专栏C++开发学习交流

    AI模型AI模型部署概述

    AI模型部署方法 在AI深度学习模型的训练中,一般会用Python语言实现,原因是其灵活、可读性强。但在AI模型实际部署中,主要会用到C++,原因在于其语言自身的高效性。 AI模型部署框架 模型部署常见的推理框架有:ONNX、NCNN、OpenVINO、 TensorRT、Mediapipe。 在部署方面,OpenVIVO的开发也是相对比较简单的,提供了C、C++和python3种语言编程接口。 3. AI模型部署平台 AI 模型部署是将训练好的 AI 模型应用到实际场景中的过程。 以下是一些常见的 AI 模型部署平台: 云端部署 云端部署是最流行的 AI 模型部署方式之一,通常使用云计算平台来托管模型和处理请求。

    1.8K10编辑于 2024-07-24
  • 来自专栏Java项目实战

    New Stability AI 最新的3个文生图模型

    好久没打开自己的邮箱了,本来要验证一下Meta AIAI视频能力,突然看到Stability AI的一封邮件,众所周知啊,上一次Stability AI火,还是因为要凉凉,因为偿还巨额债务和前 与联想合作,在其新的联想创作者专区中展示 Stability AI 的文本到图像模型。 往期精彩内容 AI打造小红书网红 Flux放大修脸工作流 40万播放黑神话亢金龙通关结算画面 win一键整合包 优势 最先进的架构 用于生成图像的最先进开放架构,具有 35 亿参数基础模型阶段和 66 此图像是使用 SD3 Large 生成的,提示词为:油画、一位坐在田野里看风筝在天空中飞舞的女士、传统媒体、油画颜料、数字化、高度详细、概念艺术、错综复杂、专业构图 产品渲染 Stability AI 此图像是使用 SD3 Large 生成的,提示词为:白色和青绿色运动鞋的专业 3D 渲染图、居中漂浮、悬停、浮动、高品质、逼真 模型版本对比 如何使用?

    35810编辑于 2024-10-08
  • 来自专栏AI_aidlux

    基于aidlux的ai模型边缘设备模型部署实战(3.图像分类)

    经过前两次的学习已经掌握了环境配置和基本图像处理功能应用,接下来我们便进入该课程的主要部分,深度学习模型部署实战课程,实现自己的分类模型部署实战。 图片 熟悉完相关函数调用后我们训练自己的分类数据集,为了便于演示,身边简单的3类水果分类数据集采集(西红柿,苹果,桃子),并将训练好的模型转换成onnx格式的模型。 不懂模型训练和转换的可以参考@同济子豪兄的视频连接进行学习模型训练和转换。 将转换好的onnx文件上传到Aldiux种并进行测试。 3模型部署并调用摄像头实时检测导入上传的onnx,修改文件路径,将调用摄像头分类检测代码,即可在手机端运行摄像头进行实时检测,手机上显示检测的结果和检测处理时间。 t=9.04、总结经过几次的学习已经掌握了相关的深度学习模型部署的相关步骤,当然我们可以进行更深一步的学习,包括图像检测,图像分割等等视觉任务的部署。

    57420编辑于 2023-08-07
  • 来自专栏ATYUN订阅号

    亚马逊的AutoGluon只需3行代码即可生成AI模型

    它需要特征工程,或者使用数据领域的知识来创建AI算法工作的特征,再加上大量的数据集预处理,以确保在训练过的模型中不会出现偏差。 通常,像超参数调优这样的任务是手动执行的,这要求科学家预测超参数,以表示在构建人工智能模型时所做的选择,将如何影响模型训练。 AutoGluon可以通过在默认范围内自动调优已知给定任务,执行良好的选项,从而生成最少三行代码的模型。 开发人员只需指定何时准备好训练好的模型,作为响应,AutoGluon就会利用可用的计算资源在分配的运行时中,找到最强的模型。 ? AutoGluon可以立即识别用于表格预测、图像和文本分类以及对象检测的模型,并且它提供了一个API,有经验的开发人员可以利用它来进一步提高模型的预测性能。

    74310发布于 2020-02-12
  • 来自专栏算法一只狗

    Grok3模型是「地表最强」的AI吗?

    首先看看具体的跑分情况,整体的Grok3模型在数学领域AIME、科学领域GPQA和代码测试上,都超越了其他模型。 其中,数学 (AIME'24)领域上: Grok-3(52分) 领先,明显优于其他模型。 GPT-4o(9分) 表现最差,远低于其他模型。 其他模型(Grok-3 mini, Gemini-2 Pro, DeepSeek-V3, Claude 3.5 Sonnet)分数在 36-40 之间,相差不大。 而且,从整体的Grok 3跑出的模型整体分数来看,是 首个超过 1400 分 的模型啊!果然,马斯克吹过的牛都会实现,自家的Grok3在这个分数榜单上确实是史上最强模型。 走的还是大力出奇迹的大模型训练路子。 而对比起GPT-4o和DeepSeek-V3用的GPU数量,Grok3的训练简直是土豪级别的用法的。

    41010编辑于 2025-03-18
  • 来自专栏星流全栈

    AI通过照片创建3D模型3D建模师也要失业?

    3D建模领域未来也将被彻底颠覆! ? 各位同学大家好,又到了我们的「两分钟AI小课堂」。 今天我们来讲一下AI,尤其是DNN在3D建模中的应用。 通过照片和图像来还原3D模型是一个大胆的想法,之前也有许多人做过相关研究。 MIT的研究者们采用了3D-GAN网络来通过图片生成3D模型。 这种技术可以运用在多个领域,与3D打印结合,与数字建模结合,与自动驾驶技术结合。 ? 不同的3D模型间可以进行插值,比如从汽车变为快艇;也可以进行代数计算,从有扶手的椅子变为无扶手的椅子。 我们的模型的好处有三: 首先,使用对抗标准,而不是传统的启发式标准,使生成器能够隐含地捕获对象结构并合成高质量的3D对象; 第二,生成器建立从低维概率空间到3D对象空间的映射,使得我们可以在没有参考图像或 CAD模型的情况下对样本进行采样,并探索3D对象流形; 第三,对抗鉴别器提供了一个强大的3D形状描述符,它在没有监督的情况下学习,在3D对象识别中有广泛的应用。

    3.9K80发布于 2018-06-01
  • 来自专栏猫头虎博客专区

    Claude3的崛起:重新定义AI模型竞争格局

    Claude3的崛起:重新定义AI模型竞争格局 近日,AI领域再次掀起波澜,Claude公司毫无预警地在深夜发布了其最新系列模型——Claude3,直接将竞争的矛头指向了OpenAI的GPT-4。 这一次,Claude不仅仅是更新了模型,更是在AI技术的多个方面展现了令人瞩目的进步。 Claude3系列模型概览 Claude3系列包括三个模型:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,它们分别针对不同的应用场景和性能需求进行了优化。 特别值得一提的是,即便是免费用户,也能够享受到Claude 3 Sonnet模型的服务,这无疑大大提高了AI技术的普及度。 定价政策的新变化 在新一代AI技术面前,用户最为关心的莫过于其定价政策。 这一能力的提升为AI技术在更广泛的应用场景中的应用提供了可能。 长篇幅处理能力的提升 Claude3全系模型能处理超过100万个tokens的输入,这对于需要处理大量数据的场景来说,是一个巨大的进步。

    48910编辑于 2024-04-07
  • 来自专栏开源心路

    AI模型实战

    背景 通过示例梳理AI模型训练流程,示例比较简单,方便演示。 流程 机器学习实战步骤 定义问题 数据收集和预处理 选择算法并建立模型 训练模型 模型评估和优化 示例 定义问题 根据公开数据集预测加州房价分布 数据收集 import pandas as pd 7650.0 1901.0 2 -114.56 33.69 17.0 720.0 174.0 3 1.8200 80100.0 2 333.0 117.0 1.6509 85700.0 3 #导入线性回归算法模型 model = LinearRegression() #使用线性回归算法 model.fit(X_train, y_train) #用训练集数据,训练机器,拟合函数,确定参数

    33710编辑于 2023-06-30
  • 来自专栏Web大前端

    深度剖析DeepSeek-V3模型AI 领域的“国货之光”

    DeepSeek-V3 模型登场,AI 江湖风云再起 当今时代,AI 领域可谓是风起云涌,各大模型你方唱罢我登场,竞争进入白热化阶段。 成本优势:以小博大的 “性价比之王” 在成本控制方面,DeepSeek-V3 模型更是展现出了令人惊叹的 “魔力”,堪称 AI 界的 “性价比之王”。 以往,高昂的模型使用费用让许多小型团队望而却步,而 DeepSeek-V3 模型的出现,打破了这一成本壁垒,让 AI 技术真正走向普惠,为更多创新应用的诞生提供了肥沃的土壤。 结语:拥抱变革,展望 AI 新征程 DeepSeek-V3 模型的出现,无疑是 AI 发展史上的一座重要里程碑。 随着 DeepSeek-V3模型的持续进化,我们有理由相信,AI 将在更多未知领域开疆拓土,解决诸多棘手难题,为人类创造更加美好的生活。

    2.3K10编辑于 2024-12-30
  • 来自专栏贾志刚-OpenCV学堂

    刷爆榜单 | DeepSeek-AI发布3B OCR模型

    DeepSeek-AI 发布了 3B DeepSeek-OCR,这是一个端到端的 OCR 和文档解析视觉语言模型 (VLM) 系统,可将长文本压缩成一小组视觉标记,然后使用语言模型解码这些标记。 架构 DeepSeek-OCR-3B是典型的VLM模型、它有两个组件,一个名为 DeepEncoder 的视觉编码器和一个名为 DeepSeek3B-MoE-A570M 的 Mixed of Experts 解码器是一个 3B 参数的 MoE 模型(名为 DeepSeek3B-MoE-A570M),每个 token 的活动参数约为 570M。 3. 系统结构是将页面压缩为视觉令牌的 DeepEncoder 和具有约 570M 活动参数的 DeepSeek3B MoE 解码器,正如研究团队在技术报告中所描述的那样。 参考文档: https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf 性能对比 在 OmniDocBench

    11810编辑于 2026-04-02
  • 来自专栏AI科技大本营的专栏

    苹果发布 AI 生成模型 GAUDI,文字生成 3D 场景

    整理 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 前有DALL.E文本生成图像,现有将文字变成 3D场景。 近日,苹果 AI 团队发布最新 AI 模型 GAUDI,它是基于 3D 场景的神经架构 NeRFs,可以根据文字生成 3D 室内场景。 目前为止,NeRFs 主要用做 3D 模型3D 场景的一种神经存储介质,然后可以从不同的相机视角进行渲染。 苹果 AI 团队发布的 GAUDI 是一种能够生成沉浸式 3D 场景的神经架构,可以根据文字提示创建 3D 场景。 例如,输入“穿过走廊”或“上楼梯”,就可以看到执行这一动作的 3D 场景视频。 对于这个问题,GAUDI 模型的解决方案是:相机姿态解码器对可能的相机位置进行预测,并确保输出是 3D 场景架构的有效位置。

    95820编辑于 2022-12-09
  • 来自专栏服务端技术杂谈

    AI Agent:模型->工具->结果->模型

    Reddit上有人说,AI Agent就是:模型->工具->结果->模型。 从程序员角度来说,就是拼接参数json,调用LLM,处理返回值json。 不需要用什么复杂的框架,基本上只需要串联: 用户输入目标Prompt->将提示词传递给LLM->模型决定下一步->需要工具(API调用、爬取网页、操作API)执行->将结果反馈给模型进行下一步->直到任务完成 即:模型 → 工具 → 结果 → 模型 关于记忆,先用短期记忆,比如最近几条上下文消息。 如果需要跨会话记忆,可以从持久存储获取,比如向量数据库。

    13110编辑于 2026-03-11
  • 使用Spring AI调用AI模型

    简介Spring AI是Spring框架对人工智能和机器学习的支持模块,它提供了一套简单易用的API来集成各种AI服务和模型。 主要功能集成主流AI模型服务(如OpenAI、Azure、 Baidu千帆等)提供统一的API接口支持提示词工程内置向量存储功能支持文本嵌入和文本生成核心概念AI Client统一的客户端接口,用于调用 代码助手 代码解读复制代码spring.ai.openai.api-key=youkeyspring.ai.openai.base-url=https://api.deepseek.comspring.ai.openai.chat.options.model 对接阿里大模型Spring AI Alibaba 开源项目基于 Spring AI 构建,是阿里云通义系列模型及服务在 Java AI 应用开发领域的最佳实践,提供高层次的 AI API 抽象与云原生基础设施集成方案 ,帮助开发者快速构建 AI 应用。

    1.4K10编辑于 2025-03-27
  • 来自专栏机器之心

    Stability AI开源3B代码生成模型:可补全,还能Debug

    本周一,Stability AI 开源了小体量预训练模型 Stable Code Instruct 3B。 Stable Code Instruct 3B 是一个基于 Stable Code 3B 的指令调整编码语言模型(Code LM)。 Stability AI 宣称,该模型3B 规模上提供了 SOTA 性能,并且优于 CodeLlama 7B Instruct 等更大规模的模型,甚至在软件工程相关任务中,性能与 StarChat 值得一提的是,Stable Code Instruct 3B 现在可以通过 Stability AI 会员资格用于商业目的。 参考链接: https://stability.ai/news/introducing-stable-code-instruct-3b https://twitter.com/StabilityAI/status

    44410编辑于 2024-03-27
  • 来自专栏东风微鸣技术博客

    在Windows电脑上快速运行AI大语言模型-Llama3

    发布了新一代语言模型Llama 3,包括8B和70B参数的预训练和指令微调模型。 •LlamaEdge 支持所有基于 llama2-3 框架的大语言模型 (LLM),模型文件必须采用 GGUF 格式。 •目前,构建 AI 应用通常需要使用 API 服务器、大型语言模型、编排框架等组件,整个过程更偏向于研究,难以实现紧密集成和高安全性。 使用 LlamaEdge + WasmEdge 运行本地 AI 大语言模型 - Llama3 ️References •有人说开源模型会越来越落后,来试试 Llama 3 吧 | LlamaEdge | 总结 本文介绍了在 Windows 上快速运行本地 AI 大语言模型 - Llama3 的实战步骤, 通过利用: WSL + WasmEdge + LlamaEdge 快速实现. 易上手, 门槛低.

    3K20编辑于 2024-04-23
  • Python + AI 时代来了!这 3 个大模型应用开发方向,薪资翻倍

    从企业级知识库到智能客服,从自主决策的 AI Agent 到垂直领域 SaaS 产品,基于大模型的应用开发正在重构软件开发的价值体系——懂 Python + 会落地大模型应用的开发者,薪资普遍比传统 Python 如果你已经掌握 Python 基础(函数、API 调用),接下来这 3 个高需求、高薪资的开发方向,就是你切入 AI 赛道的最佳路径。 三、AI 原生 SaaS 工具开发:打造可商业化的智能产品 应用场景与市场需求 AI 原生 SaaS 是指从底层设计就融入大模型能力的 SaaS 工具,而非简单的“AI 插件”。 行动号召 2025 年是 Python + AI 应用开发的黄金窗口期,相比于研究大模型底层原理,落地大模型应用的能力更能直接转化为薪资和收益。 AI 时代不会淘汰程序员,但会淘汰不会用 AI 的程序员。用 Python 抓住大模型的红利,你的薪资翻倍,从今天开始就不是空谈。

    71211编辑于 2026-01-20
  • 来自专栏开源技术小栈

    3分钟快速构建大语言模型AI知识库

    FastGPT FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排,从而实现复杂的问答场景! WhisperModel": { "model": "whisper-1", "name": "Whisper1", "price": 0 } } 3、 尝试进行测试问答 链接训练数据 https://mp.weixin.qq.com/s/1GD8eKrxJWXdgS3OKR4VHQ https://mp.weixin.qq.com/s/BFdfDXHavZ_jZwVaFq2duQ https://mp.weixin.qq.com/s/mNhMCzUtLUKrIzqSVa-qZA https://mp.weixin.qq.com/s/n4n-0UCWJW9u2N1ca3HisQ 可以通过AI服务训练自有数据,形成AI知识库,然后创建不同的机器人针对用户问题提供精准回答。并且可以通过API接口很方便整合到自己的产品服务中。

    2.1K11编辑于 2023-11-27
  • Gemma 3 270M:专为超高效AI设计的紧凑模型

    介绍 Gemma 3 270M:用于超高效AI的紧凑模型过去几个月对于Gemma系列开源模型来说是一段激动人心的时期。 先是推出了Gemma 3和Gemma 3 QAT,为单个云和桌面加速器提供了最先进的性能。随后,又宣布了Gemma 3n的全面发布,这是一种移动优先的架构,将强大的实时多模态AI直接带到了边缘设备。 正如IFEval基准测试(测试模型遵循可验证指令的能力)所显示的,它在其尺寸级别上建立了新的性能标准,使得复杂的AI功能在设备端和研究应用中更加易于实现。 构建AI时也应遵循同样的原则。Gemma 3 270M体现了这种“合适的工具做合适的工作”的理念。它是一个高质量的基础模型,开箱即用地遵循指令,其真正的力量通过微调来解锁。 通过Gemma 3 270M,我们赋能开发者构建更智能、更快速、更高效的AI解决方案。我们迫不及待想看到您创建的专用模型。FINISHED

    21510编辑于 2026-02-04
领券