首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI科技大本营的专栏

    苹果发布 AI 生成模型 GAUDI,文字生成 3D 场景

    整理 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 前有DALL.E文本生成图像,现有将文字变成 3D场景。 近日,苹果 AI 团队发布最新 AI 模型 GAUDI,它是基于 3D 场景的神经架构 NeRFs,可以根据文字生成 3D 室内场景。 2021 年末时,谷歌通过 Dream Fields 首次展示了 3D AI 生成系统,将 NeRF 生成 3D 视图的能力与 OpenAI 的 CLIP 评估图像内容的能力相结合。 Apple GAUDI 是 3D 内饰专家 虽然谷歌致力于使用 Dream Fields 生成单个对象,但将生成 AI 扩展到完全不受约束的 3D 场景仍是一个尚未解决的问题。 虽然现在 GAUDI 生成3D 场景视频质量还不是很高,但这也说明了 AI 在图像和视频技术这生成的另一种可能。

    95820编辑于 2022-12-09
  • 来自专栏心源易码

    Amazon Bedrock + Llama3 生成AI实践

    这些改进共同作用,使得Llama 3在推理、代码生成和指令跟踪等关键能力上都有了显著提高,极大地增强了模型的可操控性。 这样的训练规模,使得Llama 3成为了当今性能最好的生成人工智能模型之一。将视角转向人工智能基准测试,Llama 3的表现同样令人瞩目。 Llama 3 70B 适合内容创作、对话式 AI、语言理解、研发和企业应用。该模型擅长文本摘要和准确性、文本分类和细微差别、情感分析和细微推理、语言建模、对话系统、代码生成和遵循指令。 (FM),以及通过安全性、隐私性和负责任的 AI 构建生成式人工智能应用程序所需的一系列广泛功能。 响应长度是生成文本的最大长度限制,超过这个长度的文本将被截断或停止生成

    47310编辑于 2024-05-11
  • 来自专栏AI科技大本营的专栏

    玩转3D全息图像!AI即刻生成

    计算机生成的全息(CGH)通过对衍射和干涉的数值模拟实现了高空间角度的3D投影。 长期以来,研究人员一直在研究制作全息图的技术,但是,现有的基于物理的方法无法生成具有按像素聚焦控制和精确遮挡的全息图。 计算繁琐的菲涅耳衍射仿真在图像质量和运行时间两者之间有很大的矛盾,利用传统技术生成全息图需要一台超级计算机进行物理模拟,非常耗费资源,并且产生的三维效果不如真实感。 麻省理工学院的研究人员使用深度学习来加速计算机生成的全息图,从而实现实时全息图的生成。研究人员设计了一种卷积神经网络,使用可训练的张量链大致模拟人类如何处理视觉信息。 首先,用于渲染RGB-D图像的3D场景具有很高的复杂度,并且在颜色,几何形状,阴影,纹理和遮挡方面存在很大的差异,以帮助CNN推广到计算机渲染和实际捕获的RGB-D测试中 输入,通过自定义随机场景生成器实现的 同时,三维全息术还可以促进3D打印技术的发展,该技术比传统的逐层3D打印更快、更精确,因为该项技术允许同时投影整个3D图形。

    1.8K20发布于 2021-03-25
  • 来自专栏ATYUN订阅号

    亚马逊的AutoGluon只需3行代码即可生成AI模型

    它需要特征工程,或者使用数据领域的知识来创建AI算法工作的特征,再加上大量的数据集预处理,以确保在训练过的模型中不会出现偏差。 AutoGluon可以通过在默认范围内自动调优已知给定任务,执行良好的选项,从而生成最少三行代码的模型。

    74310发布于 2020-02-12
  • 来自专栏芯智讯

    高盛:生成AI将影响3亿人工作!

    3月28日消息,随著基于生成AI的智能聊天机器人 ChatGPT 的火爆,越来越多的企业开始借助生成AI技术来提升办公效率。 据金融时报报导,投行高盛发布报告指出,生成AI可能使发达经济体的3亿个工作机会受到影响。 然而,AI带来的自动化技术也可能严重破坏劳动力市场需求,可能影响近3亿个全职工作机会,从律师到行政人员都有可能“被AI取代”。报告也指出,欧美近三分之二的工作可能在某种程度上受到AI自动化的影响。 然而,另外约7%的人所从事的至少一半工作内容可被生成AI取代的职业,这批人最可能面临“被AI取代”的困境。 ChatGPT开发商OpenAI先前也发表报告指出,美国80%劳工可运用生成AI技术处理手上至少10%的工作。

    32630编辑于 2023-04-11
  • AI生成隐藏3D图像的局限性分析

    隐藏3D图像的AI生成实验你是否见过那些隐藏着3D图像的自体立体图?就像1990年代的Magic Eye图片,看似嘈杂的重复图案,直到你以特定方式调节视觉焦距才能看到立体效果。 技术实现机制剖析当要求"生成独角兽魔法眼3D立体图像"时,ChatGPT传递给DALL-E3(实际负责图像生成的模型)的描述极其详细:需要包含复杂图案和多样化色彩以确保3D效果突出背景应包含神秘元素以增强深度幻觉独角兽的角和鬃毛应在图案中清晰可辨但 在自主生成场景中,它本质上仍是文本生成器。这些被宣传为"全能AI"的模型,实际更像装满应用的手机:文本生成应用可在特定情况下启动图像生成应用,但它们并非真正意义上的统一程序。 在生成ASCII文字艺术并自行读取时:在新会话中向其发送自生成的ASCII文字时,它识别为"ERROR"对自身创作的ASCII艺术品的识别和评级同样糟糕技术本质揭示生成ASCII艺术和3D图像并非ChatGPT 最后尝试让ChatGPT生成《小王子》风格的隐藏绵羊图像,结果基本失败。这再次证明了当前AI在多模态任务协同处理上的技术局限性。

    26610编辑于 2025-09-07
  • 来自专栏机器之心

    3D AI生成出新玩法了:无需数小时,只要45秒,单张图片即可生成 3D模型

    机器之心专栏 机器之心编辑部 45 秒单张图片变 3D,无需大量 3D 数据和逐物体优化。 3D AI 生成最近发展得如火如荼,不少最新工作都能够从一句话 / 一张图生成高质量的三维模型。 这种方式使得现有的 3D AI 生成方法都非常耗时,譬如 ProlificDreamer 的作者就曾在知乎上表示方法目前的主要局限之一便是生成时间太慢了! 方法 由于 3D 数据的稀缺性,学术界最近的绝大多数 3D AI 生成工作都通过利用 2D 扩散生成模型来指导 3D 表示(如 NeRF)的优化,从而实现 3D 内容生成。 与现有 3D AI 生成方法的比较 研究者表示,得益于 “2D 多视角预测 + 3D 可泛化重建” 的技术路线,One-2-3-45 与现有的 3D AI 生成方法相比,除了推断时间显著降低外,还在输入的多样性 结语 One-2-3-45 提出了 “2D 多视角预测 + 3D 可泛化重建” 这样一项新颖的 3D AI 生成玩法,并在许多方面都展示出了其优越性。

    4.2K30编辑于 2023-08-07
  • 来自专栏ATYUN订阅号

    利用AI 生成商标

    最新的尝试是生成一个对抗网络(GAN)——由样本生成器和鉴别器组成,它们可以区分生成的样本和真实世界的样本。 然后他们使用谷歌的云视觉服务生成4到8个描述标识内容的单词标签,并使用预先训练的人工智能模型对这些标签进行矢量化,为每个示例创建空间表示。之后再对这些空间表征进行聚类,以识别具有相似视觉特征的特征。

    2.9K20发布于 2019-10-08
  • 来自专栏开源心路

    AI生成视频-Pika

    背景介绍 Pika 是一个使用 AI 生成和编辑视频的平台。它致力于通过 AI 技术使视频制作变得简单和无障碍。 Pika 1.0 是 Pika 的一个重大产品升级,包含了一个新的 AI 模型,可以在各种风格下生成和编辑视频,如 3D 动画,动漫,卡通和电影风格。 现在我们需要告诉 AI 实际上我们想要生成什么样的片段。 对于第三次生成,我们将使用 “-camera rotate clockwise” 选项。 注意:以上步骤中的每一个生成命令都应该以回车键结束,这样 PIKA 才会开始生成你的视频片段。 我们很高兴推出 Pika 1.0,这是一次重大的产品升级,包括一个新的 AI 模型,它能够以 3D 动画、动漫、卡通和电影等各种样式生成和编辑视频,以及一个新的 Web 体验,使其更容易使用。

    1.9K10编辑于 2023-12-06
  • 来自专栏王的机器

    生成AI 简介

    这个例子展示了生成建模背后的基本概念,虽然现实中用生成模型要复杂很多,但其基本框架是相同。 3. 每个特征也有不同数目的特征值: 3 种配件类型 (accessories type): Blank, Round, Sunglasses 8 种服装颜色 (clothing color): Black ) 没有联系,用数学表达式表示就是: 有了这个假设,我们可以计算出 朴素贝叶斯模型将原始问题“对每个特征组合做概率估计”简化成对“每个特征做概率估计”,原来我们需要用 4031 (3 * 8 * 4 * 6 * 7) 个参数,现在只需要 23 (3 + 8 + 4 + 6 + 7) 个参数,每个参数的表达式为: 其中 N 是观测数据的个数即 50,nkl 是第 k 个特征取其下第 相信你不会说你图像中像素 1 的颜色是黑,像素 2 的颜色是淡黑,像素 3 的颜色是灰等等。

    68330编辑于 2023-09-02
  • 来自专栏自学气象人

    生成AI 简介

    这个例子展示了生成建模背后的基本概念,虽然现实中用生成模型要复杂很多,但其基本框架是相同。 3. 每个特征也有不同数目的特征值: 3 种配件类型 (accessories type): Blank, Round, Sunglasses 8 种服装颜色 (clothing color): Black ) 没有联系,用数学表达式表示就是: 有了这个假设,我们可以计算出 朴素贝叶斯模型将原始问题“对每个特征组合做概率估计”简化成对“每个特征做概率估计”,原来我们需要用 4031 (3 * 8 * 4 * 6 * 7) 个参数,现在只需要 23 (3 + 8 + 4 + 6 + 7) 个参数,每个参数的表达式为: 其中 N 是观测数据的个数即 50,nkl 是第 k 个特征取其下第 相信你不会说你图像中像素 1 的颜色是黑,像素 2 的颜色是淡黑,像素 3 的颜色是灰等等。

    67310编辑于 2023-09-05
  • 来自专栏机器之心

    Stability AI开源3B代码生成模型:可补全,还能Debug

    机器之心报道 机器之心编辑部 Stable Diffusion 3 还没全面开放,这家公司的代码生成模型先来了。 本周一,Stability AI 开源了小体量预训练模型 Stable Code Instruct 3B。 给出自然语言 prompt,该模型可以处理各种任务,例如代码生成、数学和其他软件工程相关的任务。 Stable Code Instruct 3B 不仅精通代码生成,还精通 FIM(Fill in the Middle)任务、数据库查询、代码翻译、解释和创建。 值得一提的是,Stable Code Instruct 3B 现在可以通过 Stability AI 会员资格用于商业目的。

    44310编辑于 2024-03-27
  • 来自专栏慕枫技术笔记

    深入理解生成AI技术原理:初识生成AI

    真正的大师永远怀着一颗学徒的心 如果将人工智能按照用途进行简单分类的话,人工智能可以划分为决策式AI以及生成AI两类。 而以ChatGPT为代表的生成AI通过对大量数据的联合概率进行学习,对已有的数据和知识进行归纳总结,同时结合深度学习技术,自动生成新的内容,而新生成的内容可以是文字、图片甚至是视频等多模态内容。 深度学习 深度学习是生成AI背后比较核心的实现技术,它是机器学习的重要优化手段,而机器学习又是人工智能领域重要的落地实现措施。 总结 本文主要对生成AI进行了初步阐述,同时针对生成AI最核心的两个技术点分别进行了初步说明,后面的专栏文章中将继续以深度学习以及大模型核心技术点作为切入点来深入分析生成AI背后的技术原理。 希望通过系列文章的说明,让大家对于类似ChatGPT这样的生成AI有一个更加深刻的理解。 如何优雅的消除系统重复代码 大厂面试官眼中的好简历到底什么样?

    2.3K30编辑于 2023-08-10
  • 来自专栏DevOps

    AI生成AI & Gemmi模型介绍

    AI 人工智能 (AI) 被认为是机器(尤其是计算机系统)对人类智能过程的模拟。这些过程包括学习(获取信息和使用信息的规则)、推理(使用规则得出近似或明确的结论)和自我纠正。 生成AI 生成式人工智能最近变得非常流行,它被大众用来生成不同类型的内容,包括文本、图像、视频等。 生成AI 是人工智能 (AI) 技术的一个子集,专注于根据输入数据或从现有数据中学习的模式生成新的原创内容。 与专为分类或预测等特定任务而设计的传统 AI 模型不同,生成AI 模型能够创建全新的数据样本,这些样本类似于它们所接触的训练数据。它使用生成模型,这些模型根据现有数据的学习概率分布生成新内容。 在这里,我们开发了用于不同领域的不同 AI 工具列表。 参考:What is Artificial Intelliegence? - DEV Community

    92910编辑于 2024-05-06
  • 来自专栏LLM

    AI Compass前沿速览:Nano Banana Pro、Gemini 3 、 HunyuanVideo 1.5 、Meta SAM 3D生成

    AICompass前沿速览:NanoBananaPro、Gemini3、HunyuanVideo1.5、MetaSAM3D生成AI-Compass致力于构建最全面、最实用、最前沿的AI技术学习和实践生态 1.每周大新闻NanoBananaProNanoBananaPro是一款由谷歌推出的新一代图像生成与编辑模型,它结合了谷歌的Gemini3ProImage技术,旨在提供高质量、高分辨率的AI图像生成和编辑服务 技术原理NanoBananaPro的核心技术基于GoogleGemini3ProImage,这是一款先进的AI图像生成技术,能够实现对图像的精细化控制、高保真输出及复杂场景下的角色保持。 生成Switch版本对比Gemini3–谷歌Gemini3是GoogleDeepMind推出的一系列新一代多模态理解与推理AI模型。 开源的3D生成模型SAM3D是MetaAI推出的先进3D重建模型套件,旨在将2D图像转化为精确的3D重建。

    38210编辑于 2025-11-22
  • 来自专栏DrugScience

    DOCK-3-生成Spheres

    生成Spheres 官方教程链接: http://dock.compbio.ucsf.edu/DOCK_6/tutorials/sphere_generation/generating_spheres.htm 步骤 接上文,已经完成了蛋白受体以及配体的准备,加氢加电荷 现在开始准备生成Spheres 生成Sphgen是DOCK的必须 Sphgen生成多组重叠的球体,以描述分子或分子表面的形状。 生成Sphgen (1)使用chimera的工具生成dms File -> Open -> rec-1htp-dock-prep.mol2. -> Show Tools -> Structure Editing -> Write DMS 直接命名保存 然后使用Chimera直接打开 绿色的点状物质环绕cartoon结构周围便是dms (2)生成 选择距配体的每个原子10.0埃以内的所有球体 使用指令: sphere_selector rec.sph lig_charged.mol2 10.0 输出文件为:selected_spheres.sph 生成一个文件

    83910发布于 2021-02-04
  • 来自专栏喵喵侠的社区活动征文

    3 分钟教你用腾讯元宝AI 生成网站 App 图标

    这个提示词书写其实很简单,包含了下面两要素:告诉 AI 你要做什么(生成图标);做的这件事有什么要求(主体突出、背景色调)其实做好这两点,你的提示词就到位了。 AI 画图我这里用的是目前国内优秀的AI 工具——腾讯元宝。官网如下:腾讯元宝 - 轻松工作 多点生活然后我把这个提示词交给了元宝进行回车对话,紧接着它就帮我快速生成了 4 个图标。 如果你看到了满意的图标,你可以点击选择满意的放大,进行AI编辑。可以看到里面有很多 AI 编辑工具,我最常用的去水印,毕竟是要用在自己的项目里,水印看起来不太美观。 生成图标看到这里你或许会好奇,刚刚图标不是生成好了么,为什么还要再生成图标?这里的生成图标,指的生成适用于网站或者 App 的各种尺寸的图标。 总结生成一个 App 图标总结就两步:AI生成图标生成各平台尺寸图标相信看完了本文,你立马就学会了如何制作网站或应用图标。其他的 AI 绘图工具,也是类似的方法,希望你能够活学活用。

    4.5K40编辑于 2025-03-11
  • 来自专栏AI科技大本营的专栏

    AI做不了“真”3D图像?试试Google的新生成模型

    编译 | 若名 出品 | AI科技大本营 用 AI 生成逼真三维物体模型并不像人们以为的那么困难。 “现代深层生成模型学会了合成逼真的图像,”研究人员写道,“但大多数计算模型只专注于生成 2D 图像,而忽略了 3D 世界的美好......这种视角不可避免地限制了它们在许多领域的实际应用,例如合成数据生成 “我们的主要想法是将图像生成过程分解为形状、视点和纹理三种因素,”Google 团队写道,“这种分离式 3D 表示使我们能够在对抗学习框架下从 3D 和 2D 视觉数据集合中学习模型。 9 月, Nvidia 的研究人员开发了一种 AI 模型,可以生成脑癌的合成扫描图像,8 月,卡内基梅隆大学的一个团队 演示了 AI 可以将人们已存的动作和面部表情转换成另一张照片或视频中的目标对象。 原文链接: https://venturebeat.com/2018/12/04/google-ai-generates-images-of-3d-models-with-realistic-lighting-and-reflections

    95220发布于 2018-12-24
  • 来自专栏开源心路

    AI生成中Transformer模型

    图像处理:虽然最初是为NLP设计的,但Transformer也已被适配用于图像分类和生成任务。 生物信息学:用于蛋白质结构预测等复杂任务。 视频处理:用于视频理解和视频生成任务。 注意力机制允许解码器在生成每个输出元素时“关注”输入序列中的不同部分,从而有效地解决信息压缩的问题。 这样,解码器可以直接访问整个输入序列,从而更准确地生成输出。 ,避免参照还未生成的词。 ).transpose(1,2) # 得到注意力分数 attention = torch.matmul(query, key.transpose(2,3) self.head_dim).transpose(1,2) # 得到注意力得分 attention = torch.matmul(query, key.transpose(2,3)

    1.2K11编辑于 2023-12-20
  • 来自专栏AI工具大盘点

    AI Logo 生成技术解析

    AI 技术蓬勃发展的当下,其应用已渗透至品牌设计领域,AI Logo 生成这一创新应用应运而生。 一、AI Logo 生成技术解析(一)算法基础AI Logo 生成工具主要依赖深度学习中的生成对抗网络(GAN)和变分自编码器(VAE)等技术。以 GAN 为例,它由生成器和判别器两部分组成。 3、Sologo AI技术特点 :具备快速生成 Logo 的能力,输入品牌名称、图像、创意等信息后,利用其智能设计引擎,能够迅速呈现出多种 Logo 选项。 其生成效率高,1 分钟内就能生成多套原创 Logo 方案,3 分钟内提供 100 + 原创 Logo 方案,这主要依靠其高效的并行计算和智能设计优化技术。 三、AI Logo 生成的优势与特点(一)高效快速AI Logo 生成工具能够在极短的时间内(最短不到 60 秒)生成一批 Logo 方案。

    57410编辑于 2025-07-15
领券