首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI科技评论

    太魔幻了!DALL·E 2 居然能用自创的语言来生成图像,AI模型的可解释性再一次暴露短板

    万一DALL·E-2是在向人类发出什么了不得的信号呢?这门语言快学起来! 作者|李梅、刘冰一 编辑|陈彩娴 DALL·E 和 DALL·E-2从文本生成图像的魔力,想必大家都已经见识过了。 不过,DALL·E-2 的一个众所周知的局限性是它在生成带文本的图像时很吃力。 在DALL·E-2所生成的带有文本的图像中,DALL·E-2显然在说一种我们人类看不懂的语言。其实这一点在最初的DALL·E-2论文以及Marcus等人对该模型的初步评估中就已经发现了。 1 DALL·E-2 的秘密语言 Daras 和 Dimakis 采用了一种简单的方法来破解DALL·E-2的词汇库。 DALL·E-2:所以这张图什么意思,不用我说了吧。 好玩真好玩,我已经迫不及待想要学会DALL·E-2的这门语言了! 再看一个例子。

    1.3K10编辑于 2022-06-02
  • 来自专栏DeepHub IMBA

    DALL·E-2是如何工作的以及部署自己的DALL·E模型

    DALL·E-2可以通过自然语言的描述创建现实的图像。Openai发布了dall·e-2的Beta版。在本文中,我们将仔细研究DALL·E-2的原始研究论文,并了解其确切的工作方式。 DALL·E-2论文要点 DALL·E-2基于以前提出的unCLIP模型,而unCLIP模型本质上是对GLIDE模型[4]的增强版,通过在文本到图像生成流程中添加基于预训练的CLIP模型的图像嵌入。 总结 这篇文章介绍DALL·E-2论文的一些要点,并且演示了如何使用Meadowrun来部署他的一个开源版本的实现,如果你有兴趣,可以按照我们提供的流程搭建一个属于自己的图像生成服务。

    3.7K20编辑于 2022-11-11
  • 来自专栏灰灰的数学与机械世界

    大学生数学竞赛非数专题二(8)

    解:构造函数 f(x)=e^x-x^e(x\geq e) ,则 f^{'}(x)=e^x-ex^{e-1} , f^{''}(x)=e^x-e(e-1)x^{e-2} , f^{'''}(x)=e^x-e (e-1)(e-2)x^{e-3} 知 e < 3 ,所以 x^{e-3} 单调递减, -e(e-1)(e-2)x^{e-3} 单调递增,而 e^x 也是单调递增,所以 f^{'''}(x) 在 x\geq e 时单调增, \begin{align*}f^{'''}(x)\geq f^{'''}(e)&=e^x-e(e-1)(e-2)e^{e-3}\\&=e^{e-2}(e^2-e^2+3e-2)\\&= e^{e-2}(3e-2) >0\end{align*} 所以 f^{''}(x) 单调递增, x\geq e 时, f^{''}(x)\geq f^{''}(e)=e^e-e(e-1)e^{e-2}

    32220编辑于 2022-11-23
  • 来自专栏医学和生信笔记

    R语言重复测量数据的多重比较

    1.77 4 1.52e-1 3.04e-1 ns ## 3 A hp t0 t3 5 5 -3.64 4 2.2 e- 2 6.6 e-2 ns ## 4 A hp t0 t4 5 5 0.147 4 8.9 e-1 8.9 e-1 ns 1.72 4 1.6 e-1 1.6 e-1 ns ## 6 B hp t0 t2 5 5 4.35 4 1.2 e- 2 2.4 e-2 * ## 7 B hp t0 t3 5 5 -8.37 4 1 e-3 3 e-3 ** 2 * ## 11 C hp t0 t3 5 5 -5.12 4 7 e-3 2.8 e-2 * ## 12 C

    1.4K30编辑于 2022-11-15
  • 来自专栏用户画像

    C语言测试题

    一、选择题 1.以下选项中不合法的用户标识符是:C A)file   B)number   C)abc.d  D)sum 2.以下选项中正确的实型常量是:B A).123   B)0   C)e-2  

    1.7K50发布于 2018-08-27
  • 来自专栏新智元

    这AI保熟吗?大谷Stable Diffusion巨制:《华强买瓜》好莱坞巨星版来了!

    因而,从2021年底到现在,先后有OpenAI的GLIDE、DALL·E-2和Google的Imagen都用上了Diffusion。 虽然Google的Imagen和OpenAI的DALL·E-2,画图的效果也很出色,可这些工具都是封闭或半封闭的。 为何Stable Diffusion可以做到开源,而其他却做不到呢? 即便OpenAI「良心发现」,让DALL·E-2开源,普通人也是用不起的:需要使用高端显卡,等待时间也比较长。

    76420编辑于 2022-09-20
  • 来自专栏新智元

    AIGC下一站:期待、警惕充斥着AI剪辑师的世界

    从 Stable Diffusion 到 Midjourney,再到 DALL·E-2,文生图模型已经变得非常流行,并被更广泛的受众使用。 例如,DALL·E-2 是一个 120 亿参数的变换器模型:首先,它生成图像令牌,然后将其与文本令牌组合,用于自回归模型的联合训练。之后,Parti 提出了一种生成具有多个对象的内容丰富的图像的方法。 后来,DALL·E-2 利用了对比模型 CLIP:通过扩散过程,从 CLIP 文本编码到图像编码的映射,以及获得 CLIP 解码器…… 这些模型能够生成具有高质量的图像,因此研究者将目光对准了开发能够生成视频的文生图模型

    56310编辑于 2023-05-09
  • 来自专栏大数据文摘

    AIGC下一站:期待、警惕充斥着AI剪辑师的世界

    从 Stable Diffusion 到 Midjourney,再到 DALL·E-2,文生图模型已经变得非常流行,并被更广泛的受众使用。 例如,DALL·E-2 是一个 120 亿参数的变换器模型:首先,它生成图像令牌,然后将其与文本令牌组合,用于自回归模型的联合训练。之后,Parti 提出了一种生成具有多个对象的内容丰富的图像的方法。 后来,DALL·E-2 利用了对比模型 CLIP:通过扩散过程,从 CLIP 文本编码到图像编码的映射,以及获得 CLIP 解码器……(点击了解文生图的前世与今生) 这些模型能够生成具有高质量的图像,

    77740编辑于 2023-04-21
  • 来自专栏叶子的开发者社区

    【数据结构】树--二叉树之最大路径

    该树输入的先序遍历结果为ABCD00E000FG00H0I00,各结点权值为: A-5,B-4,C-11,D-7,E-2,F-8,G-13,H-4,I-1 输入 第一行输入一个整数t,表示有t个测试数据

    50040编辑于 2023-07-30
  • 来自专栏思影科技

    渐进型多发硬化症(PPMS)相关的rich-club失连

    在所有节点中最重要的一些rich-club节点,见图1,这些节点也保留有基于强度和连接度排名前九的节点(图e-2,e-3),可以发现PPMS和HC之间的组织结构并没有显著差异,图e-4显示了病人和健康人之间的平均连接模式

    1.1K70发布于 2018-04-08
  • 来自专栏量子位

    PS造假神了!

    于是当Adobe终于准备好上线新功能时,就遭到网友吐槽: 其实已经在Dall·E-2和其他AI作画类工具上存在了快一年了。

    29130编辑于 2023-08-03
  • 来自专栏机器之心

    达摩院预测的2023十大科技趋势,你看准哪个?

    过去一年,其技术上的进展主要来自于三大领域:图像生成领域,以 DALL・E-2、Stable Diffusion 为代表的扩散模型(diffusion model);自然语言处理(NLP)领域基于 GPT

    44020编辑于 2023-03-29
  • 来自专栏量子位

    PS直接革自己命!AI功能迎来史诗级加强,网友:改变游戏规则

    不过也有不少网友表示,感觉这一功能还有进一步优化的空间: 使用相同的提示词,感觉生成的效果和PS官方展示的效果“并不一致”…… 还有人表示,像inpainting这样的功能,其实已经在Dall·E-2

    35620编辑于 2023-08-03
  • 来自专栏帅云霓的技术小屋

    软硬件融合技术内幕 进阶篇 (7) —— 恶魔导演的战争

    但是,叙军的战斗机刚刚起飞,就被以色列的E-2预警机捕捉到并锁定,几秒钟内,来自美国的电子计算机就计算出了敌机的航迹诸元,与储存的性能包线数据拟合以后,将数据通过数据链分发到所有的战斗机。

    79120编辑于 2022-12-13
  • 来自专栏深度学习

    【论文复现】基于CGAN的手写数字生成实验——超参数调整

    正如实验结果所示,当 weight decay 设置为 e-2 时生成图像的效果最差,且g_loss 曲线下降缓慢。

    36810编辑于 2024-07-30
  • 来自专栏Pulsar-V

    Math-Model(五)正交分解(QR分解)

    1,k-1),A(k,k)+s,A(k+1:n,k)']'; R(1:k-1,k)=A(1:k-1,k); end if norm(w)~=0 w=w/norm(w); end P=E-

    9.4K20发布于 2019-04-01
  • 来自专栏医学和生信笔记

    R语言方差分析总结

    1.77 4 1.52e-1 3.04e-1 ns ## 3 A hp t0 t3 5 5 -3.64 4 2.2 e- 2 6.6 e-2 ns ## 4 A hp t0 t4 5 5 0.147 4 8.9 e-1 8.9 e-1 ns 1.72 4 1.6 e-1 1.6 e-1 ns ## 6 B hp t0 t2 5 5 4.35 4 1.2 e- 2 2.4 e-2 * ## 7 B hp t0 t3 5 5 -8.37 4 1 e-3 3 e-3 ** 2 * ## 11 C hp t0 t3 5 5 -5.12 4 7 e-3 2.8 e-2 * ## 12 C

    3.4K10编辑于 2022-11-15
  • 来自专栏全栈程序员必看

    高精度快速阶乘算法

    )”),则可提前终止分解,否则直至右边最后一项为“ F1(1)”为止;这样,我们 将阶乘转化为2的整数次幂与一些连续奇数的积(或再乘以一个小整数的阶乘); 再定义:F2(e,f) = e*(e-

    1.3K20编辑于 2022-09-15
  • 来自专栏PaddlePaddle

    跨语言、跨模态、跨任务的大模型,驱动应用生态繁荣

    大模型迭代闭环趋势 众所周知,大模型技术不断发展,已经从大模态发展到了多模态和跨模态,比如从Instruct GPT3技术发展到跨模态的DALL·E-2技术,同时大模型在应用过程中也产生了非常好的轻量级应用技术

    1K30编辑于 2023-03-06
  • 来自专栏博文视点Broadview

    2023十大科技趋势(达摩院发布)

    过去一年,其技术上的进展主要来自于三大领域:图像生成领域, 以 DALL·E-2、Stable Diffusion 为代表的扩散模型(Diffusion Model);自然语言处理(NLP)领域基于 GPT

    95930编辑于 2023-04-04
领券