首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >多语言AI图像生成器NeoBabel开源发布

多语言AI图像生成器NeoBabel开源发布

原创
作者头像
用户11764306
发布2026-03-23 11:30:50
发布2026-03-23 11:30:50
940
举报

虽然文本到图像的生成技术正在迅速发展,但这些AI模型大多以英语为中心。这加剧了非英语使用者的数字不平等。阿姆斯特丹大学理学院的研究人员创建了NeoBabel,一个能够支持六种不同语言的AI图像生成器。通过将其研究的所有要素开源,任何人都可以在该模型的基础上进行构建,并帮助推动包容性AI研究。

当你使用AI生成图像时,如果你的提示词是英语,结果通常更好。这是因为许多AI模型的核心是英语:如果你使用另一种语言,你的提示词会在图像创建前被翻译成英语。然而,世界上大多数人并非以英语为母语,这使他们处于不利地位。

与此同时,文本到文本的生成器可以流利地使用超过200种语言。这就是为什么阿姆斯特丹大学信息学研究所的研究人员与一家专门从事文本生成的公司Cohere实验室展开合作。研究团队将图像生成系统集成到这些文本生成器中,创建了一个先进的多语言图像生成器。该图像生成器名为NeoBabel,目前支持六种语言:英语、法语、荷兰语、中文、印地语和波斯语。

完全开源

大多数图像生成模型由几家美国大公司构建,这些公司很少透露其模型的全部细节。Cees Snoek,计算机科学正教授及NeoBabel研究团队成员表示:“通常,大部分工作都是闭源的,因此我们无法确切了解模型的工作原理。我们不知道数据中是否存在偏见,系统是如何创建的,以及如何改进。这有悖于我们的学术原则。”

相比之下,在发表关于NeoBabel的论文的同时,研究团队公开了他们的所有代码和数据。论文第一作者、博士生Mohammad Derakhshani说:“就个人而言,我想构建一个用于科学探索的工具,为此你需要完整的研究流程。我们公开了整个流程,这样任何对该领域感兴趣的人都能获得所需的所有信息。”

一张桌子和一只熊

NeoBabel在英语上的表现与图像模型相当,但在其他五种语言上轻松超越它们。竞争模型首先将提示词翻译成英语,而NeoBabel则直接从多种语言生成图像。Snoek解释道:“翻译会丢失语言和文化的细微差别,因为许多词语在英语中没有好的对应词。”下面展示了一个此类误译的例子,其中提示词要求生成一张桌子和一只熊的图像。

提示词用荷兰语要求生成一张桌子和一只熊的图像。在荷兰语中,熊是“beer”,这使大多数图像生成器感到困惑。

研究人员还改进了用于训练AI模型的数据标签。他们使用多语言语言模型将图像标签翻译成多种语言,并使这些标签更具描述性。Snoek说:“这使我们能够同时用所有这些语言训练我们的模型。对于每种语言,它都学习单词和像素之间的联系。”

通过改进数据,AI模型也比其他竞争模型更小——用技术术语来说,它的参数更少。此外,研究人员将公开可用的图像-标签对数据集从4000万扩展到了1.24亿。Derakhshani说:“这个数据量通常不公开。尽管我们计算能力有限,我们还是大规模扩展了数据集。”

迈向视频

NeoBabel开辟了广泛的应用前景,包括一个多语言创意画布。在这个数字画布上,多个用户可以“绘制”同一幅图像,各自使用自己的语言。Derakhshani解释说:“如果我只说波斯语,而你只说荷兰语,我们可以共同创作一幅图像,而无需使用英语。你可能会用荷兰语生成第一个版本,然后我可以标记一个区域并用波斯语描述修改内容。模型会根据描述相应地调整图像。”

据Snoek称,NeoBabel的下一步是生成具有文化特定性的图像。然而,这需要特定文化的数据以及更强的计算能力。“如果拥有更强大的计算基础设施,我们可以完成更多工作,”Snoek说。“这些AI模型不一定非得来自大型工业实验室。创造力就在这里,但我们缺乏展示它的资源。”

因此,研究人员正在寻求合作伙伴。从长远来看,他们希望将NeoBabel扩展到视频创作领域。Snoek说:“我的梦想是它也能生成视频。希尔弗瑟姆有一个大型电视档案馆,‘Beeld en Geluid’。如果能与他们合作生成荷兰文化视频,那就太棒了。”

了解更多

  • NeoBabel GitHub页面
  • 论文:《NeoBabel:用于视觉生成的多语言开放塔楼》,作者:Mohammad Mahdi Derakhshani、Dheeraj Varghese、Marzieh Fadaee、Cees G. M. SnoekFINISHED

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档