前几天,Google 发布了自家最新一代的图片生成模型 Nano Banana 2(也就是 Gemini 3.1 Flash Image)。
作为一名AI转型者,我对这类工具的嗅觉向来很敏锐。所以第一时间,我就上手跑了一遍流程。
这次更新的核心就三个词:更快、更稳、更一致。
我不整那些虚头巴脑的概念,直接给你们看我这两天用它实测的三个方向。
细腻度与风格融合
以前我们用 AI 生图,最怕两件事:一是一眼假,二是风格乱炖。
但Nano Banana 2 在视觉风格的保持上,让我这个阅图无数的挑剔眼都觉得惊喜。
首先是古诗词的意境还原。
我试着输入了陆游的那首《游山西村》:

大家看下面这张图:

它没有简单粗暴地堆砌酒、猪或者柳树这些元素,而是真的把那种农家丰年的淳朴感,和柳暗花明的空间纵深感给画出来了。作为从小在山西农村长大的孩子,看到这种画面,我是有共鸣的。
其次是打破次元壁的能力。
我又给它出了个难题:犬夜叉带着戈薇在深圳繁华的大街上玩耍。


结果非常惊艳。最让我意外的是背景里的招牌文字,不再是以前那种乱码天书,而是清晰、准确的汉字。
最后是风格的统一性。
我甚至做了一个更离谱的测试:让犬夜叉、美少女战士和小黄人坐在一起打扑克。


这三个角色的原始提示词画风完全不同(二次元、素描人物、稀土人物),但 Nano Banana 2 生成的画面,自动把它们统一在了一种视觉风格里,整体看起来非常融洽。
逻辑与中文处理
这次 NB2 的中文理解能力,真的让我有点服气。
第一张,我让它生成《西游记》的人物关系图。


它不仅画出了师徒四人,还把佛祖、代表性妖怪的关系梳理得清清楚楚。这不是简单的画画,这是在做信息架构。
第二张,我对达利欧《原则》的一段内容做视觉笔记。


生成的图片条理性极强,清晰易懂。把晦涩的文字转化成可视化的图表,这不就是我每天在做的事情吗?
第三张,我基于刚买的鼠标,做了一张商业产品海报。


细节精致就不说了,最牛的是它的文案排版。大气、结构化,完全符合商业审美。说实话,这水平已经接近资深设计师的输出了。
速度与一致性
最后说一个让我感触最深的点:速度。
在 Lovart 上体验 NB2 时,那种流畅感非常明显。
我试着生成了一组分镜脚本,仅仅用了10分钟,就生成了16张高质量分镜。


大家可以点开大图看看细节,人物皮肤的质感清晰可见,甚至连毛孔和光影的漫反射都处理得很自然。
更重要的是,在连续生成的16张图里,人物的长相、服饰保持了高度一致,没有出现上一张是圆脸,下一张变方脸的翻车事故。
写在最后
看完这些,或许有设计师朋友会感到焦虑:AI 都能干成这样了,我们还能干嘛?
我的看法恰恰相反。
Nano Banana 2 的这次更新,不管是 10 分钟出 16 张图的速度,还是对《原则》逻辑的梳理能力,其实都是在把我们从繁琐的执行中解放出来。
当工具足够强大且便宜时,想法和审美才是最昂贵的。
它能帮你画出精美的海报,但为什么要做这张海报、这张海报要解决什么用户痛点,这些依然需要你去思考。
我最深刻的体会:不要做工具的奴隶,要做驾驭工具的主人。
如果你也想体验这种生产力爆炸的感觉,建议你去试试。别光看,去用,去感受。