



2026年2月18日,ComfyUI 官方发布了最新稳定版本 v0.14.2。这一版本属于不可变版本(Immutable release),意味着除了版本标题和说明外,其他部分将不会再修改。相较前一版 v0.14.1,本次更新虽然是一个“小版本”迭代,但其影响却相当关键 —— 它针对 Gemini/Nano banana API 节点在部分情况下返回空白图像的问题进行了修复,同时引入了更智能的 MIME类型 glob 匹配机制,进一步提升了 ComfyUI 的图像识别与节点兼容能力。
本次更新仅包含 一个提交(commit),由一名贡献者完成,在一份文件中进行了 11处新增与3处删除,核心修改集中于 comfy_api_nodes 模块下的 nodes_gemini.py 文件。
在此前版本中,ComfyUI 的 API 节点在处理 Gemini 模型生成的内容时,偶尔会出现返回空白图像的情况。这个问题主要出现在节点对返回的 MIME 类型进行匹配的过程中,系统仅能识别具体的字符串类型(如 "image/png"),而无法通配或灵活识别其他类型,例如 "image/jpeg" 或 "image/webp" 等。
此问题导致部分模型生成的图片未能正确提取和呈现,严重影响使用体验。
v0.14.2 版本针对这一问题进行了根本性的技术改进,通过使用 glob(通配符)匹配机制,使 MIME 类型匹配更加灵活和智能,从而彻底解决这一潜在漏洞。
_mime_matches 函数在 comfy_api_nodes/nodes_gemini.py 文件中新增了如下逻辑:
def _mime_matches(mime: GeminiMimeType | None, pattern: str) -> bool:
"""Check if a MIME type matches a pattern. Supports fnmatch globs (e.g. 'image/*')."""
if mime is None:
return False
return fnmatch(mime.value, pattern)这一函数通过引入 Python 标准库 fnmatch 模块,实现了基于通配符的 MIME 字符串匹配。 从原先的严格字符串等值判断,演进为支持标准通配表达式,如:
"image/*" —— 匹配所有图像类型;"text/*" —— 匹配所有文本类型;"application/*" —— 匹配所有应用数据类型。这样一来,当 Gemini 模型在返回数据时使用不同的 MIME 描述(例如某些模型可能返回 "image/jpeg" 或 "image/webp"),程序都可以自动识别并正确提取图像数据,极大提升了兼容性与稳定性。
get_parts_by_type 改进:全面采用 _mime_matches 匹配机制在此函数中,原本用于判断 MIME 类型的逻辑为直接字符串比较:
elif part.inlineData and part.inlineData.mimeType == part_type:新的代码将其改为:
elif part.inlineData and _mime_matches(part.inlineData.mimeType, part_type):同样地,文件数据部分也采用相同逻辑:
elif part.fileData and _mime_matches(part.fileData.mimeType, part_type):这意味着无论数据是 inlineData(内嵌数据) 还是 fileData(文件数据),都能通过灵活的模式匹配来识别不同类型的输入内容。
这一步调整是本次更新的核心,它直接关联到 Gemini 节点的图像提取逻辑,也是解决空白图像问题的根本。
get_image_from_response 改进:支持所有图像类型此前版本中,程序仅从响应中提取 "image/png" 类型的内容:
parts = get_parts_by_type(response, "image/png")但由于很多模型会生成多种不同格式的图像,因此新版将其改为:
parts = get_parts_by_type(response, "image/*")这意味着系统现在可以从返回的任何图像类型(包括 JPEG、WEBP、GIF、TIFF 等)中识别并提取图像数据,大幅度提升兼容性与处理效率。
这一调整配合 _mime_matches 函数的通配符匹配机制,可视为一次重要的底层增强,为未来扩展更多的模型支持打下了坚实基础。
文件: comfy_api_nodes/nodes_gemini.py 变动统计:
这次修改虽然简洁,但却精准解决了核心问题——真正体现了一个成熟项目在版本迭代中“小步快跑、持续优化”的理念。
为了更全面理解 v0.14.2 的意义,我们不妨简要回顾一下 v0.14.1 的更新内容。
从这些内容可以看出,v0.14.1 更注重模型层面的扩展与适配,涉及 LLM 和视频处理模型,而 v0.14.2 则将焦点放在了 API节点的稳定性与图像数据正确性 上,属于修复与底层增强类更新。
两者配合,使系统的功能广度与执行可靠性同时得到提升。
回顾 v0.14.0 的更新,可以看出 ComfyUI 在这一系列版本中进行了多方面的技术跃迁:
在这样一连串功能性铺垫之后,v0.14.2 的发布显得更具深意: 从模型到接口,再到数据格式解析,ComfyUI 已在构建一个更加统一、智能、稳健的生成式体系。
在多模型、多媒体格式共存的今天,硬编码的 MIME 类型早已无法满足复杂场景需求。例如,有的生成模型会输出 "image/png",有的则使用 "image/jpeg" 或自定义类型如 "image/x-quickdraw"。
通过采用通配符匹配机制:
"image/*" → 匹配所有图片类型
"text/*" → 匹配所有文本类型系统可以不再关心细节具体值,而是更关注其泛型分类。这种改进不仅提升了稳定性,也为未来插件与自定义节点开发提供了更高的自由度。
Gemini 系列节点作为 ComfyUI 的一大智能接口模块,承担着多项内容生成任务,包括文本、图像、文件等。不论用户调用 Gemini 还是 Nano banana 模型,响应数据通常都包含多种 MIME 类型与数据结构。
此次更新让 Gemini 节点在处理这些复杂的 API 响应时更加健壮,不再出现遗漏图像或无法识别内容的情况。
对于希望在 ComfyUI 上构建自定义节点的开发者来说,此次改动带来的收益非常明显:
虽然 v0.14.2 是一次小版本更新,但它体现了 ComfyUI 项目的生态理念:通过不断消除细节性的技术障碍,构建一个更稳定、更可扩展的创作系统。
这一理念不仅体现在本次 MIME 匹配机制的优化,也贯穿于此前版本的每一次改进,如:
这些都在让 ComfyUI 从“一个工具”逐渐演进为“一个平台”。
ComfyUI v0.14.2 虽然只有一个 commit,却代表了项目在稳定性与智能化方向上的持续跃进。其主要意义可归结为以下几点:
通过这一小步,ComfyUI 在图像生成、API 调用、节点通信的稳定性上完成了一次实质性强化。未来版本中,这一通配机制或将被更多模块采纳,成为系统中处理多类型数据的统一策略。
代码地址:github.com/Comfy-Org/ComfyUI
ComfyUI v0.14.2 是一个典型的“小版本、大优化”案例。它并非推出全新功能,而是通过对底层代码的精准补强,解决实际问题、提升通用性能,从而让整个系统的使用体验更自然、更可靠。
·
我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。
·