WithAI.Design

5分钟阅读

阿里最强开源改图模型升级!QwenImageEdit2511发布,为设计师带来更强控制力

阿里最强开源改图模型升级!QwenImageEdit2511发布,为设计师带来更强控制力

阿里最强开源改图模型升级!Qwen-Image-Edit-2511发布,为设计师带来更强控制力

前言

对于设计师而言,精准、可控且能保持设计元素一致性的AI图像编辑工具,是提升工作效率和创意实现度的关键。继此前表现出色的Qwen-Image-Edit-2509之后,阿里通义千问团队再次带来重磅升级——Qwen-Image-Edit-2511。这款新模型在人物一致性、几何结构理解和内置功能上均有显著提升,旨在更好地服务于真实的设计工作流,让创意落地更高效、更精准。

正文

Qwen-Image-Edit-2511正式登场!

此次更新在一致性和可控性上实现了重大突破,相比2509版本是一次巨大的飞跃,专为应对真实世界的复杂工作流程而打造。

模型获取地址:

2511版本的核心升级:

  • 更强的多人一致性:针对合影、复杂场景中的多人物,能更好地保持各自的形象特征。
  • 内置热门社区LoRA:无需额外调参,开箱即用多种风格化效果。
  • 大幅减少图像漂移:人物与身份的一致性得到显著改善。
  • 增强的几何推理能力:包括对结构线、建筑轮廓的理解和编辑,对产品、工业设计更友好。
  • 提升的工业与产品设计生成:为专业设计领域提供更可靠的辅助。

从保持身份特征的肖像编辑,到高保真的多人场景融合,再到实用的工程与设计工作流,2511将AI图像编辑推向了新的高度。

立即在线体验:

以下是官方展示的几个核心特性:
Qwen-Image-Edit-2511 增强角色一致性
在 Qwen-Image-Edit-2511 中,角色一致性得到显著提升。模型能够基于输入的人物肖像进行创意编辑,同时保持对象身份与视觉特征的连贯性。




提升多人场景一致性
Qwen-Image-Edit-2509 已优化单角色编辑的一致性,而 Qwen-Image-Edit-2511 进一步增强了多人合影的协调性——能够将两张独立人物图像高保真地融合为自然的集体照片:

[

内置社区创作 LoRA 支持
自 Qwen-Image-Edit 发布以来,社区已开发出众多创意丰富、质量优秀的 LoRA 模型,极大拓展了其表现潜力。Qwen-Image-Edit-2511 将部分热门 LoRA 直接集成至基础模型中,无需额外调参即可激活相应效果。

例如,光影增强 LoRA 现已实现开箱即用的真实光线控制:

再如,多视角生成功能现已可通过基础模型直接实现:

工业设计应用
我们特别关注实际工程场景,例如批量工业产品设计:

以及工业零部件的材质替换:

增强几何推理能力
Qwen-Image-Edit-2511 引入了更强大的几何推理功能——例如直接生成用于设计或标注的辅助构造线:

以上便是 Qwen-Image-Edit-2511 的主要更新内容。欢迎探索全新功能!🎉

网友评测

模型发布后,社区迅速展开了测试:

@FurkanGozukara 对比了不同步骤下的输出效果,2511在细节和一致性上表现更优。

“First test of Qwen Image Edit 2511 - 1st image is input, 2nd image official ComfyUI 20 steps output - 3rd image is official 2511 workflow with 50 steps - 4th image our 2509 - 12 steps workflow”

Kokoboy 测试了漫画上色,指出2511版本色彩不再灰暗,更加鲜艳。

“Manga Coloring Test… Left: Qwen Image Edit 2509 Right: Qwen Image Edit 2511”

AIおじさん 展示了将AI生成图像转为写实风格的效果。

“やっとQwen-Image-Edit-2511が発表された。まずは、GPT Image 1.5で生成した画像の実写化。”

也有用户指出了当前存在的一些问题,如像素偏移,但肯定了其无需LoRA即可进行线稿化的能力。

** R@aiaicreate ** 等用户分享了在ComfyUI中使用GGUF格式模型和LoRA的经验,讨论了工作流优化和不同量化模型(Q8, bf16)的选择。

AI guyapolinario 则展示了结合4步LoRA进行本地高速生成的效果。

Fandu 强调了新版本在角色一致性上的改进。

生态与使用方式

生态进展

1. 本地部署的GGUF版本放出

Unsloth AI 团队迅速制作并发布了模型的GGUF格式,方便用户在本地硬件上运行。

“We made Qwen-Image-Edit-2511 GGUFs so everyone can run it locally!” 下载地址https://huggingface.co/unsloth/Qwen-Image-Edit-2511-GGUF

2. LightX2V加速

LightX2V 为2511提供了“Day 0”支持,通过框架加速和4步蒸馏技术,实现了总计42.55倍的惊人加速,让高速图像编辑成为可能。

多种使用方式

除了官方体验地址,模型已迅速集成到多个流行平台:

1. ComfyUI

本地部署的ComfyUI用户可以通过替换工作流中的模型来使用2511。需要注意的是,在RTX 4090上运行FP8版本时,建议配合Lightning LoRA以达到可用速度。社区已涌现出新的工作流节点和方法来解决运行中的一些问题。

2. fal

云平台 fal 已第一时间上线2511,内置热门LoRA,开箱即用。

3. Replicate

Replicate 平台也与 PrunaAI 合作,提供了可能的最快推理速度。

4. camenduru

开发者 camenduru 提供了方便的Docker镜像,便于在RTX 3090/4090等设备上通过TostUI快速部署体验。

写在最后

Qwen-Image-Edit-2511的发布,标志着开源AI图像编辑工具在专业性实用性上迈出了坚实的一步。对于设计师而言,更强的几何理解、更优的身份一致性以及内置的丰富风格化选项,意味着我们可以更少地纠结于技术调试,而将更多精力专注于创意本身。尽管在具体工作流中可能仍需微调和探索,但其展现出的潜力无疑将为设计行业带来新的效率工具和创意可能性。持续进化的开源生态,正让前沿AI技术变得触手可及。


更多 AI 前沿技术与设计灵感,欢迎关注「设计小站」公众号(ID:sjxz00),一起探索科技与设计的融合创新。

标签