WithAI.Design

5分钟阅读

ZImage实力如何?人像对比测试

ZImage实力如何?人像对比测试

前言

前不久,我们介绍了Z-Image这个开源的“小钢炮”:【AI辅助设计】刚刚!阿里AI小钢炮Z - Image登场!6B参数实现顶尖文生图效果 相信大家这段时间也看到了不少文章的评测了,今天也带大家一起看看其人像方面的能力,主要对比当红炸子鸡-Nano Banana Pro。

测试提示语

本次测试提示语,都来源于我做的一个提示语收集网站:https://mygif.fun/inspiration。 现在已经有600多个提示语,覆盖Midjourney、Nano Banana、豆包、Grok等主流平台提示语,可以跟着大佬们的提示语找到灵感💡。

01.gif

使用工作流

使用最朴实无华的ComfyUI官方 image_z_image_turbo.

人像测试

## 圣诞主题双人贴纸照 - 3x3网格高精细现代日本风格

高精细现代日本贴纸照风格的拼贴,展示两位年轻女性朋友穿着匹配的圣诞服装,排列成3x3网格(共9格)。主题:圣诞。风格:鲜艳的全彩、明亮动态的现代日本贴纸照照明。背景:简单的单色或主题色背景,带有微小装饰如小心心。照片特征:每格有薄白边或装饰边框,浅景深(背景虚化)。被摄对象和姿势:两位年轻女性朋友,表情明亮、有趣。网格中九种不同的流行贴纸照姿势:第一行:1. '头发捧心'姿势,2. '双手比心'姿势,3. '交叉手臂捏脸'姿势。第二行:4. '交叉手臂大心'姿势,5. '约定心'姿势,6. '牵手比心'姿势。第三行:7. '交叉手臂嘟嘴'姿势,8. '牵手捧脸心'姿势,9. '交叉手臂小心'姿势。附加装饰:多个发光霓虹心形叠加,每格沿脸部轮廓添加主题相关的霓虹灯风格文字,每格添加多个主题相关的霓虹线条涂鸦(如星星、箭头、集中线、花朵、动物耳朵)。最重要限制:所有9格中严格保持被摄对象、服装、背景风格和照明的一致性。浅景深,典型贴纸照效果。禁止事项:除指定的文字元素和霓虹线条涂鸦外,绝对不要添加任何文字元素、标志、标签、水印、符号、数字等。

⬇️Nano Banana

⬇️z-image

z-image没有完全理解提示语,但是氛围感和审美在线。

自拍少女梦幻写真

以超写实16K分辨率编辑照片。一个年轻亚洲女孩在房间里自拍。她的头发是长而分层的灰棕色,顶部略显凌乱,自然向前垂落。她穿着一件黑色卷曲肩带的花卉连衣裙。姿势:她俯卧在毯子上,右手触碰嘴唇,头侧向一边,向前看,显得像是在做白日梦。她的妆容完美,韩式风格带现代感:整齐的眉毛,柔和的桃色眼影,细眼线突出眼睛,柔和的灰色隐形眼镜赋予迷人眼神。脸颊有自然的桃色腮红,嘴唇光泽,裸色基底唇色渐变至红色,形成柔和而鲜明的对比。背景是奶油色大理石墙。照片近距离拍摄,与眼睛齐平。灯光:电影感和时尚编辑风格,昏暗黑暗使自拍看起来真实。复古紫色对比增强皮肤光泽。照片用iPhone 17 Pro Max拍摄。不要以任何方式改变她的脸。

⬇️Nano Banana

⬇️z-image

姿态都还原到位,就是z-image的妆容有点过了🥱

卧室自拍三连

一位具有亚洲女性特征、肤色白皙、长层深棕色头发的年轻女性,穿着简单的黑色细肩带吊带衫,俯卧在铺有白色床单和灰色软垫床头板的明亮通风卧室床上。她俯卧着,肘部支撑在床上,一只手轻触脸颊,头部微微倾斜,表情多变俏皮,包括温柔的微笑、自然的笑声和俏皮的眨眼。图像采用社交媒体自拍美学,三连画或拼贴风格,柔焦、高调照明,营造亲密休闲氛围。相机设置:平视视角,24mm至35mm焦距,f/2.0至f/2.8光圈,1/100秒快门速度,ISO 200,居中构图。照明:自然窗光,柔和漫射,左侧侧光,日光平衡。

⬇️Nano Banana

⬇️z-image

经过抽卡后z-image终于理解了三连拍的含义~

复古娃娃风格女性拥抱泰迪熊

亚洲女性的脸部皮肤非常光滑、苍白,带有暖色调,呈现出柔和、像瓷娃娃一样的外观。她的表情温柔、天真,略带忧郁,仿佛在拥抱一个玩偶,带有怀旧或安慰的情感。脸颊上有桃粉色腮红,集中在眼睛下方和鼻子两侧,营造出温暖、害羞和脸红的效果。她的眼睛非常大、圆润且闪闪发光,类似于插画或娃娃般的眼睛。虹膜是深棕色,但看起来明亮有光泽,可能使用了大直径隐形眼镜增强效果。睫毛又长又密,上下睫毛都如此,为眼睛增添了戏剧性的丰满感。柔和的桃色、奶棕色眼影和一丝微光被巧妙地应用,自然地放大眼睛。眼睛下方的淡淡线条(卧蚕)给人一种可爱和年轻的印象。嘴唇是柔和的桃色且光泽,小巧且略带尖形,边缘柔和融合,呈现出甜美和天真的外观。没有使用极端的渐变效果;唇妆看起来自然且水润。她的头发浓密、柔软卷曲,呈深棕色,带有在光线下闪烁的浅色高光。薄薄的中间分刘海轻轻框住脸部。头发两侧装饰着小白色丝带和精致蕾丝,营造出复古公主或维多利亚娃娃的美学。发型复杂而优雅,结合了经典风格和现代感。她拥抱着一只浅棕色(米色)泰迪熊,熊有柔软、毛茸茸的皮毛。熊的脖子上系着一条红、黑、白相间的小格子丝带。熊被紧紧抱在胸前,传达出温暖、柔软和安全感。她的手光滑、修长且女性化,轻轻抱着泰迪熊。她的身体微微前倾,仿佛更紧密地拥抱熊。手指修长,指甲自然且整洁。她穿着复古、经典的服装,带有蕾丝细节,主要是奶油色和白色,包括精致的花边蕾丝、小米白色丝带和分层的薄织物,营造出浪漫的外观。服装类似于洛丽塔时尚、田园风或柔和维多利亚风格。光线温暖,带有金色调,唤起怀旧、舒适和梦幻般的氛围。背景包含装饰元素,如木质纹理、复古饰品和柔和的金色色调,支持舒适、童年温暖、柔软和娃娃般天真的主题。整体美学强调娃娃风、复古浪漫、田园和维多利亚柔软感、温暖怀旧和柔和女性幻想,营造出亲密、温暖和优雅可爱的氛围。

⬇️Nano Banana

⬇️z-image

z-image的表现非常不错,完全还原了提示词👍。人物偏幼态,是不是更符合国人审美?🤔

超写实动漫风格女性肖像 - 聚光灯下的神秘少女

生成一个超写实动漫风格的亚洲女性角色肖像,站在完全黑色的背景中。灯光:使用窄束聚光灯,仅聚焦于脸部中心。光线边缘必须锐利且戏剧化。聚光灯外的所有区域应迅速陷入深暗(高衰减阴影),几乎融入黑色背景。不是柔和灯光。头发:深色长发,一些发丝垂落在脸上。头发的下部应融入阴影中。姿势:一只手轻轻举到嘴唇,做出害羞、犹豫的手势。眼睛直视相机,带有神秘情绪。服装:黑色长袖针织毛衣;毛衣和身体应大部分消失在黑暗中,细节最少。整体色调:黑暗、情绪化、戏剧性、神秘。仅在脸部受光部分高对比度。聚光灯外的一切应几乎不可见。

⬇️Nano Banana

⬇️z-image

虽然皮肤质感、细节,z-image比不上banana,但是光影的塑造还是非常到位,人物的表情动作满分!

## 湿发少女肖像 - 柔和自然光下的特写面部

创建一张超写实的亚洲年轻女性肖像。面部呈对称的椭圆形,皮肤极其光滑,几乎无纹理。皮肤苍白明亮,带有柔和的自然光泽,仿佛被自然光照亮。脸颊上有鲜艳的粉色腮红,呈现清新红润的外观。鼻子小巧纤细,鼻梁挺直,鼻尖有微妙的高光。嘴唇呈自然粉色,下唇较丰满,上唇较薄,边缘柔和无缝,呈现自然外观。表情平静中性,直视镜头带有轻微的好奇感或强度感。眼睛引人注目,呈灰绿色,明亮反光,形状大而圆,上眼睑光滑。睫毛自然卷曲但不夸张,可能通过睫毛膏或光线略微增强。眉毛直、浓密且自然,跟随面部柔和轮廓。头发深黑色、湿润并紧贴皮肤,发丝自然地垂在额头上,营造柔和而戏剧性的效果。在头部左侧(图像中右侧),湿发上有一个浅白色或浅灰色的丝带发夹。双手靠近面部,仿佛在调整或握住湿发,指尖轻轻触碰头发和头部侧面。手也显得湿润,与头发匹配,给人一种刚洗完头发或脸部的印象。手的位置自然地框住面部,强调其作为中心焦点。光线柔和自然,可能来自前左侧的窗户,无强烈阴影,使皮肤看起来干净、明亮且光滑。鼻梁、下巴和脸颊上有微妙的高光,增强发光效果。背景简约且失焦,呈浅奶油色调,无分散注意力的图案或物体,保持全神贯注于面部。照片的整体氛围是亲密、柔和、宁静的,强烈聚焦于眼睛。鲜艳的腮红、大而反光的眼睛和湿发的结合,在特写化妆风格中营造出柔和、年轻、梦幻的时尚美妆美学。

⬇️Nano Banana

⬇️z-image

点赞z-image👍,皮肤肌理有了,湿润润的感觉不错!

年轻女性酒红亮片礼服自然胶片摄影

一位迷人的年轻女性(25-30岁)的自然胶片抓拍,她拥有一张青春的脸庞和光滑的皮肤。她穿着一件华丽的吊带深酒红色亮片晚礼服。她的表情自信、性感且优雅,带有一种性感的气息。青春的外表,在高端高级的酒店里的生活照,模特的全身照,睡在床上,姿势大胆。表情充满故事感和氛围感,身体呈现S型,完美展现腰部线条。展示出迷人的腰线。美学和技术:自然胶片摄影,使用35毫米胶卷,柯达Portra 400,柔和的闪光灯照明,轻微的胶片颗粒感。真实的皮肤质感,可见毛孔,轻微瑕疵,无修图。反AI风格,快照美学,高保真细节。

⬇️Nano Banana

⬇️z-image

z-image的衣服细节稍逊色。

超写实粉红针织少女肖像

创建一张超写实的亚洲年轻女性肖像(面部必须与参考图片100%匹配,无任何更改)。这位年轻女性有着长直深棕色头发,发丝随风飘动。她皮肤白皙,面容精致,化着淡妆,带有眼线和唇彩。她的姿势性感诱人。她穿着一件浅粉色长袖前扣针织毛衣(胸前敞开),毛衣上绣满小白蝴蝶结,搭配与毛衣相配的裙子。配饰:一条细金项链带心形吊坠,小巧的银粉色蝴蝶结耳环。姿势:她平躺在床上,抬起手遮住嘴巴,看着镜头。背景:略微模糊,卧室以白色和蓝色调装饰,阳光洒入。整体图像具有明亮生动的胶片摄影美学,8K清晰度。

⬇️Nano Banana

⬇️z-image

z-image的房间细节逊色不少,真实感比不上banana。但是模特很讨喜呢😂。

日系写真九宫格

以亚洲女性为主题,生成一张高端日本写真集(写真集)的扫描页面,采用九宫格照片布局,印刷在纹理哑光艺术纸上。布局底部有宽白边用于排版。所有面板中为同一角色。随机选择一种造型:经典(宽松白衬衫+短裤)、柔和(米色针织开衫+吊带衫)或纯净(白色蕾丝边吊带裙,在第三行呈现湿身效果或露肤)。随机选择一个标题主题:夏日(大号日文文本'青い夏'配小号英文'BLUE SUMMER')、私密(大号日文文本'私小説'配小号英文'PRIVATE NOVEL')或空气感(大号日文文本'空気感'配小号英文'AIRY MOMENTS')。包含手写签名'By : Berryxia'艺术性放置。网格叙事:第一行 - 户外呼吸:左上角广角镜头,角色站立风中,背光阳光;中上特写,手拿苏打水瓶或遮挡阳光;右上模糊随拍,角色在街上走远。第二行 - 室内玩耍:左中角色坐在榻榻米上用干花遮住一只眼;中间角色倒躺在沙发上读书,脸部部分隐藏;右中焦点在蜷缩在地毯上的赤脚或手指触摸头发。第三行 - 私密/湿润:左下蒸汽浴室背部视图,湿发贴颈,柔焦;中下角色浸入浴缸,水至下巴,梦幻高调照明;右下蒸汽在镜子上的细节。美学风格:富士Pro 400H胶片,青色阴影和明亮高光,可见纸张纹理,轻微暗角,布局设计风格。使用室内旅馆风格B输出。

⬇️Nano Banana

⬇️z-image

z-image受限于模型大小?对于物理世界的描述,当然比不上banana,例如一本书、文字的位置等等,但是感觉也很好了!

速度

速度是飞快了!我的4090可以4.92秒出图(1024分辨率)

限制🚫

本地模型最大的优势是没有限制,小站也测试过,确实无限制🥱。大家可以下载本地试试。

写在最后

好了,今天的测试就到这里,相信群众的眼光是雪亮的,看到差距的同时,其实z-image作为一个小模型,有这样的能力,已经碾压之前刚发发布的flux. 2(就目前国人审美和出图质量和速度方面)了。后续我们还会持续关注z-image的生态发展。

更多 AI 前沿技术与设计灵感,欢迎关注「设计小站」公众号(ID:sjxz00),一起探索科技与设计的融合创新。

标签