立即登录

皮肤真实感Qwen image edit 2509

Play Count73
Fork Count4
Like Count1
创建: 2025-11-13更新: 2025-11-13
皮肤真实感Qwen image edit 2509 - 1

触发词 : 使主体的皮肤细节更加突出和自然

Qwen Image Edit 2509版本大受欢迎,甚至在C站取代了Flux成为近期最佳开源绘画模型。

不过,Qwen Image原生模型虽好,却有个致命缺陷:皮肤太精致了。

在AI绘画方面,中国选手和欧美选手追求的方向不一致,中国人喜欢十级美颜效果,欧美人喜欢厚重的颗粒感。

为了改善Qwen Image的美颜过度的效果,有人开发出一个皮肤LoRa,可以实现更加真实的皮肤效果。

微调LoRA,提升Qwen-Image-Edit-2509中皮肤的真实感

该仓库包含一个微调的低秩适应(LoRA)模型,旨在增强图像中人类皮肤的真实感和细节。该LoRA是在强大的Qwen/Qwen-Image-Edit-2509模型基础上训练而成,利用其先进的图像编辑能力,专注于生成更自然、更详细的皮肤纹理。

该模型在本地RTX 5090上使用AI-Toolkit训练了5000步。生成的LoRA非常适合摄影师、数字艺术家以及任何希望提高生成或编辑图像中人物质量的人。

模型描述 qwen-edit-skin LoRA是Qwen/Qwen-Image-Edit-2509基础模型的专项微调。基础模型是一个多功能的图像编辑器,在多图像编辑和保持单图像一致性方面具有强大的能力,特别是在保持个人身份方面。在此基础上,该LoRA专注于人类皮肤的细微之处,增加了原始生成中可能缺失的细节和真实感。

训练是使用AI ToolKit的一个分支进行的,这是一个用于微调扩散模型的综合套件。数据集策划过程如下:

选取真实的人物肖像图像,且人物皮肤暴露在外。 将这些图像标注为“目标”(THE AFTER)图像,即标准Qwen编辑工作流程中期望的最终结果。 在Photoshop中编辑图像,增加高斯模糊,使皮肤色调更平滑,降低皮肤纹理、色调和毛孔的可见性。 这些图像成为Qwen编辑训练中的“对照”(THE BEFORE)图像。 训练细节 该模型使用以下关键参数进行了微调,这些参数可以在随附的config.yaml文件中找到:

硬件:

GPU:NVIDIA RTX 5090 训练配置:

训练步数:5000 批量大小:1 梯度累积:1 学习率:1.0e-04 优化器:adamw8bit 噪声调度器:flowmatch 分辨率:模型在512、768和1024像素分辨率的数据集上进行了训练。 精度:bf16 网络架构:

类型:LoRA 线性秩和α:16 卷积秩和α:16 选择adamw8bit作为优化器意义重大,因为它减少了训练过程的内存占用,使得在消费级硬件上进行高效微调成为可能,且不会牺牲性能。flowmatch噪声调度器是一种现代方法,可以实现更高效的训练和高质量的图像生成。

LoRA架构的一个显著特点是线性和卷积层的α值均等于其各自的秩(16)。这种平衡方法是LoRA训练的常见起点,确保所学的适应性以成比例的缩放因子应用,这有助于防止过拟合,同时使模型能够有效地学习所需的新特征。

如何使用 要使用此LoRA,您需要加载基础模型Qwen/Qwen-Image-Edit-2509,然后应用微调的LoRA权重,加载为qwen-edit-skin.safetensors。仓库中上传了之前版本的权重以供参考,但最终版本是qwen-edit-skin.safetensors。您还可以利用仓库中附带的ComfyUI示例工作流程来比较不同权重下的结果。

建议的权重在1到1.5之间,提供的示例仅显示了最高达2的权重,以展示效果过强的LoRA效果。

预期用途 该LoRA旨在用于创意和艺术目的,以增强数字图像中人类皮肤的真实感。它可以被以下人群使用:

数字艺术家:为角色的皮肤添加更精细的细节和纹理。 摄影师:用于修饰和增强肖像。 AI艺术爱好者:生成更逼真的人物图像。 限制和偏见 该模型是对大规模预训练模型的微调,可能带有其固有的一些偏见。该LoRA的训练数据集专注于改善皮肤细节,可能无法平等代表人类所有肤色和类型的多样性。用户应意识到这一点,并负责任地使用该模型。模型的输出受输入提示的影响,鼓励用户使用描述性和包容性的语言来引导生成过程。

免责声明:该模型旨在用于艺术和创意目的。用户对其创作的内容负责,并应遵守道德准则,尊重个人的隐私和尊严。

触发词 您应使用“使主体的皮肤细节更加突出和自然”来触发图像生成。 可以发现,LoRa权重越高,画面的颗粒感(真实感)越强。

image

返图区

暂无返图