皮肤真实感Qwen image edit 2509 v1.0

触发词 : 使主体的皮肤细节更加突出和自然

Qwen Image Edit 2509版本大受欢迎，甚至在C站取代了Flux成为近期最佳开源绘画模型。

不过，Qwen Image原生模型虽好，却有个致命缺陷：皮肤太精致了。

在AI绘画方面，中国选手和欧美选手追求的方向不一致，中国人喜欢十级美颜效果，欧美人喜欢厚重的颗粒感。

为了改善Qwen Image的美颜过度的效果，有人开发出一个皮肤LoRa，可以实现更加真实的皮肤效果。

微调LoRA，提升Qwen-Image-Edit-2509中皮肤的真实感

该仓库包含一个微调的低秩适应（LoRA）模型，旨在增强图像中人类皮肤的真实感和细节。该LoRA是在强大的Qwen/Qwen-Image-Edit-2509模型基础上训练而成，利用其先进的图像编辑能力，专注于生成更自然、更详细的皮肤纹理。

该模型在本地RTX 5090上使用AI-Toolkit训练了5000步。生成的LoRA非常适合摄影师、数字艺术家以及任何希望提高生成或编辑图像中人物质量的人。

模型描述 qwen-edit-skin LoRA是Qwen/Qwen-Image-Edit-2509基础模型的专项微调。基础模型是一个多功能的图像编辑器，在多图像编辑和保持单图像一致性方面具有强大的能力，特别是在保持个人身份方面。在此基础上，该LoRA专注于人类皮肤的细微之处，增加了原始生成中可能缺失的细节和真实感。

训练是使用AI ToolKit的一个分支进行的，这是一个用于微调扩散模型的综合套件。数据集策划过程如下：

选取真实的人物肖像图像，且人物皮肤暴露在外。将这些图像标注为“目标”（THE AFTER）图像，即标准Qwen编辑工作流程中期望的最终结果。在Photoshop中编辑图像，增加高斯模糊，使皮肤色调更平滑，降低皮肤纹理、色调和毛孔的可见性。这些图像成为Qwen编辑训练中的“对照”（THE BEFORE）图像。训练细节该模型使用以下关键参数进行了微调，这些参数可以在随附的config.yaml文件中找到：

硬件：

GPU：NVIDIA RTX 5090 训练配置：

训练步数：5000 批量大小：1 梯度累积：1 学习率：1.0e-04 优化器：adamw8bit 噪声调度器：flowmatch 分辨率：模型在512、768和1024像素分辨率的数据集上进行了训练。精度：bf16 网络架构：

类型：LoRA 线性秩和α：16 卷积秩和α：16 选择adamw8bit作为优化器意义重大，因为它减少了训练过程的内存占用，使得在消费级硬件上进行高效微调成为可能，且不会牺牲性能。flowmatch噪声调度器是一种现代方法，可以实现更高效的训练和高质量的图像生成。

LoRA架构的一个显著特点是线性和卷积层的α值均等于其各自的秩（16）。这种平衡方法是LoRA训练的常见起点，确保所学的适应性以成比例的缩放因子应用，这有助于防止过拟合，同时使模型能够有效地学习所需的新特征。

如何使用要使用此LoRA，您需要加载基础模型Qwen/Qwen-Image-Edit-2509，然后应用微调的LoRA权重，加载为qwen-edit-skin.safetensors。仓库中上传了之前版本的权重以供参考，但最终版本是qwen-edit-skin.safetensors。您还可以利用仓库中附带的ComfyUI示例工作流程来比较不同权重下的结果。

建议的权重在1到1.5之间，提供的示例仅显示了最高达2的权重，以展示效果过强的LoRA效果。

预期用途该LoRA旨在用于创意和艺术目的，以增强数字图像中人类皮肤的真实感。它可以被以下人群使用：

数字艺术家：为角色的皮肤添加更精细的细节和纹理。摄影师：用于修饰和增强肖像。 AI艺术爱好者：生成更逼真的人物图像。限制和偏见该模型是对大规模预训练模型的微调，可能带有其固有的一些偏见。该LoRA的训练数据集专注于改善皮肤细节，可能无法平等代表人类所有肤色和类型的多样性。用户应意识到这一点，并负责任地使用该模型。模型的输出受输入提示的影响，鼓励用户使用描述性和包容性的语言来引导生成过程。

免责声明：该模型旨在用于艺术和创意目的。用户对其创作的内容负责，并应遵守道德准则，尊重个人的隐私和尊严。

触发词您应使用“使主体的皮肤细节更加突出和自然”来触发图像生成。可以发现，LoRa权重越高，画面的颗粒感（真实感）越强。

返图区