Delete show.png
如图所示,只需提供少量示例图片即可识别该组图片的风格,并通过提示词如 “A photo of XXX with S_0 style” 来生成具有该风格的对应物体图像。算法有效地捕捉了风格特征,从而实现精确的图像生成。
本项目包含了第四届计图挑战赛计图 - 风格迁移图片生成赛题的代码实现。近年来随着扩散模型的发展,涌现了一大批图片生成或者编辑的算法,其中一个重要的课题就是可控生成。在可控图片生成中一个相当有艺术性的研究课题是风格迁移问题:旨在将一种图像的风格应用到另一张图像上,同时保留后者的内容结构。
本项目的特点是:
本项目可在 1 张 4090 上运行,训练时间约为 1 小时。
首先按照 JDiffusion 的安装指导安装必要的依赖,除此之外还需要安装 peft 库依赖。
pip install accelerate==0.27.2 pip install peft==0.10.0
或者执行以下命令安装必要的依赖
conda env create -f environment.yml
预训练模型模型下载地址为 https://huggingface.co/stabilityai/stable-diffusion-2-1
https://huggingface.co/stabilityai/stable-diffusion-2-1
为了提升模型的表现,本项目对输入图像进行了系统化的数据预处理和数据增强操作。
图像大小调整将所有输入图像统一调整为指定的尺寸(512×512),使其符合模型输入的要求。
随机翻转以 0.1 的概率对图像进行随机的水平或垂直翻转,以增加数据集的多样性,增强模型对不同图像方向的鲁棒性。
随机旋转对图像进行 0.1 弧度的随机旋转,使得模型学习到更加丰富的旋转不变性,进一步增加数据的多样性。
随机仿射变换应用随机仿射变换,使得模型更好地适应数据中的几何变换。
图像归一化使用均值为 0.5、标准差为 0.5 的归一化操作,提高模型训练的稳定性,加速收敛,并提升整体性能。
单卡训练可运行以下命令:
./train.sh
生成测试集上的结果可以运行以下命令:
python test.py
https://pan.baidu.com/s/1QDfQ1L60j5-r0YENssPKbQ?pwd=6666
https://github.com/ffww11/Jittor---Money-Tree---Task-B-Style-Transfer-Image-Generation-Challenge
李祥 QQ:1739781578
余桉然 QQ:2648521315
冯威 QQ:2824285778
第四届计图人工智能挑战赛-赛题二:风格迁移图片生成赛题-摇钱树
©Copyright 2023 CCF 开源发展委员会 Powered by Trustie& IntelliDE 京ICP备13000930号
Jittor B 榜风格迁移图片生成赛题 基于 Dreambooth-lora 的风格图片微调算法 - [ 摇钱树 ] 战队
简介
本项目包含了第四届计图挑战赛计图 - 风格迁移图片生成赛题的代码实现。近年来随着扩散模型的发展,涌现了一大批图片生成或者编辑的算法,其中一个重要的课题就是可控生成。在可控图片生成中一个相当有艺术性的研究课题是风格迁移问题:旨在将一种图像的风格应用到另一张图像上,同时保留后者的内容结构。
本项目的特点是:
安装
本项目可在 1 张 4090 上运行,训练时间约为 1 小时。
运行环境
安装依赖
首先按照 JDiffusion 的安装指导安装必要的依赖,除此之外还需要安装 peft 库依赖。
或者执行以下命令安装必要的依赖
预训练模型
预训练模型模型下载地址为
https://huggingface.co/stabilityai/stable-diffusion-2-1
数据预处理
为了提升模型的表现,本项目对输入图像进行了系统化的数据预处理和数据增强操作。
数据预处理步骤
图像大小调整
将所有输入图像统一调整为指定的尺寸(512×512),使其符合模型输入的要求。
随机翻转
以 0.1 的概率对图像进行随机的水平或垂直翻转,以增加数据集的多样性,增强模型对不同图像方向的鲁棒性。
随机旋转
对图像进行 0.1 弧度的随机旋转,使得模型学习到更加丰富的旋转不变性,进一步增加数据的多样性。
随机仿射变换
应用随机仿射变换,使得模型更好地适应数据中的几何变换。
图像归一化
使用均值为 0.5、标准差为 0.5 的归一化操作,提高模型训练的稳定性,加速收敛,并提升整体性能。
训练
单卡训练可运行以下命令:
推理
生成测试集上的结果可以运行以下命令:
数据集、采样参数json、lora权重下载地址
https://pan.baidu.com/s/1QDfQ1L60j5-r0YENssPKbQ?pwd=6666
Github 项目链接
https://github.com/ffww11/Jittor---Money-Tree---Task-B-Style-Transfer-Image-Generation-Challenge
联系方式
李祥 QQ:1739781578
余桉然 QQ:2648521315
冯威 QQ:2824285778