ywb commit1
图像生成任务一直以来都是十分具有应用场景的计算机视觉任务,从语义分割图生成有意义、高质量的图片仍然存在诸多挑战,如保证生成图片的真实性、清晰程度、多样性、美观性等。
其中,条件图像合成,即输入图片数据,合成真实感图片,在内容生成与图片编辑领域有广泛应用。一种条件图像合成的方式是,用两张图片作为输入,经过处理转换后生成一张新的图片,其中一张输入为语义分割图片(称为mask图),指示生成图片(称为gen图)的语义信息;另一张输入为参考风格图片(称为ref图),从色调等方面指示gen图的风格信息:
清华大学计算机系图形学实验室从Flickr官网收集了12000张高清(宽512、高384)的风景图片,并制作了它们的语义分割图。其中,10000对图片被用来训练。采用1000张图像进行测试。
在单张3090上训练了4天。
执行下面命令安装python等依赖
pip install -r requirements.txt
训练数据一共使用10000张图片
训练数据集
测试数据集使用A和B榜两种数据集1000张图片
A榜数据集
B榜数据集
—DP_GAN_jittor/train_resized
——imgs
——labels
预训练模型采用的是 Jittor 框架自带的 vgg19 模型,无需额外下载,在代码运行的过程中会载入到内存里。
Jittor
vgg19
在终端执行下列命令训练代码
CUDA_VISIBLE_DEVICES="2" python3 train.py --name jittor_train --input_path ./train_resized --batch_size 4
—DP_GAN_jittor/A(or B)
——val_B_labels_resized
——label_to_img.json
CUDA_VISIBLE_DEVICES="2" python3 test.py --name jittor_train4 --input_path ./B/val_B_labels_resized --json_path ./B/label_to_img.json --img_path ./train_resized/imgs --output_path ./results
©Copyright 2023 CCF 开源发展委员会 Powered by Trustie& IntelliDE 京ICP备13000930号
基于DP_GAN的风景生成器
简介
图像生成任务一直以来都是十分具有应用场景的计算机视觉任务,从语义分割图生成有意义、高质量的图片仍然存在诸多挑战,如保证生成图片的真实性、清晰程度、多样性、美观性等。
其中,条件图像合成,即输入图片数据,合成真实感图片,在内容生成与图片编辑领域有广泛应用。一种条件图像合成的方式是,用两张图片作为输入,经过处理转换后生成一张新的图片,其中一张输入为语义分割图片(称为mask图),指示生成图片(称为gen图)的语义信息;另一张输入为参考风格图片(称为ref图),从色调等方面指示gen图的风格信息:
清华大学计算机系图形学实验室从Flickr官网收集了12000张高清(宽512、高384)的风景图片,并制作了它们的语义分割图。其中,10000对图片被用来训练。采用1000张图像进行测试。
配置环境
运行环境
在单张3090上训练了4天。
安装依赖
执行下面命令安装python等依赖
训练数据集
训练数据一共使用10000张图片
训练数据集
测试数据集测
测试数据集使用A和B榜两种数据集1000张图片
A榜数据集
B榜数据集
训练
—DP_GAN_jittor/train_resized
——imgs
——labels
预训练模型采用的是
Jittor
框架自带的vgg19
模型,无需额外下载,在代码运行的过程中会载入到内存里。在终端执行下列命令训练代码
测试
—DP_GAN_jittor/A(or B)
——val_B_labels_resized
——label_to_img.json