可控开源社区

GitLink极速下载/Perf

同步镜像关注点赞复刻(Fork)

目录

hysunflower

Merge pull request #101 from mmglove/master
add transformer_big,hrnet 2.5

3年前209次提交

Bertadd transformer_big,hrnet 2.53年前
CtrDnnfix log5年前
DeepLabV3Pupdate log4年前
HRNetW18add transformer_big,hrnet 2.53年前
ResNet50V1.5add res50 2.53年前
Transformeradd transformer_big,hrnet 2.53年前
WideDeepfix log5年前
Word2Vecfix log5年前
utilsInitital more documents. (#11)5年前
LICENSEInitial commit5年前
README.mdadd perf2.3 gpu32 res4年前

Paddle Perf——Paddle框架性能测试

本 repo 用于公开 PaddlePaddle 开源实现的各个学术界、工业界前沿模型，在训练期间的性能数据，同时提供了各模型性能测试的详细复现流程，以供参考。

同时，我们也在相同的硬件执行环境下，按照业内其它知名深度学习框架公开的代码和教程，测试了对应模型的性能数据，并记录具体日志和数据。

目录

一、测试模型
- 1.计算机视觉
- 2.自然语言处理
二、供对比的业内深度学习框架
三、测试结果
- 1. ResNet50V1.5
- 2. Bert Base Pre-Training

一、测试模型

目前我们公开了计算机视觉和自然语言处理领域的两个典型模型的性能对比数据：

1.计算机视觉

ResNet50V1.5

2.自然语言处理

Bert Base Pre-Training

我们将持续开展性能测试工作，后续将逐步公开更多性能数据，敬请期待。

二、供对比的业内深度学习框架

我们选择了 NGC 优化后的 TensorFlow、PyTorch、MxNet，作为性能的参考。

对这些框架的性能测试，我们选用相同的物理机执行，并严格参照各框架官网公布的测试方法进行复现。

1. NGC TensorFlow 1.15

代码库：DeepLearningExamples/TensorFlow

2. NGC PyTorch

代码库：DeepLearningExamples/PyTorch

3. NGC MxNet
代码库：DeepLearningExamples/MxNet

三、测试结果

说明：

本次测试选用8 * V100-SXM2-16GB物理机做单机单卡、单机8卡测试；选用4台8 * V100-SXM2-32GB物理机做32卡测试。
测试中，我们尽可能复现不同框架的最好性能，因此以下测试结果默认打开了各个框架的各种加速功能/选项，如：
- 对于支持 DALI/XLA 的框架，以下测试为开启 DALI/XLA 的数据

1. ResNet50V1.5

详细数据请见《Paddle ResNet50V1.5 性能测试报告》

单位：images/sec
FP32测试

参数 PaddlePaddle NGC TensorFlow 1.15 NGC PyTorch NGC MXNet

GPU=1,BS=256 389.12 414.73 363.77 380.55

GPU=8,BS=256 2946.3 3275.93 2787.43 3002.8

GPU=32,BS=256 10984.436 12671.9 10523.32 -

AMP测试

参数	PaddlePaddle	NGC TensorFlow 1.15	NGC PyTorch	NGC MXNet
GPU=1,BS=256	1444.94	1173.38	773.30	1359.4
GPU=8,BS=256	10649.9	9310.31	5811.26	10494
GPU=32,BS=256	39972.13	33317.67	21259.81	-

关于torch数据，按照官方文档反复重测了多次未达到官方的标准。若了解相关原因，欢迎issue我们。

2. Bert Base Pre-Training

详细数据请见《Paddle Bert Base 性能测试报告》

max_seq_len: 128
单位：sequences/sec
FP32测试

参数 PaddlePaddle NGC TensorFlow 1.15 NGC PyTorch

GPU=1,BS=96 161.15 156.33 153.56

GPU=8,BS=96 1288.50 1231.74 1228.24

GPU=32,BS=96 4829.90 4238.5 3496.94
AMP测试

参数 PaddlePaddle NGC TensorFlow 1.15 NGC PyTorch

GPU=1,BS=96 653.97 530.28 630.61

GPU=8,BS=96 5234.17 4181.32 5044.04

GPU=32,BS=96 20054.43 16142.9 16610.6

关于

7.1 MB

邀请码

Gitlink（确实开源）

加入我们
官网邮箱：gitlink@ccf.org.cn

QQ群

QQ群

公众号

公众号

版权所有：中国计算机学会技术支持：开源发展技术委员会
京ICP备13000930号-9 京公网安备 11010802047560号