Merge pull request #101 from mmglove/master add transformer_big,hrnet 2.5
Merge pull request #101 from mmglove/master
add transformer_big,hrnet 2.5
本 repo 用于公开 PaddlePaddle 开源实现的各个学术界、工业界前沿模型,在训练期间的性能数据,同时提供了各模型性能测试的详细复现流程,以供参考。
同时,我们也在相同的硬件执行环境下,按照业内其它知名深度学习框架公开的代码和教程,测试了对应模型的性能数据,并记录具体日志和数据。
目前我们公开了计算机视觉和自然语言处理领域的两个典型模型的性能对比数据:
我们将持续开展性能测试工作,后续将逐步公开更多性能数据,敬请期待。
我们选择了 NGC 优化后的 TensorFlow、PyTorch、MxNet,作为性能的参考。
对这些框架的性能测试,我们选用相同的物理机执行,并严格参照各框架官网公布的测试方法进行复现。
代码库:DeepLearningExamples/PyTorch
代码库:DeepLearningExamples/MxNet
说明:
8 * V100-SXM2-16GB
8 * V100-SXM2-32GB
DALI/XLA
详细数据请见《Paddle ResNet50V1.5 性能测试报告》
单位:images/sec
images/sec
FP32测试
AMP测试
关于torch数据,按照官方文档反复重测了多次未达到官方的标准。若了解相关原因,欢迎issue我们。
详细数据请见《Paddle Bert Base 性能测试报告》
max_seq_len: 128
128
单位:sequences/sec
sequences/sec
版权所有:中国计算机学会技术支持:开源发展技术委员会 京ICP备13000930号-9 京公网安备 11010802032778号
Paddle Perf——Paddle框架性能测试
本 repo 用于公开 PaddlePaddle 开源实现的各个学术界、工业界前沿模型,在训练期间的性能数据,同时提供了各模型性能测试的详细复现流程,以供参考。
同时,我们也在相同的硬件执行环境下,按照业内其它知名深度学习框架公开的代码和教程,测试了对应模型的性能数据,并记录具体日志和数据。
目录
一、测试模型
目前我们公开了计算机视觉和自然语言处理领域的两个典型模型的性能对比数据:
1.计算机视觉
2.自然语言处理
我们将持续开展性能测试工作,后续将逐步公开更多性能数据,敬请期待。
二、供对比的业内深度学习框架
我们选择了 NGC 优化后的 TensorFlow、PyTorch、MxNet,作为性能的参考。
对这些框架的性能测试,我们选用相同的物理机执行,并严格参照各框架官网公布的测试方法进行复现。
1. NGC TensorFlow 1.15
2. NGC PyTorch
代码库:DeepLearningExamples/PyTorch
3. NGC MxNet
代码库:DeepLearningExamples/MxNet
三、测试结果
说明:
8 * V100-SXM2-16GB物理机做单机单卡、单机8卡测试;选用4台8 * V100-SXM2-32GB物理机做32卡测试。DALI/XLA的框架,以下测试为开启DALI/XLA的数据1. ResNet50V1.5
单位:
images/secFP32测试
AMP测试
2. Bert Base Pre-Training
max_seq_len:
128单位:
sequences/secFP32测试
AMP测试