first commit
以yolov5s为示例的混合量化,混合量化只适用于uint8量化,其通过将uint8部分层替换为int16的量化来达到提升精度的效果
模型量化后,修改pre_out_yolov5s_inputmeta.yml相关参数,将预处理加入网络中,修改pre_out_yolov5s_postprocess_file.yml相关参数,将反量化加入网络中,输出统一为float32
模型尾部节点在pnna核上计算比较耗时,将模型输出层提前输出来实现网络裁剪,将裁剪掉的部分节点放到其他计算模块上计算来提升性能
本项目提供使用netrans命令的典型示例。
©Copyright 2023 CCF 开源发展委员会 Powered by Trustie& IntelliDE 京ICP备13000930号
netrans_use_case
hybrid_quantization_yolov5s
以yolov5s为示例的混合量化,混合量化只适用于uint8量化,其通过将uint8部分层替换为int16的量化来达到提升精度的效果
pre_out_yolov5s
模型量化后,修改pre_out_yolov5s_inputmeta.yml相关参数,将预处理加入网络中,修改pre_out_yolov5s_postprocess_file.yml相关参数,将反量化加入网络中,输出统一为float32
crop_yolov5s
模型尾部节点在pnna核上计算比较耗时,将模型输出层提前输出来实现网络裁剪,将裁剪掉的部分节点放到其他计算模块上计算来提升性能