[1] Fernandez A. TeLU activation function for fast and stable deep learning[D]. University of South Florida, 2024.
[2] Gokcesu K, Gokcesu H. Generalized huber loss for robust learning and its efficient minimization for a robust statistics[J]. arXiv preprint arXiv:2108.12627, 2021.
[3] Zhao H, Jiang L, Jia J, et al. Point transformer[C]//Proceedings of the IEEE/CVF international conference on computer vision. 2021: 16259-16268.
第五届计图人工智能挑战赛: 人体骨骼生成赛题(赛题二) - 闪电松鼠队方案(B榜第二)
主要方法流程图
简介
本项目是第二届计图挑战赛“人体姿态与蒙皮权重生成”赛题的B榜第二名解决方案。我们针对骨骼节点空间位置预测和蒙皮权重预测两个核心任务,设计了相应的模型和训练策略。
PCT的基础上,融合了PointNet++的多尺度分层抽象思想 (MultiScaleSA) 和Transformer(Point_Transformer_Block) 来更有效地提取局部及全局特征。此外,我们设计了一个基于锚点的关节预测头 (JointPredictionHead),通过加权平均多个锚点预测的相对偏移来得到最终关节坐标,提升了预测的鲁棒性和精度。环境配置
本项目在以下环境测试通过:
我们提供两种方式来配置运行环境,请根据您的实际情况选择其一:
方案一:使用
environment.yaml(推荐)方案二:使用
requirements.txt2. 推理
所有推理参数都已设置为默认值,使用我们提供的最佳权重直接运行即可。
3. 训练
注意: 骨骼模型使用8卡分布式训练,需要预先安装
OpenMPI。训练过程中生成的权重和日志将保存在
output/目录下。Checkpoint 说明
我们提供的预训练权重位于
checkpoints/目录下:checkpoints/skeleton_pkl/: 包含骨骼模型在800轮训练中,最后4个epoch (796-799) 保存的模型权重。checkpoints/skin_pkl/: 包含蒙皮模型在400轮训练中,验证集skin_loss最低的3个模型权重。推理脚本会自动加载这些权重并进行加权平均集成,以获得更稳定和精确的预测结果。
线上结果
模型参数量
16.11M
致谢
感谢以下优秀的工作: https://github.com/MenghaoGuo/PCT.git
https://github.com/charlesq34/pointnet2.git
https://github.com/Jittor/PointCloudLib.git
参考文献
[1] Fernandez A. TeLU activation function for fast and stable deep learning[D]. University of South Florida, 2024.
[2] Gokcesu K, Gokcesu H. Generalized huber loss for robust learning and its efficient minimization for a robust statistics[J]. arXiv preprint arXiv:2108.12627, 2021.
[3] Zhao H, Jiang L, Jia J, et al. Point transformer[C]//Proceedings of the IEEE/CVF international conference on computer vision. 2021: 16259-16268.