update data origin
本项目基于 Jittor (计图) 深度学习框架,实现了一个增强版的 Point Cloud Transformer (PCT) 模型,用于在 ModelNet40 数据集上进行 3D 点云分类任务。
相比于基础 PCT 模型,本代码进行了以下核心优化:
运行代码前,需确保环境中安装了以下依赖:
安装 Jittor:
python -m pip install jittor
(更多 Jittor 安装及 GPU 配置指南请参考 Jittor 官方文档)
项目期望 ModelNet40 数据集以预处理好的 .npy 格式存放。在项目根目录下创建一个 data/ 文件夹,并确保包含以下文件:
.npy
data/
├── data/ │ ├── train_points.npy # 形状: (N_train, 2048, 3) │ ├── train_labels.npy # 形状: (N_train,) │ └── test_points.npy # 形状: (N_test, 2048, 3) ├── pct.py └── README.md
(注:测试集标签 test_labels.npy 在预测生成脚本中是不需要的,代码将直接输出预测索引)。 数据集建议前往https://data.educoder.net/api/attachments/att-19d687a579c1e1252?type=application/x-zip-compressed下载。
test_labels.npy
通过命令行可直接运行 pct.py。代码将自动执行训练,并在训练完成后对测试集进行推理预测。
pct.py
python pct.py
通过传入不同的命令行参数可调整训练超参:
python pct.py --data_dir ./data --n_points 1024 --batch_size 32 --epochs 200 --lr 0.01 --seed 42
参数说明:
--data_dir
./data
--n_points
1024
--batch_size
32
--epochs
200
--lr
0.01
--seed
42
训练和推理完成后,项目会在当前目录下生成以下两个文件:
pct_model.pkl
result.json
{ "样本ID": 预测类别ID }
(B, 3, N)
128
256
p=0.4
A Jittor implementation of Point Cloud Transformer (PCT) for ModelNet40 classification
版权所有:中国计算机学会技术支持:开源发展技术委员会 京ICP备13000930号-9 京公网安备 11010802047560号
jittor PCT
本项目基于 Jittor (计图) 深度学习框架,实现了一个增强版的 Point Cloud Transformer (PCT) 模型,用于在 ModelNet40 数据集上进行 3D 点云分类任务。
主要特性
相比于基础 PCT 模型,本代码进行了以下核心优化:
环境依赖
运行代码前,需确保环境中安装了以下依赖:
安装 Jittor:
(更多 Jittor 安装及 GPU 配置指南请参考 Jittor 官方文档)
数据集准备
项目期望 ModelNet40 数据集以预处理好的
.npy格式存放。在项目根目录下创建一个data/文件夹,并确保包含以下文件:(注:测试集标签
test_labels.npy在预测生成脚本中是不需要的,代码将直接输出预测索引)。 数据集建议前往https://data.educoder.net/api/attachments/att-19d687a579c1e1252?type=application/x-zip-compressed下载。快速开始
通过命令行可直接运行
pct.py。代码将自动执行训练,并在训练完成后对测试集进行推理预测。基础运行
自定义参数运行
通过传入不同的命令行参数可调整训练超参:
参数说明:
--data_dir: 数据集存放路径 (默认:./data)--n_points: 每个样本采样的点云数量 (默认:1024)--batch_size: 训练和测试的批次大小 (默认:32)--epochs: 训练的总轮数 (默认:200)--lr: 初始学习率 (默认:0.01)--seed: 随机数种子,用于固定结果 (默认:42)输出产物
训练和推理完成后,项目会在当前目录下生成以下两个文件:
pct_model.pkl: 训练好的 Jittor 模型权重文件。result.json: 测试集的预测结果。格式为键值对{ "样本ID": 预测类别ID },可直接用于下游的评估或提交。模型结构简述 (EnhancedPCT)
(B, 3, N)的 3D 坐标点。128->256) 提取初始点云局部特征。1024维特征,通过 1D 卷积和全局最大池化 (Global Max Pooling) 生成全局形状特征向量。p=0.4) 和 ReLU 组成的 MLP 网络,最终输出 40 个类别的预测对数 (Logits)。