Cora GCN 节点分类

本项目使用 Jittor 和 JittorGeometric 实现两层 GCN，完成 Cora 数据集的节点分类、验证集评测及测试集预测。训练会自动保存最佳验证集模型，而不是使用最后一轮模型生成结果。

环境安装

通过environment.yml创建环境并安装依赖(python3.10)：

conda env create -f environment.yml
conda activate jittorgeometric

jittor_geometric需要从github手动下载:

git clone https://github.com/AlgRUC/JittorGeometric.git
cd JittorGeometric
pip install .

比赛提供的 cora.pkl 不提交到 Git。请将其放到以下位置：

data/
└── cora.pkl

也可以通过 --data-path /path/to/cora.pkl 指定其他位置。文件应包含：

默认配置位于 configs/cora_gcn.json，包含数据路径、设备、随机种子、学习率、训练轮数、隐藏层维度及 dropout 等参数。命令行参数优先于配置文件，例如：

python gcn.py train --config configs/cora_gcn.json --seed 123 --epochs 300

python gcn.py train --config configs/cora_gcn.json

运行后会在 outputs/cora_gcn/ 保存：

若要强制使用 CPU，可添加 --device cpu。

加载指定权重，输出训练集和验证集准确率并生成测试集预测：

python gcn.py predict \
  --config configs/cora_gcn.json \
  --checkpoint outputs/cora_gcn/best_model.pkl \
  --output result.json

缺少配置、数据或权重时，脚本会给出对应文件路径和修复提示。

评测指标为节点分类准确率：

accuracy = 预测正确的节点数 / 参与评测的节点总数

固定随机种子后可提高复现性，但不同 Jittor、CUDA 和底层算子版本仍可能造成轻微数值差异。线上成绩由比赛平台使用隐藏测试标签计算，本地无法计算测试集准确率。

.
├── configs/cora_gcn.json
├── data/README.md
├── gcn.py
├── requirements.txt
├── LICENSE
└── README.md