目录

jittor-手工智能-gcn-cora

计图挑战赛赛道一热身赛 —— 基于 GCN 的 Cora 引文网络节点分类

Jittor JittorGeometric License

项目简介

使用两层 GCN(Graph Convolutional Network)Cora 引文网络数据集 上完成 节点分类 任务。将 2708 篇学术论文分类到 7 个研究领域中。

验证集准确率: 80.80%,通过线: 70.00%。

环境安装

依赖

  • Python ≥ 3.8
  • Jittor ≥ 1.3
  • JittorGeometric ≥ 2.0

安装

# 安装 Jittor(推荐使用 conda 环境)
pip install jittor

# 安装 JittorGeometric
pip install git+https://github.com/AlgRUC/JittorGeometric.git

# 安装其他依赖
pip install -r requirements.txt

数据准备

  1. 从竞赛官方获取 cora.pkl 数据集文件
  2. 将文件放置于 data/ 目录下:
data/
└── cora.pkl

数据集包含 2708 个节点、5429 条边、1433 维特征、7 个类别。

训练

# 使用默认配置训练
python main.py

# 指定配置文件
python main.py --config configs/gcn_cora.yaml

# 自定义参数(命令行优先级高于配置文件)
python main.py --epochs 300 --lr 0.005 --seed 123

关键参数说明:

参数 默认值 说明
--config configs/gcn_cora.yaml 配置文件路径
--data-path data/cora.pkl 数据文件路径
--epochs 200 训练轮数
--lr 0.01 学习率
--seed 42 随机种子(保证可复现)
--output outputs/result.json 预测结果输出路径

评测 / 推理

训练完成后自动生成 result.json,格式如下:

{
    "1708": 0,
    "1709": 1,
    "1710": 3
}
  • key: 节点编号(字符串)
  • value: 预测类别(整数,0-6)

result.jsongcn.py(比赛提交代码)打包为 result.zip 即可提交评测。

结果说明

指标

**分类准确率 (Accuracy)**:预测正确的节点数 / 总节点数。

训练结果

指标 数值
训练集准确率 100.00%
验证集准确率 80.80%
测试集节点数 1000

各类别准确率(验证集)

类别 准确率
0 73.68%
1 86.42%
2 68.85%
3 97.44%
4 70.89%
5 88.89%
6 75.86%

可复现性

  • 固定随机种子 seed=42
  • 相同配置、相同环境下可得到相同结果
  • 验证集准确率稳定在 78%-81% 区间

项目结构

jittor-手工智能-gcn-cora/
├── main.py                 # 训练入口
├── configs/
│   └── gcn_cora.yaml       # 训练配置
├── src/
│   ├── __init__.py
│   ├── model.py            # GCN 模型定义
│   ├── data.py             # 数据加载与预处理
│   ├── train.py            # 训练与验证
│   ├── predict.py          # 推理与结果生成
│   └── utils.py            # 工具函数
├── scripts/
│   ├── train.sh            # 训练脚本
│   └── predict.sh          # 预测脚本
├── data/
│   └── README.md           # 数据说明
├── outputs/                # 输出目录(不提交)
├── requirements.txt
├── LICENSE
└── .gitignore

模型架构

输入 (2708, 1433)
    │
GCNConv (1433 → 256)
    │
ReLU
    │
Dropout (p=0.8)
    │
GCNConv (256 → 7)
    │
输出 (2708, 7) —— 7 类 logits

许可证

本项目采用 MIT License

引用

关于

手工智能队计图挑战赛赛道一热身赛:基于 JittorGeometric 框架,使用两层 GCN 在 Cora 引文网络数据集上完成节点分类任务,验证集准确率 80.80%。

39.0 KB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

版权所有:中国计算机学会技术支持:开源发展技术委员会
京ICP备13000930号-9 京公网安备 11010802047560号