目录
目录README.md

| 第四届计图挑战赛开源项目

Jittor 开放域少样本视觉分类赛题 A榜

| 赛题一:开放域少样本视觉分类赛题 A榜

结果排名(2024年8月01日)

结果排名(2024年7月19日)

简介

本项目基于CLIP预训练模型。

通过正样本推训练,学习样本是什么,同时通过负样本训练,学习样本不是什么。若仅通过正样本训练,难以区分相似类别,但是合并负样本结果得出的间接结论,就可以消除部分不正确类别。在一般分类任务中,这种双学习结合的方法,正选择和负排除相辅相成,有效地提高了整体分类精度。

主要方法框架如图: 方法框架 方法框架

安装

本项目可在 1 张 A800 上运行,训练时间约为 1 小时。

运行环境

  • ubuntu 20.04 LTS
  • python >= 3.9
  • jittor >= 1.3.0

安装依赖

执行以下命令安装 python 依赖

pip install -r requirements.txt

预训练模型

下载Jittor版本clip ViT-B/32预训练模型Vit-B-32.pkl放在jclip文件夹下。

数据预处理

将数据下载解压到 <root>/data 下。 数据目录结构如下

data/
    TestSetA
        image_0001.jpg
        image_0002.jpg
        ...
    TrainSet
        Animal
            Bear
                1.jpg
                2.jpg
                ...
            Bee
                ...
        Caltech-101
            ...
        Food-101
            ...
        Thu-dog
            ...

训练&验证

先提取数据特征:

python extract_features.py

之后进行训练

python main.py

最后结果保存在data/result.txt

致谢

此项目基于论文 Negative Yields Positive: Unified Dual-Path Adapter for Vision-Language Models 实现。

关于

第四届计图人工智能挑战赛 赛题一:开放域少样本视觉分类赛题 A榜 jittor

4.1 MB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

©Copyright 2023 CCF 开源发展委员会
Powered by Trustie& IntelliDE 京ICP备13000930号