Merge pull request #4 from pcuenca/patch-1 README: add link to model in HF
Merge pull request #4 from pcuenca/patch-1
README: add link to model in HF
孙博远1* · 金莫迪1* · 尹博文1 · 侯淇彬1†
1南开大学 天津市视觉计算与智能感知重点实验室(VCIP)
*共同第一作者 †通讯作者
English | 简体中文
DepthAnything-AC 是一个基于 DepthAnything-V2 微调的鲁棒单目深度估计(MDE)模型,专为在各种多样化和具有挑战性的环境条件下进行零样本深度估计而设计,包括低光照、恶劣天气和传感器失真。
为了解决损坏场景中缺乏高质量标注的问题,我们引入了一个轻量级的无监督一致性正则化框架,使模型能够在无标签数据上进行训练。此外,我们提出的空间距离约束帮助模型学习几何关系,增强语义边界和精细细节。
git clone https://github.com/your-repo/Depth-Anything-AC cd Depth-Anything-AC conda create -n depth_anything_ac python=3.9 conda activate depth_anything_ac pip install -r requirements.txt
从huggingface下载预训练检查点:
mkdir checkpoints cd checkpoints # (可选) 使用huggingface镜像 export HF_ENDPOINT=https://hf-mirror.com # 从huggingface下载DepthAnything-AC模型 huggingface-cli download --resume-download ghost233lism/DepthAnything-AC --local-dir ghost233lism/DepthAnything-AC
我们也在Google Drive提供DepthAnything-AC模型:下载
我们在 tools/ 中提供了单张/批量图像输入的快速推理脚本。请参考推理获取详细信息。
tools/
我们提供DepthAnything-AC的完整训练过程,包括一致性正则化、空间距离提取/约束和广泛使用的仿射不变损失函数。
准备你在 configs/ 中的配置文件并运行:
configs/
bash tools/train.sh <num_gpu> <port> <dataset>
我们提供对DA-2K、增强DA-2K、KITTI、NYU-D、Sintel、ETH3D、DIODE、NuScenes-Night、RobotCar-night、DS-rain/cloud/fog、KITTI-C基准的直接评估。您可以参考 configs/ 了解更多详情。
bash tools/val.sh <num_gpu> <port>
在增强的多条件DA-2K基准上的定量结果,包括复杂光照和气候条件。评估指标为准确率 ↑。
在包括夜间场景、恶劣天气条件和复杂环境因素的挑战性真实世界场景上的零样本评估结果。所有结果使用ViT-S编码器。
粗体:最佳性能,下划线:第二佳性能。NuScenes-夜间和RobotCar-夜间代表夜间驾驶场景。DS-雨、DS-云和DS-雾是DrivingStereo数据集。
在合成KITTI-C损坏基准上的零样本评估结果,测试对各种图像退化和损坏的鲁棒性。
KITTI-C包含合成损坏:暗光(低光照条件)、雪(天气模拟)、运动(运动模糊)和高斯(噪声损坏)。
如果您发现这项工作有用,请考虑引用:
@article{depth_anything_ac, title={Depth Anything at Any Condition}, author={Sun, Boyuan and Modi Jin and Bowen Yin and Hou, Qibin}, journal={arXiv preprint arXiv:XXXX.XXXXX}, year={2025} }
本代码采用知识共享署名-非商业性使用 4.0 国际许可协议,仅限非商业用途。 请注意,任何商业使用本代码都需要在使用前获得正式许可。
如有技术问题,请联系 sbysbysby123[AT]gmail.com 或 jin_modi[AT]mail.nankai.edu.cn
如需商业许可,请联系 andrewhoux[AT]gmail.com。
我们感谢DepthAnything和DepthAnything V2作者的基础性工作。我们也感谢DINOv2提供的强大视觉编码器,CorrMatch提供的代码库,以及RoboDepth的贡献。
Depth Anything At Any Condition
孙博远1* · 金莫迪1* · 尹博文1 · 侯淇彬1†
1南开大学 天津市视觉计算与智能感知重点实验室(VCIP)
*共同第一作者 †通讯作者
English | 简体中文
DepthAnything-AC 是一个基于 DepthAnything-V2 微调的鲁棒单目深度估计(MDE)模型,专为在各种多样化和具有挑战性的环境条件下进行零样本深度估计而设计,包括低光照、恶劣天气和传感器失真。
为了解决损坏场景中缺乏高质量标注的问题,我们引入了一个轻量级的无监督一致性正则化框架,使模型能够在无标签数据上进行训练。此外,我们提出的空间距离约束帮助模型学习几何关系,增强语义边界和精细细节。
新闻
模型架构
安装
环境要求
安装步骤
使用
获取 Depth-Anything-AC 模型
从huggingface下载预训练检查点:
我们也在Google Drive提供DepthAnything-AC模型:下载
快速推理
我们在
tools/中提供了单张/批量图像输入的快速推理脚本。请参考推理获取详细信息。训练
我们提供DepthAnything-AC的完整训练过程,包括一致性正则化、空间距离提取/约束和广泛使用的仿射不变损失函数。
准备你在
configs/中的配置文件并运行:评估
我们提供对DA-2K、增强DA-2K、KITTI、NYU-D、Sintel、ETH3D、DIODE、NuScenes-Night、RobotCar-night、DS-rain/cloud/fog、KITTI-C基准的直接评估。您可以参考
configs/了解更多详情。实验结果
定量结果
DA-2K多条件鲁棒性结果
在增强的多条件DA-2K基准上的定量结果,包括复杂光照和气候条件。评估指标为准确率 ↑。
真实复杂基准上的零样本相对深度估计
在包括夜间场景、恶劣天气条件和复杂环境因素的挑战性真实世界场景上的零样本评估结果。所有结果使用ViT-S编码器。
粗体:最佳性能,下划线:第二佳性能。NuScenes-夜间和RobotCar-夜间代表夜间驾驶场景。DS-雨、DS-云和DS-雾是DrivingStereo数据集。
合成KITTI-C基准上的零样本相对深度估计
在合成KITTI-C损坏基准上的零样本评估结果,测试对各种图像退化和损坏的鲁棒性。
KITTI-C包含合成损坏:暗光(低光照条件)、雪(天气模拟)、运动(运动模糊)和高斯(噪声损坏)。
引用
如果您发现这项工作有用,请考虑引用:
许可证
本代码采用知识共享署名-非商业性使用 4.0 国际许可协议,仅限非商业用途。 请注意,任何商业使用本代码都需要在使用前获得正式许可。
联系方式
如有技术问题,请联系 sbysbysby123[AT]gmail.com 或 jin_modi[AT]mail.nankai.edu.cn
如需商业许可,请联系 andrewhoux[AT]gmail.com。
致谢
我们感谢DepthAnything和DepthAnything V2作者的基础性工作。我们也感谢DINOv2提供的强大视觉编码器,CorrMatch提供的代码库,以及RoboDepth的贡献。