Initial commit

9个月前1次提交

README.mdInitial commit9个月前

README.md

fanshuai_model_20250908145529

关于

Florence-2是一款先进的视觉基础模型，采用提示式方法处理广泛的视觉和视觉-语言任务。Florence-2能够通过简单的文本提示来执行诸如字幕生成、物体检测和分割等任务。该模型利用了包含54亿个注释的FLD-5B数据集，这些注释覆盖了1.26亿张图像，从而掌握了多任务学习。模型的序列到序列架构使其在零样本和微调设置中表现出色，证明了其作为竞争性视觉基础模型的实力。

model modeltag-视觉问答 modeltype-pytorch

README.md

29.0 KB

邀请码