本工具旨在系统建模开源 AI 生态系统中的资源依赖关系,其中“资源”主要包括 Hugging Face 平台上的模型与数据集。工具构建了一个基于真实元数据的异构资源依赖网络,并提供结构分析、节点级可信性风险量化与可视化能力,帮助识别生态系统中的高风险资源与关键传播路径,为风险评估与治理决策提供数据支持。
本工具旨在系统建模开源 AI 生态系统中的资源依赖关系,其中“资源”主要指模型与数据集。工具基于真实世界的元数据(如 Hugging Face 平台),构建异构依赖网络,分析其结构特征与演化模式,并对节点级的可信性风险进行量化评估。目标在于识别潜在的高风险资源,为开源 AI 生态系统中的风险识别、评估与治理策略提供量化依据。
开源 AI 资源依赖建模与可信性风险量化工具
项目简介
本工具旨在系统建模开源 AI 生态系统中的资源依赖关系,其中“资源”主要包括 Hugging Face 平台上的模型与数据集。工具构建了一个基于真实元数据的异构资源依赖网络,并提供结构分析、节点级可信性风险量化与可视化能力,帮助识别生态系统中的高风险资源与关键传播路径,为风险评估与治理决策提供数据支持。
功能特点
1. 数据集发布
我们开放本研究中使用的数据,便于社区复现与扩展分析:
_id,createdAt,downloads,id,library_name,likes,pipeline_tag,private以及多个模型相关标签,如tag-base_model,tag-dataset,tag-license等。_id,author,createdAt,description,downloads,likes,private,以及诸如tag-license,tag-language,tag-task_categories等标签字段。2. 网络结构可视化
本工具支持交互式图网络展示,基于 Neo4j 图数据库与 Neovis.js 前端框架。支持三类查询视图:
技术栈
复现步骤
1. 环境依赖安装
2. 数据预处理
3. 构建资源依赖图
4. 节点可信性风险评估
5. 可视化界面
打开本地文件:
6. 图数据库配置
参考官方文档完成 CSV 导入与数据库配置:https://neo4j.com/docs/
项目结构说明
数据字段说明
models.csv
dataset.csv
授权协议
代码: Apache License 2.0
数据: CC BY 4.0 国际协议(署名共享)
联系:
如有问题或建议,欢迎通过 GitLink issue 区进行反馈与交流。