upload chariot ds v0.1
View English
chariot-datasystem 是一款专为 AI 训推场景设计的分布式异构缓存系统。支持 HBM/DDR/SSD 异构介质池化缓存及 NPU 间异步并发高效数据传输,用于分布式 KVCache 缓存、模型参数缓存、高性能 replaybuffer 等场景。
chariot-datasystem 的主要特性包括:
chariot-datasystem 由三个部分组成:
多语言SDK:提供 Python/C++ 语言接口,封装 heterogeneous object 及 KV 接口,支撑业务实现数据快速读写。提供两种类型接口:
worker:chariot-datasystem 的核心组件,用于分配管理 DRAM/SSD 资源以及元数据,提供分布式多级缓存能力。
集群管理:依赖 ETCD,实现节点发现/健康检测,支持故障恢复及在线扩缩容。
chariot-datasystem 的部署视图如上图所示:
各组件间的数据传输协议如下:
安装 PyPI 上的版本:
pip install chariot-ds
安装自定义版本,可以参考文档:安装 chariot-ds 自定义版本
使用源码编译方式安装 chariot-ds 可以参考文档:源码编译安装 chariot-ds
chariot-ds 可基于 dscli 工具快速部署集群,参考文档:chariot-ds 进程部署
chariot-ds 还提供了基于 Kubernetes 容器化部署方式,参考文档:chariot-ds Kubernetes 部署
heterogeneous object、KV 和 object 语义的快速入门,可参考以下文档。
有关安装指南、教程和 API 的更多详细信息,请参阅用户文档
Apache License 2.0
版权所有:中国计算机学会技术支持:开源发展技术委员会 京ICP备13000930号-9 京公网安备 11010802032778号
View English
chariot-ds 介绍
chariot-datasystem 是一款专为 AI 训推场景设计的分布式异构缓存系统。支持 HBM/DDR/SSD 异构介质池化缓存及 NPU 间异步并发高效数据传输,用于分布式 KVCache 缓存、模型参数缓存、高性能 replaybuffer 等场景。
chariot-datasystem 的主要特性包括:
适用场景
架构
chariot-datasystem 由三个部分组成:
多语言SDK:提供 Python/C++ 语言接口,封装 heterogeneous object 及 KV 接口,支撑业务实现数据快速读写。提供两种类型接口:
worker:chariot-datasystem 的核心组件,用于分配管理 DRAM/SSD 资源以及元数据,提供分布式多级缓存能力。
集群管理:依赖 ETCD,实现节点发现/健康检测,支持故障恢复及在线扩缩容。
chariot-datasystem 的部署视图如上图所示:
各组件间的数据传输协议如下:
安装
pip 方式安装
安装 PyPI 上的版本:
安装自定义版本,可以参考文档:安装 chariot-ds 自定义版本
源码编译方式安装
使用源码编译方式安装 chariot-ds 可以参考文档:源码编译安装 chariot-ds
部署
进程部署
chariot-ds 可基于 dscli 工具快速部署集群,参考文档:chariot-ds 进程部署
Kubernetes 部署
chariot-ds 还提供了基于 Kubernetes 容器化部署方式,参考文档:chariot-ds Kubernetes 部署
快速入门
heterogeneous object、KV 和 object 语义的快速入门,可参考以下文档。
文档
有关安装指南、教程和 API 的更多详细信息,请参阅用户文档
许可证
Apache License 2.0