Update README.md
在算力需求爆发式增长的背景下,CPU与硬件加速器(如NPU/GPU)的深度协同成为突破计算瓶颈的核心方向。本赛题基于ARM系列处理器(例如鲲鹏920系列)和Linux系列操作系统,要求开发者构建高效异构加速系统,可通过指令集优化、任务卸载、内存共享等技术提升大模型推理整体性能,重点考察异构资源调度、跨设备通信优化等关键技术,推动自主可控的异构计算架构发展。
CPU使用ARM系列处理器(例如鲲鹏920系列);操作系统基于较新的Linux内核(6.6及以上);可自由选择一种加速卡(昇腾/NVIDIA/天数智芯等); 实现CPU与加速器的动态任务分配机制(如基于负载预测的任务拆分);可以(但不强制)使用ARM NEON/SVE指令集优化CPU侧计算模块;设计CPU与加速器间的零拷贝数据传输方案;
若参赛者使用鲲鹏系列处理器+openEuler操作系统,可由华为公司负责提供相应资源
https://www.chaspark.com/#/races/competitions/1136097463933284352
©Copyright 2023 CCF 开源发展委员会 Powered by Trustie& IntelliDE 京ICP备13000930号
赛题题目:基于Linux操作系统的异构融合推理加速系统
赛题说明:
在算力需求爆发式增长的背景下,CPU与硬件加速器(如NPU/GPU)的深度协同成为突破计算瓶颈的核心方向。本赛题基于ARM系列处理器(例如鲲鹏920系列)和Linux系列操作系统,要求开发者构建高效异构加速系统,可通过指令集优化、任务卸载、内存共享等技术提升大模型推理整体性能,重点考察异构资源调度、跨设备通信优化等关键技术,推动自主可控的异构计算架构发展。
赛题要求:
CPU使用ARM系列处理器(例如鲲鹏920系列);操作系统基于较新的Linux内核(6.6及以上);可自由选择一种加速卡(昇腾/NVIDIA/天数智芯等); 实现CPU与加速器的动态任务分配机制(如基于负载预测的任务拆分);可以(但不强制)使用ARM NEON/SVE指令集优化CPU侧计算模块;设计CPU与加速器间的零拷贝数据传输方案;
输出成果:
评分标准:
赛题联系人:
参考资料:
参赛资源支持:
若参赛者使用鲲鹏系列处理器+openEuler操作系统,可由华为公司负责提供相应资源
赛题交流讨论链接:
https://www.chaspark.com/#/races/competitions/1136097463933284352