Update PPT
以下内容均在项目根目录下
llama.cpp/
操作系统开源创新大赛 作品原创承诺书.pdf
RISC-V_Extreme.pptx/pdf
操作系统开源创新大赛项目说明书.pdf
演示视频.mp4
llama-cli
演示视频-GUI.mp4
resources/
resources/figure-gen/
resources/llama-frontend/
resources/results/
实际测试使用的二进制文件已发布至 发行版 / Releases.
为了直观展示优化带来的性能提升,我们对基础版 (Base) 和 RVV 优化版 (Optimized) 的核心指标进行了量化评估。更详细的数据参见我们的报告
187.1 s
100.3 s
46.4 %
2.63
3.95
50.1 %
2.61
4.17
59.8 %
延迟 (Latency):
吞吐量 (Throughput):
PP512(提示词长度 512), 表示使用 512 tokens 作为提示词时,每秒可以生成约 3.95 个 tokens TG128(生成长度 128), 表示在生成 128 tokens 时,每秒可以生成约 4.17 个 tokens
通过下面的 GIF 可以直观地看到优化前后用户体验或程序执行流程的差异。
以下图表是本次性能测试的部分数据可视化结果。
DeepSeek 等模型的兴起推动了端侧大模型的发展,而 RISC-V 架构凭借其开放性和可扩展性,在端侧推理终端中逐步占据一席之地。优化 RISC-V 端侧大模型推理技术,不仅能提升推理性能,还能推动 RISC-V 操作系统 AI 生态的完善,加速 RISC-V 智能操作系统的发展。 本赛题旨在通过优化大模型应用中的核心算子,在 RISC-V 架构上实现高效的推理性能,充分利用 RISC-V 向量和矩阵扩展指令集,以及多核计算体系架构,进一步提升大模型推理的计算速度和吞吐量。 推理框架方面,参赛者可以选择 llama.cpp 开源框架。操作系统环境为开源操作系统,要求参赛者基于此系统进行开发,提供全方位的优化方案。
李可 li_ke@hl-it.cn
©Copyright 2023 CCF 开源发展委员会 Powered by Trustie& IntelliDE 京ICP备13000930号
赛题题目:面向大模型应用的 RISC-V 向量和矩阵扩展算子优化
✅ 提交内容
以下内容均在项目根目录下
llama.cpp/路径下操作系统开源创新大赛 作品原创承诺书.pdfRISC-V_Extreme.pptx/pdf操作系统开源创新大赛项目说明书.pdf演示视频.mp4: 在荔枝派上运行llama-cli的视频演示视频-GUI.mp4: 运行前端界面进行演示的视频resources/resources/figure-gen/resources/llama-frontend/resources/results/实际测试使用的二进制文件已发布至 发行版 / Releases.
🚀 性能对比 (Performance Comparison)
为了直观展示优化带来的性能提升,我们对基础版 (Base) 和 RVV 优化版 (Optimized) 的核心指标进行了量化评估。更详细的数据参见我们的报告
核心指标 (Key Metrics)
187.1 s100.3 s46.4 %2.633.9550.1 %2.614.1759.8 %📖 指标说明 (Metric Definitions)
延迟 (Latency):
吞吐量 (Throughput):
🎬 效果演示 (Demos)
通过下面的 GIF 可以直观地看到优化前后用户体验或程序执行流程的差异。
📊 结果图表 (Result Graphs)
以下图表是本次性能测试的部分数据可视化结果。
赛题说明
DeepSeek 等模型的兴起推动了端侧大模型的发展,而 RISC-V 架构凭借其开放性和可扩展性,在端侧推理终端中逐步占据一席之地。优化 RISC-V 端侧大模型推理技术,不仅能提升推理性能,还能推动 RISC-V 操作系统 AI 生态的完善,加速 RISC-V 智能操作系统的发展。 本赛题旨在通过优化大模型应用中的核心算子,在 RISC-V 架构上实现高效的推理性能,充分利用 RISC-V 向量和矩阵扩展指令集,以及多核计算体系架构,进一步提升大模型推理的计算速度和吞吐量。 推理框架方面,参赛者可以选择 llama.cpp 开源框架。操作系统环境为开源操作系统,要求参赛者基于此系统进行开发,提供全方位的优化方案。
赛题要求
评分标准
功能完整性(40%)
性能优化(30%)
代码规范性(20%)
文档质量(10%)
赛题联系人
李可 li_ke@hl-it.cn
参考资料
参赛资源支持