Update README.md
在AI PC大语言模型推理场景下,因大模型任务的特殊性,端侧设备资源算力有限而无法满足大模型的需求。因此,为了解决大模型任务在端侧场景下的应用,使大模型能高效使用端侧设备上各种有限的资源,本研究期望提供一种低比特量化加速技术,通过模型的低比特量化计算,缓解大模型在端侧算力不足的问题。
李真能 lizhenneng@kylinos.cn
[1] 麒麟软件有限公司可提供软件开发环境
©Copyright 2023 CCF 开源发展委员会 Powered by Trustie& IntelliDE 京ICP备13000930号
赛题题目:基于量化技术的AI PC推理加速
赛题说明:
在AI PC大语言模型推理场景下,因大模型任务的特殊性,端侧设备资源算力有限而无法满足大模型的需求。因此,为了解决大模型任务在端侧场景下的应用,使大模型能高效使用端侧设备上各种有限的资源,本研究期望提供一种低比特量化加速技术,通过模型的低比特量化计算,缓解大模型在端侧算力不足的问题。
赛题要求:
评分标准:
功能完整性(40%):
性能优化(30%):
代码规范性(20%):
文档质量(10%):
赛题联系人:
李真能 lizhenneng@kylinos.cn
参考资料:
参赛资源支持:
[1] 麒麟软件有限公司可提供软件开发环境