[Test] repair custom ops for test_compute_slot_mapping (#7833)
What this PR does / why we need it?
repair custom ops for test_compute_slot_mapping
Does this PR introduce any user-facing change?
No
How was this patch tested?
nightly
- vLLM version: v0.18.0
- vLLM main: https://github.com/vllm-project/vllm/commit/35141a7eeda941a60ad5a4956670c60fd5a77029
Signed-off-by: ZT-AIA 1028681969@qq.com
版权所有:中国计算机学会技术支持:开源发展技术委员会
京ICP备13000930号-9
京公网安备 11010802032778号
vLLM Ascend Plugin
| 关于昇腾 | 官方文档 | #sig-ascend | 用户论坛 | 社区例会 |
English | 中文
最新消息 🔥
总览
vLLM 昇腾插件 (
vllm-ascend) 是一个由社区维护的让vLLM在Ascend NPU无缝运行的后端插件。此插件是 vLLM 社区中支持昇腾后端的推荐方式。它遵循[RFC]: Hardware pluggable所述原则:通过解耦的方式提供了vLLM对Ascend NPU的支持。
使用 vLLM 昇腾插件,可以让类Transformer、混合专家(MOE)、嵌入、多模态等流行的大语言模型在 Ascend NPU 上无缝运行。
准备
开始使用
推荐您使用以下版本快速开始使用:
贡献
请参考 CONTRIBUTING 文档了解更多关于开发环境搭建、功能测试以及 PR 提交规范的信息。
我们欢迎并重视任何形式的贡献与合作:
分支策略
vllm-ascend有主干分支和开发分支。
releases/v0.13.0是vllm-asend针对vLLMv0.13.0版本的开发分支。下面是维护中的分支:
请参阅版本策略了解更多详细信息。
社区例会
许可证
Apache 许可证 2.0,如 LICENSE 文件中所示。