Initial commit
ACP_Bench 是由 IBM 研究团队开发的一个基准数据集,旨在评估大型语言模型(LLMs)在动作(Action)、变化(Change)和规划(Planning)方面的推理能力
©Copyright 2023 CCF 开源发展委员会 Powered by Trustie& IntelliDE 京ICP备13000930号
public_dataset_20250625104959