Initial commit
AttaQ Dataset 是一个由 IBM 研究团队开发的对抗性问题数据集,包含 1402 个精心设计的对抗性问题,旨在评估大型语言模型(LLMs)生成有害或不期望响应的倾向。该数据集可以作为基准,用于评估 LLMs 输出内容的潜在危害性
©Copyright 2023 CCF 开源发展委员会 Powered by Trustie& IntelliDE 京ICP备13000930号
public_dataset_20250625100843