RJUA-QA(RenJi hospital department of Urology and Antgroup collaborative Question and Answer dataset)是一个创新性的医疗泌尿专科QA推理数据集。这一数据集是由蚂蚁集团医疗大模型团队(AntGroup Medical LLM)与上海交通大学医学院附属仁济医院泌尿科(Department of Urology, Shanghai Jiao Tong University School of Medicine Affiliated Renji Hospital)的专家团队联手打造。数据集的开发旨在将真实临床经验中的患者数据转化为虚拟的患者临床对话,以问答对(Q-context-A)的形式展现,数据集的生产由AI技术和专家团队深度合作,提高效率的同时数据集的准确性也有严格的保证。本数据集的病例数据由专业医生的根据临床经验编写而成,因此不涉及任何医患个人隐私。
@misc{lyu2023rjuaqa,
title={RJUA-QA: A Comprehensive QA Dataset for Urology},
author={Shiwei Lyu and Chenfei Chi and Hongbo Cai and Lei Shi and Xiaoyan Yang and Lei Liu and Xiang Chen and Deng Zhao and Zhiqiang Zhang and Xianguo Lyu and Ming Zhang and Fangzhou Li and Xiaowei Ma and Yue Shen and Jinjie Gu and Wei Xue and Yiran Huang},
year={2023},
eprint={2312.09785},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
RJUA-QADatasets: 蚂蚁-仁济泌尿专科QA数据集
English Version
数据集概况
RJUA-QA(RenJi hospital department of Urology and Antgroup collaborative Question and Answer dataset)是一个创新性的医疗泌尿专科QA推理数据集。这一数据集是由蚂蚁集团医疗大模型团队(AntGroup Medical LLM)与上海交通大学医学院附属仁济医院泌尿科(Department of Urology, Shanghai Jiao Tong University School of Medicine Affiliated Renji Hospital)的专家团队联手打造。数据集的开发旨在将真实临床经验中的患者数据转化为虚拟的患者临床对话,以问答对(Q-context-A)的形式展现,数据集的生产由AI技术和专家团队深度合作,提高效率的同时数据集的准确性也有严格的保证。本数据集的病例数据由专业医生的根据临床经验编写而成,因此不涉及任何医患个人隐私。
RJUA-QA数据集共含2132个问答对,每对问答由医生根据临床经验编写的问题(Question)、专家提供的回答(Answer)以及相关的推理上下文(Context)构成,这些上下文信息源自中国泌尿外科和男科疾病诊断治疗指南。本数据集包含了从2019年至2023年期间收集的泌尿科疾病数据,这些数据涵盖了门诊诊断、急诊抢救、住院手术及日常科普等多种医疗情境,确保了数据集在多个维度上的全面性和深度。数据集专注于泌尿科的10个子专业领域,包括但不限于泌尿系肿瘤、结石、前列腺疾病、男性健康、尿控制障碍、泌尿道修复手术、儿童泌尿疾病和肾脏移植,涵盖了泌尿科就诊97.6%以上患者的情况。由上海仁济医院泌尿科的专业医生团队参与构建,RJUA-QA数据集不仅确保了数据的真实性和准确性,还提供了在实际医疗环境中的深度应用价值。
数据集特点与价值
本数据集旨在提高大型语言模型在医疗诊断推理方面的能力,并作为在严肃可控场景下应用的评测基准。后续团队将持续优化数据集,为人工智能在医疗领域的研究与应用提供有力支持。
数据集标注流程与标准
数据清洗
主要目的是去除数据中的不相关或冗余的信息,包括纠正拼写错误、统一格式、删除重复数据以及处理缺失或不完整的数据条目等。
数据去噪
主要目的是识别并消除数据中可能影响后续分析的任何噪声。这些噪声主要来自于数据收集、传输或处理过程中的错误,采用诸如过滤、异常值检测和统计方法等手段来平滑数据。
结构化数据抽取
主要目的是将数据系统地组织和转换成适合分析或模型开发的格式,主要包括解析文本数据以提取相关字段,将非结构化或半结构化数据转换成表格格式,以及对数据进行分类或编码以简化后续处理步骤。
Context匹配
使用说明
数据格式
问题、文档和答案均以纯文本形式存储,以JsonLines格式提供。
数据集中划分为3个文件,其中训练集和验证集用于模型训练和验证,测试集用于模型推理指标评测。
每个文件的具体字段包括:
推理评估指标
本数据集设计的评测任务主要目标是针对基于虚拟患者问题以及专科医生回答,待评测模型需参考医生给出的相关医学知识作为context,比较模型产出的回答结果与专科医生回答结果的一致性。具体评估指标设计如下:
F1 Score:
Precision (P):
Recall (R):
F1 Score:
Average F1 Score:
RougeL Score:
P (Precision):
R (Recall):
Rouge-L:
引用
如果你觉得我们的工作有帮助,使用了我们的数据集,请引用下列说明。后续我们会持续优化数据集,并更新可引用的arxiv论文。
数据集下载
您可以在OpenKG的QJUA-QA下载本数据集
如有任何关于数据集的问题或建议,请通过以下方式与我们联系:chichenfei@renji.com,huangyiran@renji.com, hongbo.chb@antgroup.com , zhanying@antgroup.com
注意:在使用数据集时,请确保遵循相关法律法规和数据隐私政策。