Initial commit
该项目的目的是为语言建模实验提供标准的培训和测试设置,包含10亿字。
版权所有:中国计算机学会技术支持:开源发展技术委员会 京ICP备13000930号-9 京公网安备 11010802032778号
fanshuai_dataset_20250908135902