sencond time
本程序的主要功能是进行文本的查重,我们手上拥有一个1000000数据量的数据系统库,根据数据量,超过连续50个字符重复即为抄袭,同时能查出各个句子与文章整体的抄袭率,算法上使用的是KMP算法。
版权所有:中国计算机学会技术支持:开源发展技术委员会 京ICP备13000930号-9 京公网安备 11010802032778号