Update README.md
该项目基于LLM和FAISS的抄袭检测与分析方法将这两种技术相结合,利用LLM对文本进行深度表示和分类,然后通过FAISS进行相似度搜索和聚类分析,从而实现对抄袭行为的检测和分析。该方法不仅可以识别出明显的抄袭行为,还可以发现隐蔽的抄袭手段,如改写、翻译等。并且利用LLM模型来制作出最后的分析报告。
该实验项目的数据集是我们自行整理的一个数据集 我们挑选了50篇检索增强领域的论文,利用CharGPT根据这50篇论文每篇的摘要生成5篇抄袭论文摘要,总共生成250个抄袭数据样本,同时让这50篇选中的论文互相作为非抄袭样本。
用 QT Creator 运行文件夹中 softwork.pro 文件即可查看项目的系统交互式界面。 界面利用QT Creator来实现,界面设计效果如下所示:
©Copyright 2023 CCF 开源发展委员会 Powered by Trustie& IntelliDE 京ICP备13000930号
基于大语言模型的抄袭检测系统
该项目基于LLM和FAISS的抄袭检测与分析方法将这两种技术相结合,利用LLM对文本进行深度表示和分类,然后通过FAISS进行相似度搜索和聚类分析,从而实现对抄袭行为的检测和分析。该方法不仅可以识别出明显的抄袭行为,还可以发现隐蔽的抄袭手段,如改写、翻译等。并且利用LLM模型来制作出最后的分析报告。
环境
数据集
该实验项目的数据集是我们自行整理的一个数据集 我们挑选了50篇检索增强领域的论文,利用CharGPT根据这50篇论文每篇的摘要生成5篇抄袭论文摘要,总共生成250个抄袭数据样本,同时让这50篇选中的论文互相作为非抄袭样本。
项目的整体设计图
界面
用 QT Creator 运行文件夹中 softwork.pro 文件即可查看项目的系统交互式界面。 界面利用QT Creator来实现,界面设计效果如下所示: