下载完整文档请点:
第一章 系统简介
1.1 系统概述
学位论文学术不端行为检测系统(简称“TMLC”)以《中国学术文献网络出版总库》为全文比对数据库,实现了对抄袭与剽窃、伪造、篡改等学术不端行为的快速检测,可供用户检测学位论文,并支持用户自建比对库。其系统示意图如图1所示。
图1 检测系统示意图
1.2 系统技术路线介绍
TMLC 采用CNKI 自主研发的自适应多阶指纹(AMLFP)特征检测技术,具有检测速度快,准确率,召回率较高,抗干扰性强等特征。
支持篇章、段落、句子各层级检测;
支持文献改写,多篇文献组合等各种文献变形检测;
支持研究生学位论文、图书专著等超长文献的学术不端检测。
CNKI自适应多阶指纹技术原理如图2所示:
图2 CNKI自适应多阶指纹技术原理图
对任意一篇需要检测的文献,系统首先对其进行分层处理,按照篇章、段落、句子等层级分别创建指纹,而比对资源库中的比对文献,也采取同样技术创建指纹索引。这样的分层多阶指纹结构,不仅可以满足我们对超长文献的快速检测,而且,因为我们的最小指纹粒度为句子,因此,也满足了系统对检准率和检全率的高要求。原则上,只要检测文献与比对文献存在一个相同的句子,就能被检测系统发现。
1.3 系统功能概述
系统主要功能包括:已发表文献检测、论文检测、问题库查询、自建比对库管理等。
◆已发表文献检测:指检测系统能够自动将属于用户的已正式发表的学位论文检索出来,并对每一篇已发表文献进行实时检测,快速给出检测结果。
◆论文检测:主要实现论文实时在线检测功能。
◆问题库查询:指用户可以将检测结果中确认有问题的文献放入到问题库,便于用户集中管理。
◆自建比对库:指管理人员可以选择将检测文献放入个人比对库或者批量上传文献作为个人比对库,该个人比对库即可作为以后学术不端文献检测的比对数据库,该自建个人比对库完全属于用户,其他用户无权使用。
1.4 系统目的
TMLC的目的是辅助各研究生培养单位对学位论文质量进行评估,为审查论文提供技术服务。检测系统在对论文进行检测之后,生成检测报告,为判断论文性质提供相关依据。