论文查重的目的,是为了避免同学们在写毕业论文的过程中,出现论文剽窃、抄袭等学术不端的行为,那么查重率是怎么计算的呢?
一般来说,重复率等于论文中的抄袭字数除以论文总字数。以知网为例,知网论文检测包括几个查重子系统,但它们计算规则是统一的。以全文来看,一篇论文提交检测,知网系统会将论文内容进行分割,比如按照句子或者几个字为一个区,将这部分提取出来,跟论文检测系统的文献库内容进行比对,相似的区,就拿出来进行标注,一般连续7-8个字完全相同算作抄袭。知网除了全文查重率部分,还有每章节的查重率,即本章节的重复字数除以本章节的总字数。