第二,維普查重使用的是關鍵詞識別技術,也就是說,即使文章作者的部分語句是自己原創(chuàng)的,但是只要其關鍵詞和其他文章的關鍵詞重復,維普查重也可能會自動識別該部分為疑似剽竊部分,這也是為什么諸如法學、經(jīng)濟學等文章使用維普查重重復率高的原因所在。 關鍵詞識別技術雖然能夠在很大程度上識別大部分抄襲,但是也有可能會將作者的原創(chuàng)誤判為疑似剽竊部分,該計算規(guī)則相較于知網(wǎng)而言就更為嚴苛和不合理,這也是為什么大部分高?;蛘唠s志社不適用維普查重的原因之一。
維普查重可以直接到官網(wǎng)入口: http://www. PaperPass 主要檢測網(wǎng)絡資源,而維普主要檢測維普期刊資源的說法。 雖然他們的檢測結果只差了幾個百分點,都可以檢測出來是抄襲內容,但是相似的內容及來源卻是千差萬別。
知網(wǎng)和維普查重準確率較高,兩次均處于前三名。 由此可見即使是同一個數(shù)據(jù)庫,不同的文章查重準確率方面也會存在波動。 究其原因,最關鍵的還是每個查重軟件所包含的數(shù)據(jù)庫不一樣。 接下來,我們就來看看不同查重軟件的數(shù)據(jù)庫情況。 再講數(shù)據(jù)庫之前我們先來簡單介紹一下查重軟件之所以能夠檢測重復率的基本原理。 每個查重軟件都會有自己的對比庫,上傳進行檢測的論文都會與對比庫中的資料進行對比,來檢測論文內容是否重復。 不同查重軟件有不同的對比庫數(shù)據(jù)庫,且不同的查重軟件所能調用的數(shù)據(jù)庫數(shù)量不同。
Paper系列和維普查重系統(tǒng)功能、使用范圍、檢測范圍、檢測原理等方面都有著很大區(qū)別。 假設學校是維普查重,那么paperok等其他系列的查重軟件也只能做初稿檢測參考。 paper系列因為其閥值比維普偏高,很多其實不相似的內容都會標紅,題目、目錄、參考文獻這些本身在知網(wǎng)一般都會自動識別到,而系列卻統(tǒng)統(tǒng)標紅導致重復率過高,從而讓我們覺得系列檢測比維普嚴格的假象,系列檢測重復率虛高的假象背后嚴格并不是準確。