封面、摘要、緒論、第一章、第二章、等等這樣一系列的都會各自分成一個片段來檢測,每一個片段都計算出一個相似度,再通過這樣每章的相似度來計算出整篇論文的總重復率。 當知網查重系統(tǒng)識別到你論文中有某句話涉嫌抄襲的時候,它就會對這句話的前面后面部分都重點進行模糊識別,這個時候判斷標準就變得更嚴格,僅僅加一些副詞或虛詞 (比如“的”、“然后”、“但是”、“所以”此類詞語)是能夠識別出來的。 在知網查重進行中,檢測系統(tǒng)只能識別文字部分,論文中的圖片、word域代碼、mathtype編輯的公式、是不檢測的,因為檢測系統(tǒng)尚無法識別這些復雜的內容格式。
知網論文查重系統(tǒng)計算的總字數,是Word文檔里統(tǒng)計的字符總數(計空格),而不是單純的依據Word里所統(tǒng)計的字數。 所以說,不合理的排版(空格)格式,對于各位專家學者們進行知網論文查重是有著不小的阻礙作用的。 知網查重時表格里面的內容也會算字數,而簡單的Word統(tǒng)計的時候一般表格統(tǒng)計不到字數。 這也就是說,知網論文查重入口可以有效的辨別表格是否是重復的的問題。 每篇文章基本都會有英文摘要或者英文參考文獻,對于英文更占字符數了。
檢測偏差又是什么呢,我們看下面的中國知網論文查重的檢測報告。 是不是很驚喜! 很多同學遇到這個情況就會說,什么破檢測,根本就不是一回事,怎么也算是重復呢。 是的,這個就是知網查重系統(tǒng)的局限了,論文查重檢測系統(tǒng)的最基本檢測原理就是對比,所以在圖片中出現(xiàn)的兩句話里,因為重復的文字超過了系統(tǒng)設定的閾值,就被判斷為重復了。
目前,國內有三家官方權威數據庫平臺:中國知網、維普、萬方,相對的,也只有這三家推出的查重系統(tǒng)才被各大高校認可,而普及率最高的,特別是針對畢業(yè)論文和學術期刊投稿論文,是知網查重系統(tǒng)。 知網查重系統(tǒng)已經推出10年了,重復率算法現(xiàn)在已經相當成熟。 但是有一點大家需要知道,知網查重系統(tǒng)的重復率算法,從來沒對外公布。