下面CNCNKI查重網(wǎng)就為畢業(yè)生們歸納下知網(wǎng)最新查重規(guī)則及原理如下,這個(gè)原理適用于市面所有檢測(cè)系統(tǒng)的: 1、知網(wǎng)查重是連續(xù)13字符相似就會(huì)判為重復(fù),13字符就相當(dāng)于6-7個(gè)中文漢字。
封面、摘要、緒論、第一章、第二章、等等這樣一系列的都會(huì)各自分成一個(gè)片段來檢測(cè),每一個(gè)片段都計(jì)算出一個(gè)相似度,再通過這樣每章的相似度來計(jì)算出整篇論文的總重復(fù)率。 當(dāng)知網(wǎng)查重系統(tǒng)識(shí)別到你論文中有某句話涉嫌抄襲的時(shí)候,它就會(huì)對(duì)這句話的前面后面部分都重點(diǎn)進(jìn)行模糊識(shí)別,這個(gè)時(shí)候判斷標(biāo)準(zhǔn)就變得更嚴(yán)格,僅僅加一些副詞或虛詞 (比如“的”、“然后”、“但是”、“所以”此類詞語)是能夠識(shí)別出來的。 在知網(wǎng)查重進(jìn)行中,檢測(cè)系統(tǒng)只能識(shí)別文字部分,論文中的圖片、word域代碼、mathtype編輯的公式、是不檢測(cè)的,因?yàn)闄z測(cè)系統(tǒng)尚無法識(shí)別這些復(fù)雜的內(nèi)容格式。
大致上來說,知網(wǎng)查重算法采用的是一種根據(jù)語義模糊解析算法,用近似比對(duì)的方式進(jìn)行重復(fù)率檢測(cè)。 而不是簡(jiǎn)單地基于某個(gè)最小語句為單位(比如傳說中的“13個(gè)字連續(xù)一樣”),進(jìn)行“循環(huán)比對(duì)”這么簡(jiǎn)單。
根據(jù)知網(wǎng)的最新查重規(guī)則原理我們可以看出參考同屆的畢業(yè)論文知網(wǎng)檢測(cè)系統(tǒng)是查重不到的,只要不被老師發(fā)現(xiàn)那就可以,另外本科生可以參考學(xué)長(zhǎng)的內(nèi)部論文,研究生可以參考本科學(xué)長(zhǎng)內(nèi)部論文。 (PS:內(nèi)部論文就是未公開的保密論文在知網(wǎng)數(shù)據(jù)庫中查詢不到)。