總字?jǐn)?shù):有的同學(xué)會(huì)發(fā)現(xiàn)報(bào)告中的總字?jǐn)?shù)與論文中的總字?jǐn)?shù)出入較大,這是因?yàn)闄z測(cè)系統(tǒng)統(tǒng)計(jì)的是字符數(shù),例如thesis,在word中是一個(gè)詞(字),在檢測(cè)系統(tǒng)中是6個(gè)字符。 重復(fù)字?jǐn)?shù):重復(fù)部分+引用重復(fù)部分的字?jǐn)?shù),一般改重是根據(jù)重復(fù)字?jǐn)?shù)收費(fèi)。 (報(bào)告中的重復(fù)字?jǐn)?shù)實(shí)際上是重復(fù)字符數(shù),文科二者基本接近,理工科重復(fù)字符數(shù)與實(shí)際重復(fù)字?jǐn)?shù)相差較大,在跟商家溝通費(fèi)用時(shí)需特別注意) 總段落數(shù):知網(wǎng)檢測(cè)時(shí)會(huì)根據(jù)文章的格式(如果格式(目錄)沒有正確調(diào)整,就根據(jù)內(nèi)容)進(jìn)行分段檢測(cè),分成幾段,就是幾個(gè)段落。 (需要注意的是內(nèi)容發(fā)生變動(dòng)時(shí),知網(wǎng)檢測(cè)會(huì)重新分段,有可能出現(xiàn)頭一次檢測(cè)正常的內(nèi)容第二次變紅,這屬于正?,F(xiàn)象) 指標(biāo):疑似剽竊觀點(diǎn)、疑似剽竊文字表述、疑似自我剽竊、過度引用等。
知網(wǎng)檢測(cè)論文的重復(fù)性是按照13個(gè)字的連續(xù)性作為判斷的根據(jù),若作者希望修改后的論文查重沒有那么高,就可以先選擇將論文13個(gè)字相連的地方做修改,修改后保證13個(gè)字與字之間的內(nèi)容與抄襲的原作者文章內(nèi)容不一致,這樣過檢測(cè)的概率會(huì)很高。 學(xué)術(shù)不端網(wǎng) 覺得,按照目前的論文檢測(cè)系統(tǒng)來說,是非常容易的,只需要做簡(jiǎn)單的修改,等到以后會(huì)不會(huì)縮短字?jǐn)?shù)進(jìn)行查重檢測(cè)就不得而知了。
大致上來說,知網(wǎng)查重算法采用的是一種根據(jù)語義模糊解析算法,用近似比對(duì)的方式進(jìn)行重復(fù)率檢測(cè)。 而不是簡(jiǎn)單地基于某個(gè)最小語句為單位(比如傳說中的“13個(gè)字連續(xù)一樣”),進(jìn)行“循環(huán)比對(duì)”這么簡(jiǎn)單。