首先,學(xué)生們認(rèn)為只有很多人反復(fù)檢查12個字以上的文字才能檢測出來。每12個字符修改后不檢測到一個字符。這個說法不正確。網(wǎng)絡(luò)檢查系統(tǒng)沒有被這樣識別。他有復(fù)雜的檢查系統(tǒng)。不是簡單的文字對比度。這種檢查系統(tǒng)怎么好?一想就明白。例如,對于需要網(wǎng)絡(luò)檢查的文獻(xiàn),檢測系統(tǒng)首先根據(jù)頁面、段落、句子等的層級分別制作指紋,對于資源庫中的比重文獻(xiàn)也用同樣的技術(shù)制作指紋索引。最小指紋粒度是文字。原則上,如果
檢測到與文獻(xiàn)相比存在相同的文章,則由知識網(wǎng)檢重系統(tǒng)發(fā)現(xiàn)。系統(tǒng)對文章也有相應(yīng)的處理。有語句相似性的算法。不僅僅是句子完全一樣。語句有句子級別的算法,段落有段落級別的算法,計算文章,計算是否與其他文章的段落相似。
(請好好理解這句話?。。┧?,修改文章的時候可以盡量用原創(chuàng)的語言把紅色的部分合起來替換。僅僅是簡單的修飾語和修飾語,詞序的交替效果不太大。也就是說,在保持了原本的意思的基礎(chǔ)上,進(jìn)行殘忍的批評,使其全貌為之一變,連作者也無法分辨,變成了good。