中國知道網(wǎng)(CNKI)、萬方數(shù)據(jù)是國內(nèi)最具影響力的兩大論文數(shù)據(jù)庫,分別輸入了大量的文獻(xiàn)。受壟斷授權(quán)的影響,數(shù)據(jù)來源和著作權(quán)維護(hù)方面競(jìng)爭(zhēng)激烈,兩者的輸入可能覆蓋面不同。
篇大部分論文都是從CNKl和萬方輸入的。但是,也有只輸入CNKI而沒有從萬方輸入的論文。另外,某篇論文可能是從CNKl和萬方輸入的。但是,時(shí)間上有前后。因此,兩大數(shù)據(jù)庫的內(nèi)容重疊在一起。因此,在同一時(shí)刻,在同一地點(diǎn)用AMLC和萬方論文類似性檢查系統(tǒng)測(cè)定同一原稿時(shí),其測(cè)定結(jié)果不同。比如“血清游離核子……””一文中,AMLC檢查后的重量率為6.1%,萬方檢查結(jié)果為66.7%。另一本書是《FOCUS-PPDCA程序》。的應(yīng)用”中AMLC檢查的重復(fù)率為40.2%,萬方為5.9%。另外,文本形式的原稿,由于檢索結(jié)果的差異很大,公式、圖表、外文的重復(fù)率的問題也無法解決。