[摘錄](méi)知識(shí)網(wǎng)調(diào)查的重要性是防止學(xué)術(shù)上不正當(dāng)行為的重要手段。網(wǎng)絡(luò)檢索的重量和萬(wàn)方檢查的重量有什么區(qū)別?在本文中,我們比較并討論了萬(wàn)張紙的相似性檢測(cè)系統(tǒng)和CNKI的感知網(wǎng)的檢測(cè)系統(tǒng)。結(jié)果表明,檢測(cè)范圍,文獻(xiàn)引用檢測(cè)和圖形類似度檢測(cè)存在差異,兩篇論文的相似性檢測(cè)系統(tǒng)存在一些問(wèn)題。
。因此,升級(jí)文檔引號(hào)的識(shí)別功能,開發(fā)圖表識(shí)別技術(shù),不斷改進(jìn)搜索范圍的中文,提高搜索系統(tǒng)的可靠性。國(guó)際學(xué)術(shù)上的不合理行為被禁止。近幾年來(lái),國(guó)防部長(zhǎng)對(duì)德國(guó)古滕貝格、教育和研究部長(zhǎng)沙、歐洲副總統(tǒng)梅林、北部萊茵-威斯特法魯恩州議會(huì)議員細(xì)節(jié)?阿斯佩爾、LibellDemocricac黨政治家ChimaKajis、柏林基督教民主聯(lián)盟理事會(huì)的圖表會(huì)長(zhǎng)等剽竊問(wèn)題已經(jīng)辭職。
中國(guó)學(xué)者的學(xué)術(shù)舞弊也在逐年增加。學(xué)術(shù)上的不正當(dāng)行為引起的議論和事件處理引起了教育和科學(xué)研究等管理部門的關(guān)注。為了防止
學(xué)術(shù)上的舞弊行為?,F(xiàn)在,在紙的出版、論文的提交、職名的審查、職位的晉升、人物的選拔、人才的引進(jìn)等過(guò)程中,進(jìn)行了紙的類似性檢查。
中國(guó)不同的文獻(xiàn)信息服務(wù)機(jī)構(gòu)開發(fā)了多個(gè)紙的類似性檢查服務(wù)平臺(tái)。最常用的是萬(wàn)方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)的紙相似性檢查系統(tǒng)和CNKI研究誠(chéng)信管理系統(tǒng)研究中心的知識(shí)網(wǎng)檢索重系統(tǒng)。在本文中,我們比較了CNKI和各向同性檢測(cè)服務(wù)的差異。
檢查范圍CNKI研究誠(chéng)實(shí)管理系統(tǒng)研究中心開發(fā)的知識(shí)網(wǎng)檢重檢查系統(tǒng)分為“知識(shí)網(wǎng)文件檢測(cè)系統(tǒng)5.1版”和“研究完整性管理系統(tǒng)(人員版)”兩部分。其中,“知識(shí)網(wǎng)絡(luò)文獻(xiàn)檢測(cè)系統(tǒng)5.1版”是科技期刊的感知網(wǎng)絡(luò)檢索重檢查系統(tǒng)、社會(huì)科學(xué)期刊的感知網(wǎng)絡(luò)檢索重檢查系統(tǒng)、學(xué)位論文的學(xué)術(shù)無(wú)端檢查系統(tǒng)、知識(shí)網(wǎng)檢索重(定期刊物)檢查系統(tǒng)、大學(xué)生的盜竊作檢查系統(tǒng)、系統(tǒng)(人員版)包括英語(yǔ)檢測(cè)系統(tǒng)和中間英文控制檢測(cè)系統(tǒng)。
的每個(gè)檢測(cè)系統(tǒng)具有不同的功能范圍。例如,學(xué)位論文的學(xué)術(shù)缺陷行為檢測(cè)系統(tǒng)向大學(xué)院提供測(cè)試服務(wù),只審查大學(xué)院的論文。學(xué)術(shù)上的舞弊檢查系統(tǒng)主要針對(duì)人事部門的職稱選擇,人物提供補(bǔ)充審計(jì)方法。在評(píng)價(jià)、高級(jí)選拔、人才引進(jìn)等活動(dòng)中提供科學(xué)、準(zhǔn)確、客觀的線索和證據(jù)。
CNKI學(xué)術(shù)舞弊檢測(cè)系統(tǒng)檢測(cè)范圍為中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版數(shù)據(jù)庫(kù)、中國(guó)博士論文全文數(shù)據(jù)庫(kù)、中國(guó)優(yōu)秀碩士論文全文數(shù)據(jù)庫(kù)、中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù)、中國(guó)重要新聞全文數(shù)據(jù)庫(kù)、中國(guó)專利全文數(shù)據(jù)包括塔基、互聯(lián)網(wǎng)資源、英語(yǔ)數(shù)據(jù)庫(kù)(包括期刊、博碩、會(huì)議)。英語(yǔ)數(shù)據(jù)和德國(guó)Springer、英國(guó)泰勒和法蘭西斯期刊數(shù)據(jù)庫(kù)等)、香港和澳門學(xué)術(shù)文獻(xiàn)倉(cāng)庫(kù),優(yōu)先出版文獻(xiàn)倉(cāng)庫(kù),互聯(lián)網(wǎng)文獻(xiàn)資源,個(gè)人比較倉(cāng)庫(kù)。萬(wàn)人的數(shù)據(jù)知識(shí)服務(wù)平臺(tái)的紙相似性檢查服務(wù)不分類文獻(xiàn)檢索的不同要求,檢測(cè)語(yǔ)言只有中文。
這個(gè)系統(tǒng)由兩個(gè)入口構(gòu)成。一個(gè)是“檢測(cè)發(fā)表論文”,主要是對(duì)發(fā)送論文前發(fā)表的所有文件進(jìn)行測(cè)試,適用于測(cè)試標(biāo)題文件。另一個(gè)入口是“檢測(cè)新論文”,適用于畢業(yè)。論文、新提出的內(nèi)容等都經(jīng)過(guò)了測(cè)試。類似性檢查系統(tǒng)包括中國(guó)學(xué)術(shù)期刊數(shù)據(jù)庫(kù)(CSPD)、中國(guó)論文全文數(shù)據(jù)庫(kù)(CDDB)、中國(guó)學(xué)術(shù)會(huì)議論文數(shù)據(jù)庫(kù)(CCPD)和中國(guó)學(xué)術(shù)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)(CSWD)。
可以從CNKI和萬(wàn)方紙類似性檢查系統(tǒng)的檢索范圍來(lái)看。雖然主要的中文學(xué)術(shù)資源包括在內(nèi),但是CNKI的調(diào)查重檢查系統(tǒng)包含著更多的中文學(xué)術(shù)資源。另外,因?yàn)橛写罅康挠⒄Z(yǔ)數(shù)據(jù)庫(kù)(包括期刊、博碩、會(huì)議英語(yǔ)數(shù)據(jù)、德國(guó)Springer、英國(guó)泰勒、法蘭西期刊數(shù)據(jù)庫(kù)等),其測(cè)量范圍比萬(wàn)方數(shù)據(jù)庫(kù)完整。正因?yàn)樗阉鞣秶煌?,兩個(gè)搜索系統(tǒng)的搜索結(jié)果非常不同。例如,對(duì)2012年山東省向促銷員提交的3個(gè)結(jié)果進(jìn)行網(wǎng)絡(luò)檢索,其中一個(gè)是由萬(wàn)張紙類似性檢查系統(tǒng)檢測(cè)出,檢查率為12.81%。使用CNKI感知網(wǎng)調(diào)查了重檢查系統(tǒng),達(dá)到36.12。%。然而,CNKIHowNet檢測(cè)系統(tǒng)和多媒體紙類似性檢測(cè)系統(tǒng)涉及其搜索限制,即英語(yǔ)論文的搜索。多方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)本身沒(méi)有外語(yǔ)檢索庫(kù)。CNKI有網(wǎng)絡(luò)檢索的再檢查系統(tǒng)。有英語(yǔ)數(shù)據(jù)庫(kù),但是還沒(méi)有覆蓋很多英語(yǔ)數(shù)據(jù)庫(kù)。那個(gè)搜索范圍不完全。另外,從長(zhǎng)遠(yuǎn)來(lái)看,外語(yǔ)的檢索和檢索變得越來(lái)越重要。因此,國(guó)內(nèi)類似性測(cè)試服務(wù)平臺(tái)應(yīng)積極響應(yīng),擴(kuò)大搜索范圍,克服搜索限制。用于表征雙文獻(xiàn)引文的檢測(cè)和重復(fù)率的多方數(shù)據(jù)參考測(cè)試和數(shù)據(jù)知識(shí)服務(wù)平臺(tái)的重復(fù)率相對(duì)簡(jiǎn)單。一般來(lái)說(shuō),在整體結(jié)論中,僅給出“總相似比”、“參考文獻(xiàn)的相似性”和“排除參考文獻(xiàn)”。在類似片段分布中,
使用綠色區(qū)域來(lái)表征參考相似部分的位置。紅色領(lǐng)域與其他未引用論文相似,顯示了類似論文的作者與典型類似論文及其典型部分之間的相似之處。整體表達(dá)是客觀的,不能對(duì)論文進(jìn)行結(jié)論性評(píng)價(jià)。
CNKI知道復(fù)查系統(tǒng)文獻(xiàn)引用的檢測(cè)和重復(fù)率的表征比較復(fù)雜。總的結(jié)論是,給出文本復(fù)制的比例,刪除參考文獻(xiàn)的復(fù)制比例,刪除發(fā)表的文獻(xiàn)的復(fù)制比例和單一最大文本復(fù)制的比例,紅色文字表表示文本的復(fù)制部分,黃色文字表示參照部分,并詳細(xì)復(fù)制文本的說(shuō)明。根據(jù)已經(jīng)出版的文獻(xiàn)的復(fù)制比例,明確指出是自我抄襲,提出多次還是反復(fù)出版;結(jié)論是根據(jù)引用文獻(xiàn)的比例,單句的最大復(fù)制比例是論文是否過(guò)度引用,或是整體假借李先生。
從反復(fù)測(cè)試的結(jié)論來(lái)看,作者在寫論文的過(guò)程中必須嚴(yán)格引用文章。即使提到已經(jīng)發(fā)表的論文,也應(yīng)該參考。否則,會(huì)發(fā)生自我復(fù)制的結(jié)果。引用文不應(yīng)過(guò)度引用,有多次(過(guò)度引用自己的論文)和抄襲(過(guò)度引用他人的論文)的嫌疑。
顯然,無(wú)論是萬(wàn)方紙的類似性檢查系統(tǒng)還是重度檢查系統(tǒng),只要尊重知識(shí)產(chǎn)權(quán),尊重他人的結(jié)果,嚴(yán)格的文獻(xiàn)引用就不會(huì)過(guò)度引用,即使文本拷貝太高,也會(huì)導(dǎo)致論文。有學(xué)術(shù)性的不正當(dāng)行為的問(wèn)題。大部分情況下,測(cè)試結(jié)果必須考慮“刪除引用率”。但是,實(shí)際上在一些評(píng)論和評(píng)論文章中,文獻(xiàn)的觀點(diǎn)、數(shù)據(jù)、圖表、方法、結(jié)果等需要反復(fù)討論。即使文獻(xiàn)中引用的重復(fù)率非常低,引用的次數(shù)也很多。
(三十四十以下,一百多)可以帶來(lái)更高的文本再生,甚至超過(guò)30%,但是本文是以合理的方法寫的。萬(wàn)方紙的類似性檢測(cè)系統(tǒng)和CNKI知網(wǎng)檢測(cè)系統(tǒng)在文獻(xiàn)引用率的檢測(cè)和重復(fù)率的表征中存在差異,但是它們?cè)谖墨I(xiàn)重復(fù)率的檢測(cè)過(guò)程中存在共同的問(wèn)題,