摘要:本文總結了影響“文王期刊檢查系統(tǒng)”測試結果的因素,利用系統(tǒng)檢測出的不同文本復制比例,分析了一審文章的學術性舞弊行為。結合實際測試用例,可以得出結論,這個系統(tǒng)可以有效地幫助初步審查,但不能替代初步審查的結論。
關鍵詞:HowNet期刊檢查系統(tǒng);AMLC;檢查結果近年來學術問題日益嚴重,學術信用問題受到政府和管理層的重視。截至2009年3月15日,教育部長周濟在學術氛圍建設會議上強調對學術上的不正當行為“零容忍”。浙江大學何海波學術舞弊有關人員受到了中國大學和研究機構對紙質欺詐最嚴厲的處罰。
作為科技論文第一道防線,科技期刊編輯部對初步審查質量進行了很好的篩,尤其是抄襲等散文,這也引起了編輯的廣泛討論。王淑華在2001年提出了利用中國雜志網絡進行初步審查的方法。隨著網絡技術的快速發(fā)展,
年來,編輯部門在初步審查中采用了類似的在線審查方法。但是,作為評價學術成果的重要標準的文章數(shù)量暫時增加,提出的數(shù)量大幅增加。數(shù)據(jù)庫已經手工制作。搜索量大幅增加,很難發(fā)現(xiàn)多源抄襲等復雜的學術舞弊行為?!禡inNet雜志檢查系統(tǒng)》(AMLC)的發(fā)售無疑給這項工作帶來了極大的便利。
多個編輯部門開始協(xié)助使用這個系統(tǒng)編輯原稿的初步審查。志旺定期出版物檢查系統(tǒng)是3年后中國知網(CNKI)的研究開發(fā)成果。
“中國學術文獻網絡出版總庫”作為全文比較數(shù)據(jù)庫使用,可以多次提交剽竊、剽竊、偽造、非法簽名。支持不正當行為和每份雜志的自我比較庫。識別
學術性舞弊行為是個嚴重問題。這與報告人、報告人、研究基金助成單位的榮譽和利益有關。因此,為了識別不正當行為,需要建立標準化程序并獲得保證。
程序的公平性。2009年,一些大學引進了AMLC的姊妹版《HowNet定期刊物檢查系統(tǒng)》,測試了畢業(yè)論文的爭論,并提醒科學技術雜志的編輯在使用時正確觀察系統(tǒng)的測試結果。
HowNet定期出版物檢查系統(tǒng)AMLC。
1.網絡期刊知識系統(tǒng)AMLC測試結果影響因素,AMLC檢查系統(tǒng)AMLC工作流程分析表明,影響測試結果的因素如下。1)待測試的文章。
1不管作者是否相同,具有文本偶然性程度的原稿是自我報告,直接決定是不正確的簽名或復印。問題的嚴重性和自然不同。
2物品的檢查可能性。這是指大部分的文章,或者大部分的公式和圖表,更多的漢字,或者更多的外語。AMLC不能有效地檢測公式、圖形、外語,因此可檢測部分的比例不同,檢測結果與實際相似性的接近度也不同。
篇文章的格式在實際使用中,系統(tǒng)支持多個格式,例如PDF、caj、doc、txt,但是不同格式的相同文章的處理結果可能不同。2)比較數(shù)據(jù)庫。
這是AMLC檢查系統(tǒng)AMLC的基礎和核心。要匹配好的數(shù)據(jù)庫,需要完整且最新的數(shù)據(jù)庫。
)測量指標。AMLC的檢查系統(tǒng)AMLC提供了各種檢查指標,包括文字復制比、最大段長、頭部重疊和尾部重疊。
的最直觀的指標是文本拷貝率,并且可以是系統(tǒng)提供的主要測試結果之一。2.志旺定期出版物檢查系統(tǒng)的AMLC檢查結果如下分析。是使用AMLC輔助審查時發(fā)生的實際狀況的詳細討論。
只考慮研究內容在出版物范圍內發(fā)表的原稿。正在討論中的嫌疑人剽竊并沒有被抄襲,而是接受了提交的承諾。
本書中的作者承諾,原稿已被其他人正確編入索引,并且該原稿的相關內容至今未公開,并已在其他地方投票。考慮到中國的相似性,通常認為30%的原稿被剽竊,50%的原稿被懷疑是剽竊。因此,調查3Q%到5Q%具有相似性的原稿。
進而,原稿的類似性<;30%容易直接通過>;50%容易直接拒絕原稿。然而,實際情況更復雜,不適合僅使用測試數(shù)據(jù)來判斷原稿是否是復印的。2.1用較低的文本復印的原稿有50%以上的原稿的情況。
1)這確實是完整的復印件。當然會被拒絕。2)重新提交,并將之前拒絕的文檔添加到比較數(shù)據(jù)庫。在這種情況下,在通過系統(tǒng)提供的兩個版本的文稿的不同版本組合拒絕的注釋并重新提出的情況下,如果不能適當?shù)亟鉀Q原始審查中提出的問題,則可以直接拒絕。
)同一作者所寫的繼續(xù)研究的結果。對于這樣的原稿,作者認為不適合直接拒絕。后者分為以下兩種情況。1分離發(fā)表原稿。如果只追求
篇原稿的數(shù)量,可能會缺少一些原稿的信息。這時,可以先聯(lián)系作者告知利害關系,修改合并后再拒絕。
政策決定2根據(jù)現(xiàn)在中國的研究評價系統(tǒng),很難說服作者將多篇獨立論文整理成長篇文章。
如果不能合并的話,就要仔細檢查原稿是否說明了各文章的具體研究內容。然后,在后續(xù)的原稿中,是否簡單介紹了前篇文章的研究內容,并不是大段或復印的文章。如果作者不能準確地突出每一篇文章的創(chuàng)新,就應該把作者還回修訂版。
)和同一作者的論文非常相似。這種情況下,只需要進行論文的檢查。另外,和其他文件一樣,需要進行預備審查決定。
)摘要。好的評論文章一定有反映作者獨特見解的內容,如果測試結果顯示原稿完全是一堆簡單的別人的結果,我認為其價值值得討論。文本的復制率在30%到50%的范圍內的原稿,根據(jù)第2.1節(jié)和22節(jié)的分析進行同樣的處理,能夠省略說明。
.文章格式對測試結果的影響,雖然AMLC檢查系統(tǒng)AMLC支持多個格式的文章,但實際比較效果可能不同。此系統(tǒng)的編輯可能已成功提交PDF文件,但文本太短。由于系統(tǒng)本身的技術問題,
的原稿上傳實際上失敗是文章的格式之一。作者第一次調查原稿的時候,他檢索了中國的雜志網絡的參考文獻。無意中檢索了兩個不同作者的標題文章,下載了兩篇文章的caj版本,用AMLC檢查??戳?/p>
層的文本源列表,發(fā)現(xiàn)這兩個原稿互不重疊。但是,測試結果卻意外地表明兩篇文章和他們自己的比較不是100%。
以下的例子可以更直觀地反映這個問題。《航空學報》個人比較倉庫中的文章(doc形式,作者最終確定)已在線在中國雜志上發(fā)表。(具體不匹配文件格式。最終版本在發(fā)表前編輯過,但沒有專門修改。)新提交的原稿有兩章和文字重疊。但是,個人比較倉庫中的