中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

決定論文生死的查重平臺(tái)們,原來是這么判斷重復(fù)的

澎湃新聞?dòng)浾?鄒熳云 王亞賽
2021-06-05 19:15
來源:澎湃新聞
? 美數(shù)課 >
字號(hào)

2019年的翟天臨論文造假事件,讓高校紛紛開始重視論文重復(fù)率。時(shí)至今日,他的微博底下依然繞不過這個(gè)話題。

“搞個(gè)抽獎(jiǎng)吧,幫付查重費(fèi)?!?/p>

網(wǎng)友Epochigo_在5月24日留下的這條評(píng)論,已經(jīng)獲得了超過兩萬五千個(gè)贊。

畢竟對(duì)于準(zhǔn)畢業(yè)生來說,論文查重不僅是對(duì)學(xué)業(yè)的要求,還是對(duì)生活費(fèi)的威脅。

目前大多數(shù)高校的官方查重平臺(tái)是中國(guó)知網(wǎng)。矛盾的是,知網(wǎng)并不開放個(gè)人檢測(cè)名額,許多學(xué)校也不會(huì)提供一到兩次的免費(fèi)查重機(jī)會(huì)。因此不少同學(xué)都得在定稿前,憑借自己找的渠道,進(jìn)行輪番幾次的查重和修改。

這些非官方渠道,如果是家喻戶曉的老品牌,價(jià)格不一定便宜。

而如果是在淘寶上盲找店家,就可能得擔(dān)著些風(fēng)險(xiǎn)。

掛著“知網(wǎng)官方”旗號(hào)的渠道,要么買到的是假貨,要么可能是通過非法手段弄來的免費(fèi)名額。據(jù)《新京報(bào)》報(bào)道,有些在校學(xué)生知網(wǎng)賬號(hào)被盜后,發(fā)現(xiàn)自己的免費(fèi)查重機(jī)會(huì)已被不明論文占用。

不明的第三方渠道,還會(huì)有轉(zhuǎn)賣論文的風(fēng)險(xiǎn)。澎湃號(hào)“真數(shù)”曾在文章中披露,一位同學(xué)懷疑自己的論文被查重網(wǎng)站出售,被他人買去作為本科論文提交,以致自己的論文在學(xué)校倒查畢業(yè)論文質(zhì)量時(shí),被發(fā)現(xiàn)查重率高達(dá)90%。

查重平臺(tái)結(jié)果不一,知網(wǎng)分?jǐn)?shù)偏低

哪怕這些坑都避開了,準(zhǔn)畢業(yè)生們還會(huì)遇到一大天問:為什么每個(gè)平臺(tái)的查重結(jié)果都不一樣?下圖所示,六家查重平臺(tái)對(duì)翟天臨碩士論文的查重結(jié)果,最大差距可以達(dá)到62個(gè)百分點(diǎn)。

因此,許多往屆畢業(yè)生會(huì)留下“Paper系比知網(wǎng)要嚴(yán)格”的印象。

這個(gè)印象或許是對(duì)的。

在知乎“PaperYY查重軟件靠譜嗎?”這個(gè)問題下,133名網(wǎng)友分享了自己的論文在中國(guó)知網(wǎng)和PaperYY的查重結(jié)果??梢钥闯?,知網(wǎng)查出來的重復(fù)比重,大多情況下確實(shí)偏低。

但也有例外。

網(wǎng)友勿忘寫道,她舍友的論文,在PaperYY查出來的復(fù)制比重是4%,結(jié)果知網(wǎng)查出60%。對(duì)比兩份查重報(bào)告后,這位同學(xué)得出了一個(gè)結(jié)論:知網(wǎng)比PaperYY多了一個(gè)“大學(xué)生論文聯(lián)合對(duì)比庫”,而舍友恰巧采用了一個(gè)學(xué)姐論文的結(jié)構(gòu),內(nèi)容也有復(fù)制,因此知網(wǎng)計(jì)算出的復(fù)制比重才會(huì)如此之高。

各平臺(tái)區(qū)別:論文對(duì)比庫和查重方法

這位網(wǎng)友的結(jié)論,很可能是正確的。

論文比對(duì)庫的范圍是影響因素之一。比如,PaperPass免費(fèi)版的重復(fù)比例經(jīng)常偏高,學(xué)術(shù)不端網(wǎng)認(rèn)為,這是因?yàn)镻aperPass主要依賴網(wǎng)絡(luò)資源庫,在網(wǎng)絡(luò)上任何一句話都可能找到相似的句子,“最簡(jiǎn)單的就像百度搜索一樣,每搜索一句話都會(huì)有一系列相關(guān)的內(nèi)容出現(xiàn)”。

而知網(wǎng)則會(huì)更注重和學(xué)術(shù)論文的比對(duì)。下圖中,以知網(wǎng)包含的對(duì)比庫類型作為參照,可以看出,會(huì)被采納為官方查重的三家平臺(tái),比“Paper系”會(huì)更接近知網(wǎng)的配置。

每個(gè)平臺(tái)的查重規(guī)則也不一樣,但“由于沒有官方聲明,所有的算法模型都是網(wǎng)傳”,堅(jiān)果云官方號(hào)在知乎問題“萬方論文查重怎么樣 和知網(wǎng)對(duì)比”下寫道。

堅(jiān)果云進(jìn)一步解釋道:知網(wǎng)的查重算法有兩個(gè)要點(diǎn),首先,引用的文獻(xiàn)得占到段落的5%及以上;滿足這個(gè)條件后,如果一個(gè)句子里出現(xiàn)了連續(xù)13個(gè)字的重復(fù),那么這句話就會(huì)被標(biāo)紅,即判定為抄襲。萬方的判定標(biāo)準(zhǔn)則相對(duì)簡(jiǎn)單,如果一個(gè)句子中連續(xù)10個(gè)字與庫中文章重復(fù),這個(gè)句子就會(huì)標(biāo)紅。

這條判定規(guī)則的區(qū)別,基本上是各類查重平臺(tái)分析的共識(shí)。

此外,知乎論文類大V吳志根在自己的專欄《論文查重降重攻略:學(xué)術(shù)論文重復(fù)問題剖析》還補(bǔ)充了一點(diǎn)?;谒挠^察,知網(wǎng)還采用了“語義模糊算法”,即比起逐字逐句,這套算法更關(guān)注句子的中心意思和關(guān)鍵詞。換句話說,同一段文字,如果只是換一套表述方式,那也是會(huì)被知網(wǎng)判定為重復(fù)的。

這些額外的查重規(guī)則,可能正是知網(wǎng)會(huì)顯得更“智能”的原因。準(zhǔn)畢業(yè)生們只能通過其他平臺(tái)的反饋,摸索著,一次又一次修正,去不斷地預(yù)測(cè)和逼近知網(wǎng)的結(jié)果。

    責(zé)任編輯:呂妍
    校對(duì):劉威
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋