硕士论文查重原理与快速通过的七大方法
大概当今所有的研究生毕业论文都会经过中国知网的“学术不端检测”,即便最后不被盲审。这个系统的初衷其实是很好的,在一定程度上能够对即将踏入中国科研界的硕士研究生们一个警示作用:杜绝抄袭,踏实学问。但正所谓“世界万物,有矛就有盾”的哲学观,中国知网的这个“学术不端检测系统”并不是完善的。原因有二,其一是目前的图文识别技术还不够先进;其二是目前的机器识别还达不到在含义识别上的智能化。求索阁一贯的观点就是“战略上蔑视,战术上重视”和“知己知彼百战百胜”。要破敌,必先知敌;要过学术检测这一关,当然必先了解这一关的玄机。
一、查重原理
1、知网学位论文检测为整篇上传,格式对检测结果可能会造成影响,需要将最终交稿格式提交检测,将影响降到最小,此影响为几十字的小段可能检测不出。对于3万字符以上文字较多的论文是可以忽略的。
对比数据库为:中国学术期刊网络出版总库,中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库,中国重要会议论文全文数据库,中国重要报纸全文数据库,中国专利全文数据库,个人比对库,其他比对库。部分书籍不在知网库,检测不到。
2、上传论文后,系统会自动检测该论文的章节信息,如果有自动生成的目录信息,那么系统会将论文按章节分段检测,否则会自动分段检测。
3、有部分同学反映说自己在段落中明明引用或者抄袭了其他文献的段落或句子,为什么没有检测出来,这是正常的。中国知网对该套检测系统的灵敏度设置了一个阀值,该阀值为5%,以段落计,低于5%的抄袭或引用是检测不出来的,这种情况常见于大段落中的小句或者小概念。举个例子:假如检测段落1有10000字,那么引用单篇文献500字以下,是不会被检测出来的。实际上这里也告诉同学们一个修改的方法,就是对段落抄袭千万不要选一篇文章来引用,尽可能多的选择多篇文献,一篇截取几句,这样是不会被检测出来的。
4、一篇论文的抄袭怎么才会被检测出来?知网论文检测的条件是连续13个字相似或抄袭都会被红字标注,但是必须满足3里面的前提条件:即你所引用或抄袭的A文献文字总和在你的各个检测段落中要达到5%。
二、快速通过论文查重的七大方法
方法一:外文文献翻译法
查阅研究领域外文文献,特别是高水平期刊的文献,比如Science,Nature,WaterRes等,将其中的理论讲解翻译成中文,放在自己的论文中。
优点:1、每个人语言习惯不同,翻译成的汉语必然不同。因此即使是同一段文字,不同人翻译了之后,也 不会出现抄袭的情况。2、外文文献的阅读,可以提升自身英语水平,拓展专业领域视野。
缺点:英文不好特别是专业英文不好的同学实施起来比较费劲。
方法二:变化措辞法
将别人论文里的文字,或按照意思重写,或变换句式结构,更改主被动语态,或更换关键词,或通过增减。当然如果属于经典名句,还是按照经典的方法加以引用。
优点:1.将文字修改之后,按照知网程序和算法,只要不出现连续13个字重复,以及关键词的重复,就不会被标红。2.对论文的每字每句都了如指掌,烂熟于心,答辩时亦会如鱼得水。
缺点:逐字逐句的改,费时费力。
方法三:google等翻译工具翻译法
将别人论文里的文字,用google翻译成英文,再翻译回来,句式和结构就会发生改变,再自行修改下语病后,即可顺利躲过查重。
优点:方便快捷,可以一大段一大段的修改。
缺点:有时候需要多翻译几遍,必须先由中文翻译成英文,再翻译成阿尔及利亚语,再翻译成中文。
方法四:转换图片法
将别人论文里的文字,截成图片,放在自己的论文里。因为知网查重系统目前只能查文字,而不能查图片和表格,因此可以躲过查重。
优点:比google翻译法更加方便快捷。
缺点:用顺手了容易出现整页都是图片的情况,会影响整个论文的字数统计。
方法五:插入文档法
将某些参考引用来的文字通过word文档的形式插入到论文中。
优点:此法比方法四更甚一筹,因为该方法日后还可以在所插入的文档里进行重新编辑,而图片转换法以后就不便于再修改了。
缺点:还没发现。
方法六:插入空格法
将文章中所有的字间插入空格,然后将空 格 字 间距调到最小。因为查重的根据是以词为基础的,空格切断了词语,自然略过了查重系统。
优点:从查重系统的原理出发,可靠性高。
缺点:工作量极大,课可以考虑通过宏完成,但宏的编制需要研究。
方法七:自己原创法
自己动手写论文,在写作时,要么不原文复制粘贴;要么正确的加上引用。
优点:基本上绝对不会担心查重不通过,哪怕这个查重系统的阈值调的再低。
缺点:如果说优缺点的话,就是写完一篇毕业论文,可能会死掉更多的脑细胞。呵呵。。。
三、几个查重网站与软件
一般来讲,这个查重系统如果按照初衷来讲的话,只允许在答辩前又一次查重机会,这样会起到一个警示作用。但实际上,很多高校由于与中国知网的合作关系,每年都会有超过毕业生人数的查重次数。如此一来,每个毕业生可能会有1–N次不等的机会,学术不端系统也就具有中国特色的人情化了。但对于那些执行严格的少数高校来说,在通过学校的查重之前,自己尽量能够通过某种方式先查重一次。有需求就会有商机,下面介绍几个这样的网站,基本上是10元/万字。
查重网站:paperpass、copycheck、paper119
查重软件:ROSTCM
目前,高校对于士论文,需要通过抄袭检测系统的检测才能算过关。对本科生来说,大部分学校也采取抽查的方式对本科论文进行检测。
抄袭过多,一经查出超过20%,后果严重。轻者延期毕业,重者取消学位。尼玛辛辛苦苦读个大学,学位报销了多不爽。
PS:科研机构的检测标准不同,百分之20,百分之三十,百分之四十的都有。
但是,软件毕竟是人工设置的一种机制,里面内嵌了检测算法,我们只要摸清其中的机理,通过简单的修改,就能成功通过检测。
论文抄袭检测算法:
1.论文的段落与格式
论文检测基本都是整篇文章上传,上传后,论文检测软件首先进行部分划分,上交的最终稿件格式对抄袭率有很大影响。不同段落的划分可能造成几十个字的小段落检测不出来。因此,我们可以通过划分多的小段落来降低抄袭率。
2.数据库
论文检测,多半是针对已发表的毕业论文,期刊文章,还有会议论文进行匹配的,有的数据库也包含了网络的一些文章。这里给大家透露下,很多书籍是没有包含在检测数据库中的。之前朋友从一本研究性的著作中摘抄了大量文字,也没被查出来。就能看出,这个方法还是有效果的。
3.章节变换
很多同学改变了章节的顺序,或者从不同的文章中抽取不同的章节拼接而成的文章,对抄袭检测的结果影响几乎为零。所以论文抄袭检测大师建议大家不要以为抄袭了几篇文章,或者几十篇文章就能过关。
4.标注参考文献
参考别人的文章和抄袭别人的文章在检测软件中是如何界定的。其实很简单,我们的论文中加了参考文献的引用符号,但是在抄袭检测软件中。都是统一看待,软件的阀值一般设定为1%,例如一篇文章有5000字,文章的1%就是50字,如果抄袭了多于50,即使加了参考文献,也会被判定为抄袭。
5.字数匹配
论文抄袭检测系统相对比较严格,只要多于20单位的字数匹配一致,就被认定为抄袭,但是前提是满足第4点,参考文献的标注。
论文抄袭修改方法:
首先是词语变化。文章中的专业词汇可以保留,尽量变换同义词;
其次,改变文中的描述方式,例如倒装句、被动句、主动句;打乱段落的顺序,抄袭原文时分割段落,并重组。
通过上述方法,能有效降低抄袭率。 下面举几个例子,大家可以参考下:
例句A:
本文以设备利用率最大化为目标函数,采用整数编码与实数编码相结合的遗传算法,研究了HFS的构建问题。本文提出的染色体编码方法及相应的遗传操作方法可实现研究对象的全局随机寻优。通过对car系列标准算例的研究,显示了本文提出方法具有较高的计算重复性和计算效率。
修改A:
本文研究了HFS问题的构建,通过遗传算法并结合整数与实数编码,目标函数为最大化设备利用率来求解。本文的染色体编码方法与对应的遗传算法操作可有效提高算法的全局搜索能力。通过对一些列基准算例的研究,验证了本文算法的有效性,并具有较高的计算重复性和较高的运算效率。
例句B:
由于房地产商品的地域性强,房地产开发企业在进行不同区域投资时,通常需要建立项目公司,此时就会面临建立分公司还是子公司的选择。子公司是一个独立的法人,而分公司则不是独立法人,它们在税收利益方面存在差异。子公司是独立法人,在设立区域被视为纳税人,通常要承担与该区域其它公司一样的全面纳税义务;分公司不是独立的法人实体,在设立分公司的所在区域不被视为纳税人,只承担有限的纳税义务,分公司发生的利润与亏损要与总公司合并计算。
修改B:
房地产开发企业在不同区域进行投资时,由于此类商品的地域性强,因此需要建立项目公司。此时,企业需要选择建立分公司还是子公司。主要的区别是子公司具有独立的法人,分公司则不是独立法人。其次,在税收利益方面,由于分公司不是独立的法人实体,在设立分公司的所在区域不被视为纳税人,只承担纳税义务,总公司需要合并计算分公司的利润与亏损;而子公司是独立法人,在所在区域被视为法人实体,需要承担与区域其他公司一样的全面纳税义务。
修改抄袭的方法不外乎这些,这里更建议同学们,先熟悉你所看的参考论文,关闭文档,用自己的话写出来,这样就不会受参考文献的太多影响。
有同学这里就提出问题了,学校用的检测系统是知网的学术不端检测系统,不是淘宝几元钱买的万方数据检测。
其实,各个检测系统的算法区别并不大,只是数据库有多有少,如果你没有太多,什么系统都不用怕。既然你抄了,得到检测报告的同时,先好好修改自己的文章。
经济角度考虑,知网的系统只有教育机构才能申请账号,而一般学生在淘宝上找检测一次也要200左右,来回修改和检测就上千了。哥强烈建议大家修改论文的时候,先再淘宝花几元钱进行抄袭数据检测,等修改的差不多了,还不放心的话用知网进行终检。