视频号
视频号
抖音号
抖音号
哔哩哔哩号
哔哩哔哩号
app
前沿资讯手机看

我要投稿

投稿请发送邮件至:weidy@instrument.com.cn

邮件标题请备注:投稿

联系电话:010-51654077-8129

二维码

我要投稿

投稿请发送邮件至:weidy@instrument.com.cn

邮件标题请备注:投稿

联系电话:010-51654077-8129

Nature:学术造假者的噩梦!论文图像查重软件研发成功,造假图片,无处可藏

进入
阅读更多内容

分享到微信朋友圈

打开微信,点击底部的“发现”,

使用“扫一扫”即可将网页分享到朋友圈。

分享: 2020/07/22 17:32:02
导读: Nature 杂志新闻版发布了一篇重磅消息:论文图片查重软件研发成功,软件开发人员在对 3500 篇预印版论文进行的检测中,找出 24 张涉嫌重复 / 造假的图像。

近日,Nature 杂志新闻版发布了一篇重磅消息:论文图片查重软件研发成功,软件开发人员在对 3500 篇预印版论文进行的检测中,找出 24 张涉嫌重复 / 造假的图像。

111.png

这对于论文造假无疑是一记重锤。

疯狂的论文造假

由于存在巨大的利益,论文造假一直屡见不鲜,甚至在部分国家或地区形成了造假论文产业链。

有造假、就有打假;但与庞大的造假数量相比,靠几个志愿者打假,显然是杯水车薪。

中国是重灾区之一

美国 Healsan Consulting LLC 对全球撤稿数据库的分析显示,

  1、中国 SCI 论文撤稿占到所有撤稿的 44.0%。

  截止到 2020 年 6 月 22 日,世界范围内共有 23,425 篇 SCI 撤稿,其中中国有 10,303 篇,远远高于第二位的美国 4,125 篇。中国论文撤稿占 44%。

33.png

  (图 1. Credit:Healsanconsulting LLC, USA)

  2、剽窃仍然是中国 SCI 论文撤稿的首要原因。

  近三年中国 SCI 论文共有 1397 篇 SCI 论文撤稿,其中因为剽窃所致的撤稿有 547 篇(39%),另外错误所致的撤稿有 330 篇(24%)。

44.png

  (图 2. Credit:Healsanconsulting LLC, USA)

  图片查重软件应运而生

  上面数据中提到的占撤稿原因 39% 的 「抄袭」,主要是指文字抄袭。因为目前的查重系统只能查文字,不能查图片。

  而撤稿第二常见原因 「错误」 部分,则主要是图片 「错误」。在目前靠人工检查的情况下,就已经发现了大量伪造的图片,可知实际情况多么严重。

  所以当论文图像查重软件的研发者,美国纽约 Syracuse 大学的机器学习研究人员 Daniel Acuna,递交了其第一批图片查重结果时,立即引起学术界的关注。

  1、识别原理

  其基本原理是,将提取图片放大以获得特征性图片数字 「指纹」,从而即使图片做了旋转、大小调整、截取、改变对比度或颜色,该软件仍然能够识别出其相似度。

  根据 Acuna 研究团队之前的检测结果,他们推测数据库中 1.5% 论文包含有可疑的图像,而 0.6% 论文包含有欺诈性图像。

  2、小试牛刀

  这款软件从 2015 年开始研发,历经 5 年反复测试、并经过小范围试用终获成功。首次正式应用于新冠病毒病(COVID-19)领域预印版论文的识别。因为这个领域论文的爆发程度不亚于病毒传播,低质量、甚至造假论文也屡见不鲜。

  Acuna 研究团队从 bioRxiv 和 medRxiv 服务器上下载了 3500 篇论文,总共有 21,000 张图片。在 4 个小时内,该软件就找到约 400 张可能重复的图像。经过人工鉴定后,Acuna 团队认为,其中的 24 张包含有重复图片,并在 7 月份将之公布在其网站上。

  3、优势和不足

  Acuna 团队的检测结果立即引起轰动。

  因为是通过软件自动检测,可以大规模发现重复的图像;另外可以发现人工不能识别的图像。

  收到 email 通知后一些论文作者立即回应,承认该软件找到的是重复图片,并表示将纠正错误。芬兰赫尔辛基大学病毒学家 Giuseppe Ballistreri 更是建议在 PubMed 数据库中应用该软件。

  著名学术打假人伊丽莎白?比克(Elisabeth Bik)在赞许之余,也建议在正式公布软件识别的造假图片之前,由她做鉴定。因为该软件识别出的 「嫌疑图片」 仍然需要人工确认。

  但也有一些收到通知的学者说,Acuna 的软件搞错了,标记出来并不匹配的图像。美国北卡罗来纳州的学者则要求 Acuna 删除其网站公示,因为 Acuna 软件对其论文图片做了错误识别。

  4、进一步处理方法

  基于上述反馈,Acuna 已经将其识别出来的 「造假图片」 由网站公示改为私下访问。只有从他的 email 通知的学者,才能凭借给予的密码进行访问和回复。

  所以设置的 「嫌疑造假图片」 处理流程也变为:先通知作者,如果作者不回复则将公开。

  在初尝战果后,Acuna 也计划扩大软件筛查范围。Acuna 特别告诫说:「我希望作者意识到,有人正在对所有的论文图片进行识别。」


[来源:HANSON]

标签: nature查重软件
用户头像

作者:ONE

总阅读量 205w+ 查看ta的文章

网友评论  0
为您推荐 最新资讯 新闻专题 更多推荐

版权与免责声明:

① 凡本网注明"来源:仪器信息网"的所有作品,版权均属于仪器信息网,未经本网授权不得转载、摘编或利用其它方式使用。已获本网授权的作品,应在授权范围内使用,并注明"来源:仪器信息网"。违者本网将追究相关法律责任。

② 本网凡注明"来源:xxx(非本网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,且不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。

③ 如涉及作品内容、版权等问题,请在作品发表之日起两周内与本网联系,否则视为默认仪器信息网有权转载。

使用积分打赏TA的文章

到积分加油站,赚取更多积分

谢谢您的赞赏,您的鼓励是我前进的动力~

打赏失败了~

评论成功+4积分

评论成功,积分获取达到限制

收藏成功
取消收藏成功
点赞成功
取消点赞成功

投票成功~

投票失败了~