中国撤回论文的分布、原因与影响(2012-2018)

中国撤回论文的分布、原因与影响(2012-2018)张约翰
1背景
撤稿通常在学术不端或错误损害研究的有效性、可靠性或完整性时发生,被撤回文章的数据、结论或方法不应继续被其他学者引用[1]。撤稿可帮助研究者识别存在问题的论文,节省科研试错成本。每年被撤回文章的数量呈增加趋势,对出版商和研究者提出了巨大挑战,引起学术界的极大关注[2-3]。2013-2015年在Retraction Watch数据库中记录的撤回文章源自15个国家,包括科研强国美、德、英、法。但仅考虑撤稿总量不够,还应考虑各个国家出版文章的总量[4]。若根据Scimago提供的2013-2015年各国文章总量对撤稿量进行加权,大多数科研强国并普光气田
摘要针对学术不端行为,出版商使用撤稿作为应对手段,要求出版者撤回被发现不具发表价值的学术论文,引发数次剽窃与撤稿舆论事件。中国撤稿论文占比较高。文章对2012-2018年中国撤稿文献进行计量学分析,识别由中国研究人员撰写或合著的撤回出版物;检查撤回出版物的特征;分析撤回出版物的原因和领域;评估撤回的影响。文章以Retraction Watch作为数据来源,检索所有中国作者相关文献的撤稿通知,筛选出2012-2018年间的1,553篇撤稿论文,并设计相关分析变量——撤稿原因、作者、合作网络、合作国家、撤稿来源以及注意力得分,对中国撤回论文进行系统描述。
关键词出版伦理研究伦理撤回出版物Altmetrics社会网络中国
引用本文格式张约翰.中国撤回论文的分布、原因与影响(2012-2018)[J].图书馆论坛,2021,41(11):52-59.
Bibliometric Analysis of the Retracted Papers between2012-2018from
China
ZHANG Yuehan
Abstract To deal with the increasingly serious academic misconduct,publishers usually retract papers not worth publishing,which arouses public concern about plagiarism and withdrawal.Given that the publication retractions from China account for a large proportion,this article conducts a bibliometric analysis of the retracted papers between2012and2018:identifying the retracted papers written or co-authored by Chinese researchers;examining the characteristics of those papers;analyzing the reasons and the areas of research;assessing the impact of the retractions.Using Retraction Watch as the data source,this article retrieves all the withdrawal notices for the retracted papers,selects and analyzes1,553of them by related variable factors:retracted reason,authors
hip,collaboration network,partner country,sources(journal/publisher/institution),and the score of attention.Thus,an overview is presented according to the analysis results.
Keywords publishing ethics;academic ethics;retracted papers;Altmetrics;social network;China
不是撤稿的主要贡献源[5]。
秩撤稿的原因包括错误、欺诈、政治或道德问题、违反出版道德规范等[5-6]。大部分撤稿是由于包括抄袭和重复在内的学术不端行为[4,7]。有关中国学术不端行为和撤稿问题的舆论事件表明我们社会比以往更加关注这一领域。由中国学者撰写的学术出版物数量有所增加,被撤回的出版物数量也有所增加[7-13]。从2011-2017年3月15日发表的文献看,中国学术不端行为比率(撤稿量与发表文章总量之比)排名第一[10]。尽管Scimago上记录的中国文献总量很庞大,从2011年395,431篇增加到2017年5
34,879篇,这仍然是一个可怕的结论。中国作者大量撤稿引起全球关注,来自中国的研究成果开始被很多人质疑[14-15]。
国内学者对中国作者撤稿的研究有相当一部分聚焦于医学领域。卜今根据PubMed数据库收录的中国作者撤稿声明,描述了中国作者在生物医学领域科技文献的失败情况以及出版不伦理行为[16];付晓霞等、郝秀原等、彭妍捷等从原因和对策两方面对2015年3月BioMedical Central 大规模撤稿在内的多次撤稿事件进行反思[17-19];包靖玲等基于Scopus数据库调查2015-2017年医学领域国际期刊的撤稿声明,发现撤稿文章数量最多的为中国[20]。对中文学术期刊撤稿的研究也有一定成果。张晴等基于CNKI数据库回溯92篇撤销论文,指出学术不端引起的撤稿占67.4%,主要分布于医药卫生、工业技术和自然科学领域[21];丁媛媛根据中文科技期刊数据库、中国知网、中国数字图书馆、万方数据、中国医药数字化期刊和中华医学会数字化期刊数据库等分析国内学术期刊刊登撤稿声明,董敏则依据万方和中国知网数据库对2013-2018年的中文科技论文进行统计描述,周志新基于中国知网数据库对中文科技期刊被撤销论文进行特征分析[22-24]。朱大明、张新庆、游苏宁、胡金富、叶方寅等通过定性经验对重大撤稿事件和撤稿现象发表讨论[25-29];范姝婕等对中国作者科学引文索引扩展版(SCI-E)收录论文的撤稿情况进行文献计量学分析[30]。综上所述,国内学者采用文献计量学方法对撤稿的研究相对聚焦于医学领域,关于中文学术期刊撤稿的研究较多;相当部分与撤稿有关的论文并非基于计量数据而是基于定性经验的;存在一些采用文献计量学方法对英文期刊撤稿情况的研究,但聚焦于中
国作者在英文期刊撤稿的研究较少,缺乏系统的概述。因此,本文基于Retraction Watch网站数据库(http:// /RetractionSearch.aspx),采用文献计量法对2012-2018年间与中国有关联的撤回论文进行分析。
Retraction Watch(RW)成立于2010年8月,是一个跟踪撤稿事件、旨在帮助公众关注科学不端行为及其纠正过程的在线数据库,包含1.8万多篇可以追溯到1970年代的撤销论文或摘要[31-33]。RW涵盖面广、规模大,可以看作是记录英文撤稿的最流行和最有用的来源之一。虽然撤稿是防范学术不端的重要方法,我国还没有专业的反学术不端网站,构建已发表论文跟踪系统、发挥读者监督作用十分必要[34]。本文采用Retraction Watch数据库作为数据源,一方面可以基于其规模和涵盖面保证数据选取科学性,对中国作者在国际期刊上的撤稿情况做准确系统的揭示,一方面也期待更多基于RW这类专业撤稿记录平台的研究可以提高国内学界对专业反学术不端网站的重视,鼓励构建专业的网站或平台,打破国内外撤稿记录的信息差,促进形成健康的学术生态。
2数据和方法
本文将RW中记录的2012-2018年撤回文章作为原始数据。2017年Retraction Watch管理员宣布:“我们的个人提示有14,000个订阅者,日常有1,000个订阅者。”(http://retractionwatch/2017/08/03/happy -birthday-retraction-watch-7-update-da-tabase/)
该网站是“世界上最大的撤回文章数据库”(https://retractionwatch/2019/12/31/ a-look-back-at-retraction-watch-in-2019-and-forward-to-our-10th-anniversary/
#more-118665)。数据集的筛选标准包括:必须是完整的撤稿;必须是源自中国的撤稿;必须是科学文献,严格地说是研究论文;所撤回文章的原发表日期应在01/01/2012和12/31/2018之间。
包头医学院学报RW还包含大量“表示担忧”等其他记录,筛选标准可以将数据集微调到撤回的研究论文上。RW检索界面只会返回最新600条记录,提示“您的搜索返回了大量结果,仅显示600条,缩小搜索范围以查看所有结果”。因此,文章根
据发布年份缩小时间间隔,通过多次检索获取并下载RW提供的HTML页面,作为计量的原始数据。一旦撤稿记录满足筛选标准,就可以通过Python标准库、csv库、re库和bs4库解析HTML页面来提取元数据信息作进一步分析,具体包括:撤回文章的标题、撤回文章的主题、出版商、出版杂志、撤稿的
机构、撤稿的原因、撤回文章的作者、原始文章的DOI、是否有付费墙、文章类型、国家。
3结果和讨论
3.1撤稿基本情况
(1)年度趋势。2012-2018年RW数据集中,应用筛选标准之前有关中国撤稿信息的条目数为2,044,剔除“更正”等类别后共得到1,881条有关“撤回”的记录,在此基础上进一步筛选出1,553篇撤稿文章。其中,每年撤稿量的平均值是222次,与2018年的发现一致[35],即中国是撤稿数最多的国家之一。在1,881条“撤回”记录中,2012年次数最少,小于170次;2015年最多,超过350次;2014年和2015年共有约700次撤回,占37%,年度撤稿数量形成凸曲线。每年的撤回次数在变化,很难通过波动到明确的趋势,详见图1。但如果将早期预探索中发现的年度撤稿量计算在内(2009年在800次以上,2010年在4,000次以上,2011年在2,000次以上,2012年为167次),则可以看到下降趋势非常明显。急剧下降的原因尚未可知,需要进一步探索。
(2)“付费墙”文章的撤稿频率。付费墙是对在线内容实行付费阅读的模式,在学术出版领域,研究论文的阅读、下载普遍需要付费,研究者一般通过机构图书馆付费统一订阅来获取论文,若没有统一订阅则需要为单篇文章付费才能获取原文。随着开放获取期刊越来越多,无需付费、向所有人开放的无付费墙文章数量不断增加。除付费墙字段N/A(不可用)的记录以外,付费墙文章数为25篇,而非付费墙文
章为691篇(占96.1%)。早期探索中的付费墙文章数量为698篇,文章总数为9,083篇,所占比例同样很小。如果撤回意味着原文章不具发表价值,开放获取论文的质量可能需要被审视。在科研共同体与Elsevier和Springer等大型出版商竞争中,这并不是好消息,只有质量不再受质疑,开放获取运动才能迈向更高的层次。
3.2作者和来源
(1)国际合作与分布。与中国撤回文章作者合作的国家和地区分布相当广泛。合作文章数美国位居第一(140次撤回),其次是日本、巴基斯坦、英国,再次是澳大利亚(13次)、加拿大(12次)、意大利(11次)和德国(10次)。美国占比最高不足为奇,根据Scimago排名数据,美国是科研实力最强的国家,有超过68万篇文献,H指数超过2,200。但是,国际合作分布很不均衡,排名前十的国家或地区占比高达96%。Sci2Tool的NAT(网络分析工具包)提供的原始网络摘要显示:42个节点,11个孤立节点;65条边,无自环或平行边;平均权重1.415;13个弱连通子图(11个为孤立点),最大的连通子图由23个节点组成。具体细节可以从Pajek
图表中看出:荷兰、2012201320142015201620172018图1中国研究人员撰写或合著文章被撤回
及其有关信息的数量(2012-2018)
奥地利、加纳、阿鲁巴、爱尔兰、新西兰、巴西、开曼岛、泰国、亚美尼亚和沙特阿拉伯是孤立的;一些国家组成一些小社区,如由马来西亚、巴基斯坦、埃及、西班牙和伊朗组成的社区。原网络并不是弱连通的,为了使可视化简洁且易于理解,可通过Sci2工具提取最大连通子图。
图2展示各个国家或地区的协作分布。图中的节点代表国家或地区,每个节点的面积与国家或地区出现频率相对应,连接线的粗细代表共现的频率(国际协作),每个节点的颜表示Louvain 算法划分的社区。社区内部的国家或地区具有更多的相似性和更强的协作意愿,而不同社区中的国家或地区之间存在更多的差异和较弱的关系。图2显示了在RW撤回数据集中与中国合作的国家或地区之间的关系,同一社区中的国家或地区联系更紧密。这种联系表现出的地理特征是:与中国合作的国家或地区倾向于
与地理距离较近的国家或地区合作,如瑞士、德国和意大利在一个社区内;挪威和瑞典在同一社区;英国和法国,约旦、南非和土耳其在同一社区。此外,澳大利亚与法国也在同一社区,表明经济和历史因素也
可能影响了社区分布。
图2中国科学论文撤稿的国际合作网络数字音响
(2)期刊来源。撤回文章来自717种期刊,其中大量期刊(495种)仅发布1份撤回通知。Tumor
Biology(Tumour Biology)-Official Journal of the International Society of Oncology and Bio-Markers(ISOBM)有88篇撤回文献,占5.7%,淮北赵斌
其次是PLoS One、Multimedia Tools and Ap-
plications 和Biochemical and Biophysical Research 。在撤稿最多的期刊中,没有一种是中
国出版的,这与Chen 等的结论一致[8]。至少撤回9篇文章的期刊有23种,发布的撤回通知约占总数30%。排名第一的期刊Tumour Biology 由Springer出版。通常顶级期刊每年都会发表很多文章,包括传播和生物学方面的文章,这可能会影响它们在撤稿名单上的排名。
(3)出版商。表1列出中国作者撤稿的主要出版商,排名前三的是Elsevier、Springer 和Wiley。Elsevier 和Springer 撤回文章量占撤稿总量的40%以上,侧面显示出其在科学出版领域的重要地位。从科学研究平等权利的角度来看,这是负面的,但在处理撤回文章方面,大型出版
表1撤回中国作者文章较多的出版商
出版商
Elsevier Springer Wiley PLoS
SAGE Publications Hindawi Spandidos
Springer -Nature Publishing Group Royal Society of Chemistry (RSC)e-Century Publishing Corporation BioMed Central (BMC)
American Chemical Society (ACS)Taylor and Francis Bentham Open
Institute of Electrical and Electronics Engineers (IEEE)
Taylor and Francis -Dove Press MDPI
Springer-Biomed Central (BMC)Wolters Kluwer Oxford Academic De Gruyter Modestum Verduci Editore
撤回文章数量(篇)3412841036861464444424134303029212117171312101010
占比(%)21.957518.287196.6323254.3786223.9278822.9620092.8332262.8332262.7044432.6400522.1893111.9317451.9317451.8673541.3522221.3522221.0946561.0946560.837090.7726980.6439150.6439150.643915
商可能会发挥更重要作用,其数据库足够大,也可以影响大多数存储库。
(4)作者。单个作者最高撤回次数为15次,仅有两位作者的撤稿达到15次,撤稿次数大于等于10次的仅有7人,大于等于9次的仅有15人。撤稿与文章的可靠性有关,撤稿最多的作者被揭露时可能会感到不适,其科研质量也受到质疑。不过,如果不同时比较撤稿原因,这个数字也不能说明太多信息,有待进一步探讨。
(5)机构。表2列出中国作者撤回论文较多的机构,有73个机构有1篇以上的撤稿。大多数机构(1,716个)只有1份撤回通知。没有某个机构撤回的文章很多,撤回的数量很大程度上取决于中国发表文章的总量。
表2撤稿较多的机构
机构
清华大学深圳研究生院先进材料研究所常州工学院电气与光电工程学院国家电网浙江省电力有限公司信息通信分公司成都理工大学材料与化学化工学院矿产资源化
学四川省高校重点实验室
齿槽转矩首都医科大学附属北京安贞医院小儿心脏中心浙江大学信息与电子工程学院中国计量大学计量测试工程学院河南理工大学机械与动力工程学院能源与动力
工程系
中国医学科学院北京协和医学院国家心血管病
中心附属阜外医院心血管疾病国家重点实验室小儿心脏科
中国人民解放军总医院外科肿瘤科暨南大学附属第一医院泌尿外科湖南大学广东工业大学轻工化工学院北京理工大学信息电子学院撤稿量(篇)126654333333333占比
(n=1,553)
0.7726980.3863490.3863490.321958
0.2575660.1931750.1931750.193175
0.1931750.1931750.1931750.1931750.1931750.193175
3.3领域
RW数据集可以识别来自不同科学领域的撤稿。生物-细胞、生物-癌症、遗传学、生物化学、生物-分子、医学-肿瘤学、化学、社会/协会期刊、材料科学、计算机科学、技术、医学-胃肠病学,这12个领域的撤稿数约占撤回总数60%(见图3)。考虑到Scimago记录的发表文章总数,这部分归因于这些领域的出版物总量很大。  3.4原因
本文将RW标记的撤稿原因作为原因类别划分依据,每篇撤回文章至少拥有1个原因标记。与其他相关研究中含原因的撤稿记录比例相比,如Aspura 等的27%[36],情况尚令人满意。最常见的原因是文章重复和图像重复(也称为“自我抄袭”),这并不奇怪,社交媒体上有关撤稿的新闻往往是关于中国文章的重复现象。中国是发展中国家,仍在追赶美国等先进国家。但是,当下数量导向的科学评估体系和寻求快速成功的社会氛围不能被忽略。
“有关数据的担忧或问题”“不当行为-官方调查”“作者不当行为”三者的比例相同。当对合法的作者权利主张存在疑问、争议或争议时,使用“关于数据的担忧或问题”;在公司法人或政府机构调查后发现不当行为时,使用“不当行为-官方调查”;当期刊、出版商、公司、机构、政府机构或作者本人声明研究犯有不当行为时,则使用“作者不当行为”。由于对数据或不当行为的担忧而撤回的文章超过四分之一,因此应重视伪造或剽窃等问题。
关于剽窃,Chaddah提出另一种观点,他称为“结果剽窃”[37]。他认为,研究人员重复已经发表的实验并获得有效数据是科学研究的共同特征。这似乎很合理:现代科学的主要特点之一是具有实证主义背景。重复实验不仅是可接受的,而且应当期待重复实验的出现以验证先前结果,
图3
各领域的撤回总数分布
(基础生命科学)生物-细胞(基础生命科学)生物-癌症(基础生命科学)遗传学(基础生命科学)生物化学(基础生命科学)生物-分子(健康科学)医学-肿瘤学(物理学)化学社会/协会期刊(物理学)材料科学(商业与技术)计算机科学(商业与技术)技术(健康科学)医学-胃肠病学其他领域

本文发布于:2024-09-23 11:24:44,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/216393.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:撤稿   中国   撤回   文章
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议