基于撤稿观察数据库的被撤销会议文献研究

收稿日期:2020-11-02      修回日期:2020-12-10
作者简介:邓支青(ORCID :0000-0002-7834-3527),女,1992年生,博士,研究方向:数据治理㊁公共政策;吴任力(ORCID :0000-0003-2370-6236),男,1994年生,博士研究生,研究方向:数据分析㊁信息资源管理㊂
福楼拜是怎样的老师
基于撤稿观察数据库的被撤销会议文献研究
邓支青1,2 吴任力3
(1.深圳大学管理学院 深圳 518000;2.深圳大学社会发展与公共政策研究中心 深圳 518000;
3.武汉大学信息管理学院 武汉 430072)
摘 要:[目的/意义]研究学术文献被撤销的规律和特征对于客观认识撤稿现象㊁净化学术环境㊁加强科研诚信建设具有重要价值㊂当前对于撤稿的研究集中于期刊论文,很少关注会议文献㊂[方法/过程]以撤稿观察数据库中7579篇被撤销会议文献为研究对象,分析总结被撤销文献的时间㊁来源和学科分布特征以及被撤销原因和时滞㊂[结果/结论]会议文献撤稿与期刊论文撤稿在原因和时滞上存在重要差异,中国是会议文献撤稿的 重灾区”㊂研究认为,科研人员㊁审稿人㊁出版商㊁科研管理机构亟需共同努力,加强对于学术会议的质量控制,提高相关主体行为的规范性㊂
关键词:撤稿观察;被撤销会议文献;文献特征;撤稿原因;撤稿时滞
中图分类号:G 203      文献标识码:A       文章编号:1002-1965(2021)03-0139-07引用格式:邓支青,吴任力.基于撤稿观察数据库的被撤销会议文献研究[J ].情报杂志,2021,40(3):139-145.DOI :10.3969/j.issn.1002-1965.2021.03.024
A Study of Retracted Conference Papers Based on the Retraction Watch Database
Deng Zhiqing 1,2 
Wu Renli 3
(1.College of Management ,Shenzhen University ,Shenzhen  518000;
2.Center for Social Development and Public Policy ,Shenzhen University ,Shenzhen  518000;
3.School of Information Management ,Wuhan University ,Wuhan  430072)
Abstract :[Purpose /Significance ]It is of great value to study the laws and characteristics of retracted academic documents for objectively understanding the retraction phenomenon ,purifying academic e
nvironment and strengthening scientific integrity.Current research on re⁃traction focuses on journal articles but rarely on conference papers.[Method /Process ]This paper analyzes the characteristics of time ,source and subject distribution as well as reasons and time to retraction of the 7,579retracted conference papers in the Retraction Watch Da⁃tabase.[Result /Conclusion ]It is found that there are significant differences in the reasons and time lags between the retraction of confer⁃ence papers and journal papers ,and that China is the "hardest hit"for the retraction of conference papers.We believe that researchers ,re⁃viewers ,publishers ,and scientific research institutions need to work together to strengthen the quality control of academic conferences and improve the normative behavior of relevant subjects.
Key words :retraction watch database ;retracted conference papers ;characteristics of papers ;reasons for retractions ;time to retract
0 引 言
在学术交流与传播中,已形成较为成熟的撤稿机制,用以修正文献并提醒读者注意包含严重缺陷或错误数据导致其发现和结论不可信的出版物,也被用于提醒读者注意重复发表㊁抄袭和未能披露的利益冲突问题[1]㊂其主要目的在于纠正文献并确保其完整性,
而不是惩罚涉及不端行为的作者㊂撤稿是一种世界性
的现象,即使不考虑具体原因,被撤销的文献也代表着 项目失败的明确证据”,撤稿的数量和频率也因此成为科学事业健康程度的重要指标[2]㊂因而,对于撤稿全面而系统的研究具有现实需要和重要价值[3]㊂
学术会议是研究成果交流与传播的重要渠道,会
http代理议所涵盖的广泛主题可以帮助科研人员重新获得其在专业研究中失去的一些更广泛维度的知识,并增加将这个社区联系在一起的沟通和联系[4]㊂会议文献则属
第40卷 第3期2021年3月             情 报 杂 志JOURNAL OF INTELLIGENCE
             Vol.40 No.3
Mar. 2021
于 发生在特定的社会文化背景下并具有特定的交流功能”的文献类型[5],可以在连接迥然不同的科学社区方面发挥作用,成为弥合不同科学专业之间差距的重要途径,并拓展专家的一般知识基础㊂会议文献正在成为重要的科学信息来源,对会议文献的撤稿机制也逐渐形成㊂但当前对会议文献撤稿的具体深入研究较为缺乏,不利于学术共同体形成对于学术会议成果交流与发表的清晰认知㊂
撤稿观察数据库收录了1990年以来的撤稿文献并不断更新,数据量大㊁信息齐全并可依据需求限定检索条件,为研究被撤销文献提供了良好的数据基础㊂本文以撤稿观察数据库中的会议文献数据为研究对象,揭示其规律和特征,为科研人员的会议选择和学术行为提供参考;为期刊编辑审核会议论文拓展版本提供针对性参考;促进会议文献出版机构和科研管理部门建立健全相应的管理机制,规范撤销论文操作,促进负责任高质量的科学研究发展㊂
1 文献综述
据‘自然“杂志报道,2001-2010年间文献总量增加了44%,期刊撤回的文章数量却增加了10倍,其中44%缘于作者的不端行为[6]㊂导致许多观察者呼吁出版商㊁编辑和其他把关者做出更大努力以消除不良的科学行为,这一关注促使伊万㊃奥兰斯基(Ivan Oran⁃sky)和亚当㊃马库斯(Adam Marcus)创建了撤稿观察(Retraction Watch)博客[7],通报最新撤稿情况并就与撤稿有关的问题展开讨论㊂当前,已有许多学者基于PubMed[8]㊁ScienceDirect[9-10]㊁Web of Science[11]㊁Re⁃traction Watch[12-13]㊁Scopus[3],CNKI㊁万方和维普[14]等数据库,对被撤销论文的地区㊁期刊分布情况及其时序变化和时滞,被撤销原因㊁发表时间㊁撤稿年份㊁撤稿后引文的时间变化等内容进行了研究分析㊂这些研究多以被撤销的期刊论文为研究对象,研究证实:抄袭㊁欺诈和同行评议等不端行为是造成撤稿的主要原因[2,11,15],严重影响了科学研究的可信度和社会声誉;而因撤稿操作不规范不明确,部分文章被撤销后仍被引用带来了产生虚假甚至是有害结论的风险[16]㊂向菲等人分析Web of Science和PubM
ed数据库2010-2018年间的撤稿数据还发现,撤稿会负向影响通讯作者的发文量㊁相对生产率㊁h指数和职位变化等学术表现,对其学术生涯产生消极影响[17]㊂张秀峰[18]㊁冷怀明[19]㊁张维等[20]从撤稿角度,分析总结了学术期刊应吸取的教训和抵制学术不端㊁维护学术规范与出版伦理的应对之策㊂这些研究对揭示被撤销文章的特征与分布规律,促进科研管理部门㊁出版机构以及科研人员提高对于撤稿文章的关注度,加强科研诚信监管和建设具有重要意义㊂
经统计,会议文献占据了学术文献的较大比例㊂仅以Web of Science核心合集为例,截至2020年11月
2日,此数据库共收录67562111篇文献,其中会议文献(会议论文和会议摘要)15214286篇,占总数的22. 52%;与此同时,共有929篇会议文献被撤回,占总被撤销文献的13.9%㊂一方面,当前仅有张路基于Sco⁃pus数据库对被撤销会议论文的总体分布特征㊁中国撤销论文及撤销论文的被引用情况等内容进行了规律性的统计分析[21],基于更广泛数据来源的被撤销会议文献的系统性的㊁深层次的研究尚存在空白;另一方面,会议文献相较于期刊论文有其特殊性,其撤稿有何规律?当前,对于会议文献的撤稿操作是否规范?这些问题亟待明确,以为科研管理部门㊁出版机构以及科研人员形成对于各学术会议的正确认识㊁完善撤稿操作㊁规范科研行为提供参考,全面净化学术环境,促进科研诚信建设㊂
2 研究过程与研究方法
 2.1 数据收集 本研究通过自编Python爬虫程序,以 Article Type(s)=Conference Abstract/Paper”为限定条件,从撤稿观察数据库爬取了7579篇文献㊂爬取数据中,每篇被撤销会议文献数据包含论文标题㊁学科㊁出版物名称㊁出版商㊁机构㊁撤稿声明URL㊁撤稿理由㊁文章作者㊁原始文献发表日期㊁撤稿日期㊁国家共11个字段㊂对于部分字段信息缺失或明显有误的数据,综合互联网搜索及Web of Science㊁Scopus等其他数据库信息予以人工补齐或更正㊂
 2.2 数据分析 本研究基于爬取的数据信息,分析被撤销会议文献的时间变化㊁出版商㊁作者来源等特征㊂结合撤稿观察数据库用户指南中有关撤稿原因的描述,分析会议文献被撤销的原因;对于仍不明确其含义的撤稿原因,通过必应和百度搜索引擎的互联网搜索,依据原始撤稿声明的信息客观理解并最终确定㊂两位作者对每项撤稿原因及其描述进行了独立翻译㊁交叉审核与共同修正,确保无分歧㊂最终,从95种不同撤稿原因中提取出与会议文献相关的撤稿原因,共57种[22];运用Ucinet和NetDraw进行撤稿理由共现网络中心度的分析并绘制有向图;并根据数据库指南对撤稿原因的具体描述对其进行再分类归总㊂
3 研究结果
 3.1 被撤销会议文献的特征
3.1.1 时间分布 截至2019年3月31日,撤稿观察数据库共收录了19911篇被撤销文献,其中包含199
0年以来发表的7579篇会议文献㊂撤稿总量分布
㊃041㊃                     情 报 杂 志                  第40卷
与会议文献被撤销数量变化如图1所示
㊂     图1 撤稿观察数据库中被撤销的文献总量与会议文献数量变化注:图中,2019年仅包含2019年1月1日至3月31日间的撤稿数据
从图1可以看出,被撤销的会议文献与所有类型文献在数量上随时间变化的趋势基本一致㊂2004年以前,被撤销的会议文献数量极少㊂2009-2011年三年间,撤稿总量和会议文献撤稿数量剧增;2010年撤销的会议文献数量最多,缘于电气和电子工程师协会(IEEE )的几次大规模集中撤稿事件㊂会议文献撤稿数量占总撤稿数量的比例的变化趋势则表明,会议文献撤稿在总撤稿中占有较大比例,2009-2011年间均
超过半数,2010年占比甚至高达89.36%㊂这也说明,
会议文献属于撤稿研究中不可忽视的重要部分㊂
3.1.2 来源分布 7579篇
被撤销会议文献来自270个不同的出版物;从出版商来看,7362篇被撤销会议文献为IEEE 出版,占被撤销会议文献总量的97.14%㊂其中,撤稿数量排名前20的出版物的撤稿总量占被撤销会议文献总量的比例高达73.98%,而这些会议多在中国的广州㊁武汉㊁成都
等城市举办㊂撤稿数量最多的为
2011年第二届电子商务与电子政
        务国际会议(International Confer⁃
ence on E -Business and E -Government ,ICEE ),由IEEE 和上海大学主办,上海大学管理学院承办,上海商学院和南京信息工程大学协办㊂为更加清楚了解这些高被撤销会议文集的特征,本研究依据原始出版物统计了论文总量数据,并据其计算撤稿数量占会议接收论文总量的比率,如表1所示㊂从中可以看出,撤稿数量排名前20的来源出版物所发表的论文数量总体偏多;撤稿比例最高达90%左右㊂
表1 被撤销会议文献数量Top 20的会议文集
出版物名称
会议地点论文总量撤稿数量撤稿比率(%)
2011International Conference on E -Business and E -Government
上海2299127955.632010International Conference on Computer Application and System Modeling 太原248143817.652010IEEE International Conference on Advanced Management Science
成都478
42889.5420112nd International Conference on Artificial Intelligence ,Management Science and Electronic Commerce 郑州186440321.6220103rd International Conference on Computer Science and Information Technology 成都139039928.7120102nd International Conference on Computer Engineering and Technology 成都113435931.662010The 2nd Conference on Environmental Science and Information Application Technology 武汉72828939.702009International Conference on Management and Service Science 武汉191627414.302011International Conference on Business Management and Electronic Information 广州94224025.482010International Conference on E -Business and E -Government 广州139121815.6720102nd International Workshop on Education Technology and Computer Science
武汉62521334.082010Asia -Pacific Power and Energy Engineering Conference
成都140718212.9420112nd IEEE International Conference on Emergency Management and Management Sciences 北京23113859.742010International Conference on Computer and Communication Technologies in Agriculture Engineering 成都40813733.582010International Conference on Management and Service Science
武汉1713
1287.472010International Conference on Optics ,Photonics and Energy Engineering 武汉23211449.1420102nd International Conference on Mechanical and Electronics Engineering 京都22610747.352011International Conference on Product Innovation Management
武汉
1839149.732010International Conference on Educational and Information Technology
旧金山3938822.3920102nd IITA International Conference on Geoscience and Remote Sensing
青岛32782
25.08  7579篇文献的作者来自60多个国家和地区,来
自中国的最多,占被撤销会议文献总量的91.20%㊂
如表2所示,被撤销的会议文献以独著或2~3人合著为主;单篇文献作者数量最高达13人㊂从作者所在机
141㊃ 第3期           邓支青,等:基于撤稿观察数据库的被撤销会议文献研究
构判定其所属国家或地区,7392篇文献由来自同一国家或地区的作者独立或合作完成;187篇由跨国(地区)的多名作者合著,而其中108篇又属于中国作者与其他国家(地区)作者合著的情形㊂
表2 被撤销会议文献的作者特征
作者特征撤稿数量(占比)单篇文献作者数量
11644(21.69%)
2-34577(60.39%)
≥41358(17.92%)作者所属国家或地区
中国6912(91.20%)
美国93(1.23%)
伊朗80(1.06%)
马来西亚43(0.57%)
印度42(0.55%)
其他409(5.40%)
  注:表中 其他”包含作者全部来源于中国㊁美国㊁伊朗㊁马来西亚和印度以外的国家和地区的情形,以及包含此五国在内的跨国(地区)合著的情形㊂
3.1.3 学科分布 被撤销的会议文献来自不同的学科领域,根据数据库所提供的 学科”字段,可将被撤销文献归为商业与技术㊁社会科学㊁自然科学等7个不同的学科领域;其中,部分文献同时标识了多个学科领域,本研究分析时在每一领域各计一次㊂7579篇被撤销会议文献的学科分布情况如表3所示:
表3 被撤销会议文献的学科分布
序号学科被撤销会议文献数量
1商业与技术(B/T),包含经济学㊁管理学㊁公共关
系㊁计算机科学㊁国际关系㊁行政管理㊁城市规划等
5764
2自然科学(PHY),包含数学㊁统计学㊁材料科学㊁化
学㊁物理学㊁天体物理学㊁地质学㊁能源㊁工程学等
3814
3社会科学(SOC),包括教育科学㊁社会学㊁法律㊁传
播学㊁语言学㊁军事研究㊁心理学㊁体育和娱乐等
1875
4环境科学(ENV),包括生态学㊁环境科学㊁水科学
710
5基础生命科学(BLS),包括农学㊁生物化学㊁毒理
学㊁植物生物学㊁微生物学㊁解剖学㊁人类学等
435
6健康科学(HSC),包括医学㊁生物统计学㊁流行病
学㊁公共卫生㊁职业健康与安全等中国产经新闻报社
301
7人文科学(HUM),包括艺术学㊁历史学㊁建筑学㊁哲
学㊁宗教学等
186  分析可知,被撤销的7579篇会议文献中,绝大部分来自商业与技术领域,尤以经济学㊁管理学㊁计算机科学及其与数学和工程科学的交叉领域文献为主,与文献的会议来源主题相一致;健康科学和人文科学领域被撤销的会议文献占比较小㊂这种结果,部分缘于不同学科领域所发表的会议文献总数的差异,也与以电子商务㊁电子政府㊁管理科学㊁计算机技术应用等为主题的部分学术会议接收论文数量大,撤稿比率非常高有关㊂ 3.2 会议文献被撤销的一般特征 撤销已出版的文献,属于撤稿主体在内外部环境和制度作用下所作出的一种反应[23],可以被视为一种行为,并具有其规律性㊂
3.2.1 被撤销原因 一篇文献被撤销可能同时涉及多种理由㊂7579篇文献中,3944篇文献的撤稿原因被标记为 Notice-Limited or No Information”或 Notice-Lack of”,即撤稿声明中有关被撤销原因的说明信息很少,或原始文献被添加了撤销或更正的水印但没有任何说明;或出版商从发布平台中删除了文章,但没有发布撤稿声明㊂其他包含明确撤稿理由信息的3635篇文献中,因完全相同原因被撤销的文献数量大于等于10篇的情况如表4所示:
表4 会议文献被撤销具体原因及其数量(≥10)
序号撤稿原因数量序号撤稿原因数量1作者违反政策
期刊或出版商的调查
声明-有限的或无信息
13167
篡改或伪造数据
作者的学术不端行为
伪造的作者或署名
期刊或出版商的调查
第三方团体的调查
23 2作者主动撤回
期刊或出版商的调查声
明-有限的或无信息
5578
作者主动撤回
撤回以在不同的期刊上
发表
声明-有限的或无信息
撤稿或其他的日期未知
13
3期刊或出版商的调查
声明-有限的或无信息
4519文章重复(自我抄袭)12
4作者主动撤回
声明-有限的或无信息
44410期刊或出版商的错误
缺失来自作者的同意
11
5作者违反政策
期刊或出版商的调查
吴郡四姓
31611
作者主动撤回
撤回以在不同的期刊上
发表
声明-有限的或无信息
10
6作者违反政策19812文章抄袭10  为便于分析并更加清晰呈现会议文献被撤销的规律,本研究参考张晴等[24]㊁刘清海[25]㊁Varela等[26]对撤稿原因的分类,结合撤稿观察用户指南中对于各类撤稿理由的描述,将57种原因归为14类㊂
表5 会议文献被撤销原因归类及其数量
菲特台风路径
序号撤稿原因类别数量序号撤稿原因类别数量1未知或信息不全62028不可靠问题13 2遭投诉㊁反对与调查28169版权争议6 3违反政策或惯例194010法律问题4 4作者撤回106911伦理问题4 5作者的学术
不端行为29412违背客观性原则3 6错误性问题6213其他(引用撤稿文章等)3 7担忧或争论性问题1814作者㊁出版商等的失误2  综合表4和表5来看,对于明确声明了撤稿理由的会议文献,因作者违反期刊㊁出版商或机构接受的政策和惯例而遭受投诉㊁反对与调查是最主要的原因㊂
㊃241㊃                     情 报 杂 志                  第40卷
回溯相关撤稿声明,论文被会议文集收录,但作者并没有注册会议发表其文章;作者在文献中披露了机密性信息等都属于作者违反相关政策的表现㊂尽管因作者违反出版商政策或惯例而撤销的会议文献数量很大,但出版商所发布的撤稿声明中都没有明确陈述具体行为事由㊂作者因受到调查而主动撤回或撤回以在不同期刊发表的情形属于会议文献被撤销常见的原因㊂作者伪造或篡改数据㊁抄袭㊁伪造作者或署名不实㊁未获得原始作者或第三方同意等学术不端行为也是会议文献被撤销的重要原因㊂其他,如在数据收集㊁输入和计算,结果分析㊁方法设计㊁图像制作等方面的错误,对于数据有效性㊁文章署名㊁文献引用㊁结论客观性的争议或担忧,研究结果的不可复制性,存在版权争议或法律㊁伦理方面的问题,因利益冲突未能保持研究中的客观性,引用了已被撤销文献等原因也造成了一定数量的会议文献被撤销㊂从撤稿声明中包含明确撤稿理由信息的文献来看,一篇会议文献多因两种或两种以上原因被撤销㊂因此,本研究构建了撤稿理由的共现网络图(如图2所示),据其揭示不同撤稿理由之间的关联关系
领袖性格
图2 会议文献被撤销原因共现网络图
从图2可以看出,作者主动撤回㊁作者违反政策㊁出版商的调查㊁伪造的作者㊁声明-有限或无信息㊁第三方团体的调查㊁公司/机构的调查㊁篡改或伪造数据㊁分析错误㊁有关数据的担忧或问题等10个撤稿理由的网络中心度明显高于其他原因,表明它们属于会议文献被撤销原因共现中高频出现的撤稿理由㊂除了撤稿理由不明的3944篇文献以及因单一原因被撤销的38篇文献,其他3597篇文献均同时涉及多种撤稿理由,以因作者违反政策惯例㊁学术不端或错误性㊁不准确性等问题遭受出版商或第三方团体调查而主动撤回稿件或被出版社撤销稿件为主㊂
3.2.2 被撤销时滞 发表时间与最终撤稿时间
之间的差,构成文献的撤稿时滞[27]㊂无论撤稿原因为何,撤稿时滞都在一定程度上反映了学术界识别发现
有问题的科学研究人员或成果的效率,是科学环境净化时效的一种表征㊂经统计(如表6所示),7579篇文献中撤稿时滞最短的为0天,涉及25篇文献,撤稿原因以作者主动撤回以在其他期刊发表或作者的抄袭㊁伪造篡改数据两类学术不端行为为主㊂究其缘由,一是因为许多作者会将会议论文进一步拓展作为期刊论文发表,从而主动要求撤回其文章[28];二是因为随着技术的进步与应用,文章抄袭等不端行为很容易被学术不端检测系统识别出来,从而造成撤稿㊂撤稿时滞最长的为3991天(约合11年),
涉及的文献为1990年发表的医学领域有关消化内科和药理学的文章,回溯出版商的撤稿声明:作者涉及篡改和伪造数据,英国医学委员会(General Medical Council )认为作者犯了严重的不端行为,并将其停职1年㊂综合来看,7579篇会议文献被撤销的平均时滞为59.7天,约为2个月的时间;其中,53.44%的文献的撤稿时滞在31~60天之间㊂
表6 会议文献被撤销的时滞(天)分布
撤销时滞(天)被撤销会议文献数量(篇)
比例(%)撤销时滞(天)
被撤销会议文献数量(篇)
比例(%)0~7
139
1.83
181~210180.248~30169122.31211~240110.1531~60405053.44241~270190.2461~90
116015.31271~30050.0791~12087
1.15301~3304
0.05121~1502803.69331~360130.17151~180
210.28>36581
1.07
4 研究结论
本研究以撤稿观察数据库中收录的7579篇被撤销的会议文献为研究对象,从时间和来源两个方面分
析了被撤销会议文献的特征,从原因和时滞两个方面分析了会议文献被撤销的一般特征㊂基于研究结果,结合已有相关研究,可得出以下几个主要结论: 4.1 学术会议的全面质量管理亟待加强 分析发现,被撤销的会议文献数量大,在总撤稿数量中占有较大份额,甚至在部分年份贡献了绝大多数的撤稿㊂其中,IEEE 所批准主办或协办的会议及其出版的会议文集是被撤销会议文献的最主要来源㊂对此,IEEE 发布的声明中称,IEEE 长期致力于确保会议及其所发表的论文的高质量㊂但通过其常规会议质量监控流程,IEEE 意识到,在同行评议和会议组织程序的质量方面,某些会议存在不一致之处㊂通
过进一步的深入调查发现,某些会议的组织程序委员会遵循的程序不足以确保符合IEEE 对高质量出版物的高标准,IEEE 决定剔除部分会议[29]㊂因而,有必要加强对于学术会议
341㊃ 第3期           邓支青,等:基于撤稿观察数据库的被撤销会议文献研究

本文发布于:2024-09-23 11:15:33,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/45826.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:文献   撤稿   会议   撤销   研究   作者   数量   原因
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议