LOGO图片  

用独立存储库来代替期刊补充文件

时间:2019.11.06 浏览:786次 作者:ISE 来源:

期刊补充文件常常包含重要信息,例如研究团队经过测试过的实验方案。由于链接断开而无法访问补充文件,会让人感到十分沮丧。匹兹堡大学的进化生物学家Vaughn Cooper说,这不是他第一次遇到这类问题,“我已经有多个来自不同出版商的实例,其中补充材料已经丢失”。

剑桥大学的化学家Peter Murray-Rust在推特上写道。“许多(并非所有)期刊通常不喜欢发表补充数据。”除了链接无法访问,科学家还指出了其他问题 - 例如链接很长、格式不对。由于这些问题的出现,学术界和出版商越来越多地转向独立的在线存储库作为一种潜在的解决方法。

补充文件不是科学论文中最迷人的部分。它们隐藏在论文的末尾,通常作为可下载PDF文件的链接。这些文件很容易被读者忽视,但对许多研究人员来说,补充文献反而更珍贵。它们通常包含数据,方法和方程式等材料,这些材料在未来的实验中非常有用,对于评估研究结果的可重复性至关重要。

补充文件是科学记录的关键部分,如果它们无法获取,那么其他人有可能就很难复制研究。补充材料还包含对理解论文本身至关重要的信息。Cooper说:“作者越来越多地被期刊要求将正文材料放到补充材料中,”这意味着通常属于论文的关键要素,例如结果,有时最终会出现在这些文件中。“当你把结果放在补充文件中时,那就意味着论文的主要主张可能没有被读者读到。”

随着论文数据变得越来越密集和复杂,补充文件往往比手稿本身长很多倍 - 在某些极端情况下,可能超过100页。由于这些文件通常以PDF格式发布,因此导航很困难,因此即使它们可用,其中的信息也会被忽略。“大多数补充材料只是一个大块而且不是很有用,”Cooper说。

除了使用复杂的软件,你无法从PDF中提取数据 - 而且这是一个有错误的缓慢过程,这些数据通常只作为存放数据而标记,而非实际上人们真正想要重复使用它。

存储库的流行

一些学者选择在他们自己的网站上发布补充信息,但更多人正在转向大学、研究机构或公司提供的在线存储库。作者有多种选择:除了常见存储库,如figshare,Zenodo和Dryad,还有许多特定主题的数据库,例如用于基因序列的GenBank,用于神经成像数据的OpenNeuro,晶体结构的Crystallography Open Database。

存储库提供了比期刊更好地存储和交互大量可公开访问的数据的能力。此外,存储库的文件标有DOI,这意味着研究人员可以轻松地从已发表的文章链接到它。

Figshare的首席执行官兼创始人马克·哈内尔(Mark Hahnel)表示,他在博士研究期间因为补充文件的局限性受挫而成立了公司。越来越多的学者使用figshare,例如能够自由地重复使用与已发表论文相关的资料,而不必担心侵犯版权(传统期刊中的图片等研究成果可能受制于出版商的版权政策,但存放在像figshare这样的存储库,通常会以cc by许可证发布,允许其他人无限制地使用该材料。)。

出版商鼓励使用存储库

出版商也在转向存储库。例如,专业组织和出版商Microbiology Society建议提交给他们期刊的作者将他们的补充文件存入独立的存储库,例如数据存储库figshare和Microreact,方法存储库protocols.io。一些出版商,例如F1000,已经停止接受补充材料,而是要求作者将数据提交到批准的存储库并在其手稿中引用它。F1000生命科学出版总监Michael Markie说。“我们说你需要将[数据]放入存储库,这样我们就可以保证读者始终能够找到这些信息。”

与Microbiology Society一样,Springer Nature建议研究人员将他们的数据存入合适的资料库。Figshare还为F1000,Microbiology Society,Wiley,PNAS和PLOS提供服务。“我们为几乎所有大型出版商都这样做,除了Elsevier,他们有自己的计划,”Hahnel说。

根据2017年Springer Nature对全球7,700多名学者的调查,大约63%的研究人员在发表手稿时共享过数据 - 但使用补充文件的人比例略高于使用存储库的人。

目前,没有足够的激励措施让研究人员花时间将数据放入存储库,整个科学社区需要共同努力,让研究人员以更优化的方式管理和共享数据。”

在哪里分享?

科学家们可以在超过1,000个存储库中选择一个存储与其手稿相关的数据和文档。其中大部分是针对特定主题的 - 专门针对化学和分子结构(Crystallography Open Database, Protein Data Bank, Coherent X-ray Imaging Data Bank),神经成像数据(OpenNeuro,NeuroVault)和数学模型(BioModels,The Network Data Exchange),仅举几例。一些出版商建议作者尽可能将材料提交给特定主题的存储库。

以下是一些最常用的通用存储库的简要指南。

上一篇:科学家不信任大量已出版的研究?

下一篇:我可以引用预印本吗?

返回