LOGO图片  

实验可重复性和在线数据存储

时间:2016.12.05 浏览:1305次 作者: 来源:

新华社伦敦11月28日新媒体专电(记者张家伟) 《自然•生物技术》28日就广受关注的韩春雨论文争议发表了“编辑部关注”,同时发表了一篇国际研究人员关于不能重复相关技术的文章,表示将在明年1月完成相关调查。中国河北科技大学的韩春雨及其团队今年5月在全球著名学术刊物《自然》的子刊《自然•生物技术》上报告说,他们发明了一种新的基因编辑技术NgAgo-gDNA。根据论文,与当前基因编辑领域内的主流技术CRISPR-Cas9相比,NgAgo-gDNA技术在一些方面具有优势。但随后中国以及国外都有学者公开表示,无法重复论文中描述的实验。这项研究成果遭到多方质疑。

在ISE专家看来,不管上述事件最终结果如何,数据的重复和存储在当今科学研究中,显得越来越重要。

科学的方法是通过实验重复确认结果的可靠性。通过重复研究结果,研究人员可以自信的宣布结果的真实可靠,而不是一个偶然的结果。比这更好的是独立研究人员的重复结果。更好的是被多个独立的研究人员通过改良的研究方法和不同的统计方法等重复研究结果。

这就是所说的重复性。我们都处在重复性的危机当中[1]。“有70%的科学家试图重复其他人的实验,但是以失败告终,还有超过半数的科学家未能重复自己的实验”我们能做些什么来解决这一问题?

许多实验室采取了独立的措施来解决这个问题,包括让第三方重复研究,标准化实验方法,预注册(研究人员在进行实验之前向准备投稿的期刊提交他们的假设,设计和数据分析计划 ,防止刻意选择)[1]。

从更广义上来讲,科学家提高再现重复性是强制是数据能够共享。数据共享是指研究人员公开其数据。其中一个方法就是他们能够通过将其数据上线到数据库中来实现数据共享。这种行为能够允许其他独立个体核实结果,并且能够促进文化的开放和透明[2]。它还“降低元研究的障碍,并使网络规模分析”[2]。
为了促进数据共享,许多期刊(PLOS One, Nature, The Royal Society等)以及资助机构 (NIH, STFC, NERC, Wellcome Trust等)采取强制数据共享策略。目前有超过1500个学科特定的、体制性的和包含多方面知识的数据库。

数据类型能够以广泛多种形式被上传,包括纯文本,简单的Excel文件,源代码,SPSS文件,GIS shape文件,基因组数据特定格式,视频,图像等。一些数据库也提供数字对象标识符(DOI)或通用数字指纹(UNF),因此研究人员能够在线引用数据库并将数据连接放在以后发表的文章或者会议论文中[3]。数据库能够被公开使用,允许即可搜索或下载数据,限制使用或者关闭使用。

大多数科学家认为数据存储库的开发是解决不可重现性问题的一个重要步骤。数据存储库的开发是解决不可重现性问题的一个重要步骤。然而,在成千上万个数据库中搜索选择到正确的数据对于作者来说是相当耗时的。

ISE专家推荐注册re3data.org,这个数据存储系统能够提供1637个数据储存库,使其成为同类中最大的数据存储库。

你可以使用一个简单的搜索框或者使用导航面板中列出的过了搜索适当的数据库。过滤器列表非常全面,涵盖从主题到内容类型(例如图片,源代码,纯文本等)到使用的软件(DSpace,DataVerse等)的所有内容,无论上传的数据是否可公开访问或限制。re3data.org为作者提供每个存储库的概述,包括存储库的简短描述,负责资助的机构,存储库的准则和政策,以及技术(例如数据集的版本)和质量(例如证书,审计 过程)标准。在与不可再现性的斗争中,作者将越来越多地被要求将他们的数据上传到存储库。

ISE声明和re3data.org数据库无利益冲突

1. Baker, M. (2016) 1,500 scientists lift the lid on reproducibility. Nature 533(7604), 452–454.

2. Taylor, M. (2013) Should research data be publicly available? Elsevier Connect. Weblog. Available at: https://www.elsevier.com/connect/should-research-data-be-publicly-available [Accessed 04 Nov 2016].

3. Uzwyshyn, R. (2016) Research Data Repositories: The What, When, Why, and How. Information Today, Inc. Weblog. Available at: http://www.infotoday.com/cilmag/apr16/Uzwyshyn--Research-Data-Repositories.shtml [Accessed 04 Nov 2016].

上一篇:边看边学,从科技文献全文中看动词时态具体用法

下一篇:出版商和科研基金资助机构数据共享政策

返回