出版商和科研基金资助机构数据共享政策
时间:2016.12.05
浏览:2551次
作者:
来源:
1. 出版商数据共享政策
许多期刊(PLOS One, Nature, The Royal Society等)现在都有强制性的数据共享策略。 这意味着研究人员必须公开可用于“得到手稿中得出的结论”和“全面重复报告的研究结果”的数据[1]。
可以通过以下三种方式提供数据[1]:
1.在文章中-对于小的数据,能够用表格完整的呈现
2. 在补充支持信息中 - 适用于可在大型表格或压缩文件中显示的中型数据集,可从杂志网站在线下载模板。
3. 在数据存储库中 - 对于需要大型数据库基础结构来存储它们的大型数据集(例如,DNA测序)。
虽然选项3(数据存储库中的存储数据)最适合大型数据集,但强烈建议将所有大小的数据集上传到某种形式的存储库[1]。
具有强制数据共享策略的期刊要求作者在文章的第一页提供数据可用性声明,其中声明数据集的位置。
数据可用性语句的示例:
Data Availability: All relevant data are within the paper.
数据可用性:所有相关数据都在文章内。
Data Availability: All relevant data are within the paper and its Supporting Information files.
数据可用性:所有相关数据都在文章及其支持信息文件中。
Data Availability: The TaqMan Human MicroRNA Array experiments are MIAME compliant and have been deposited at the NCBI Gene Expression Omnibus (GEO) database (http://www.ncbi.nlm.nih.gov/geo) under accession GSE6459 [2].
数据可用性:TaqMan人类微小RNA阵列实验是符合MIAME的,并已保存在NCBI基因表达综合数据库(GEO)数据库(http://www.ncbi.nlm.nih.gov/geo)登录后为: GSE6459 [2].
Data Availability: All .bam sequencing files are available at the European Nucleotide Archive (http://www.ebi.ac.uk/ena) (accession numbers ERS700862, ERS700863, ERS700864, ERS700858, ERS700859, ERS700860, ERS700861) [3].
数据可用性:所有bam测序文件可在欧洲核苷酸档案库中找到。(http://www.ebi.ac.uk/ena) (登录后为:ERS700862, ERS700863, ERS700864, ERS700858, ERS700859, ERS700860, ERS700861) [3].
在某些情况下,你可能需要在准备公开发布数据或发布数据之前上传数据。 在这种情况下,可以上传到具有分层访问的存储库 - 即,数据只有在已发表在期刊中发布时才可用[1]。
这些强制性政策有例外吗?
在某些情况下,数据集太大或数据是人类患者数据,由于伦理原因不能公开提供这些数据。 在这种情况下,建议联系目标期刊来讨论这些问题的解决方案[1]。
选择哪个资源库?
许多期刊推荐了特定存储库的列表。你可以在此找到很好的例子。你可以通过注册re3data.org来做一个很好的选择。
是否需要费用?
在不同资源库中存储数据的费用是不同的。以Dryad方式存储,每个集合需要120美元(<20 GB);然而,他们对一些低收入国家有豁免的政策,例如“Nature”和Royal Society期刊(Biology Letters, Proceedings B and Royal Society Open Science)
会为以Dryad 和 Figshare方式进行数据存储的国家支付所需要的费用。
当涉及到数据共享时,最好是选择完全公开。 开放透明的数据共享不仅有利于科学界,而且赢得了公共纳税人(支付研究补助金)的青睐。
2. 科研基金资助者数据共享政策
除了期刊,资助者(NIH,STFC,NERC,Wellcome Trust等)也开始实施强制性数据共享政策[6],申请人被要求披露其数据管理计划(如果他们有这样适当的计划[或弱计划]。
2013年,所有美国联邦资助机构必须实施计划扩大公众获取研究数据集,接收联邦赠款的研究人员必须制定数据管理计划,“描述他们将如何提供长期保存和访问由联邦资助的研究产生的数字格式的科学数据,或解释为什么不能长期保存和获取”[7]。
国家科学基金会(NSF)要求一个(不超过)两页数据管理计划作为其申请过程中的一部分[8]。 随着这种数据共享标准的建立,数据集的长期维护和存档将不可避免地成为研究者(已经超载的)工作计划中的共同特征。
虽然初期时候很乏味,但建立有效的数据管理计划可以为您节省时间。通过事先选择数据存储库,可以避免以后重新组织或重新格式化数据文件。还可以通过个人数据请求定向到所需的存储库从而节省时间。有效地管理您的数据也将增加您的研究影响,确保您的数据保存,促进新发现,支持开放获取活动,当然满足资助要求[9]。
数据管理计划
有关写入数据管理计划的详细说明,请参见此处。 计划应包括:数据描述(例如,数据格式,查看数据的软件等); 人员(谁将负责管理数据); 帮助使数据可理解的文档(例如,只读文件); 存储(存储库多久?); 访问(数据将在期刊上发布,数据禁运? 预算等[10]。 可以在这里下载数据管理计划的PDF示例。
是否需要帮助?
DMPtool是一个免费的在线工具,能够提供模板和指导,其目的在于帮助研究人员创建数据管理计划。你可以自己创建一个帐户或以您的机构的用户身份登录(这将提供机构特定的指导)[11]。
开放获取和数据共享政策仍处于起步阶段,正在经历快速变化并且将很快成为研究过程的重要组成部分。 领先游戏,应该开始考虑您的数据管理策略,宜早不宜迟。
References
1. Plos One. (2016) Data Availability. Plos One. Retrieved from http://journals.plos.org/plosone/s/data-availability on 15 November 2016.
2. Wozniak, M.B., Scelo, G., Muller, D.C., Mukeria, A., Zaridze, D. and Brennan, P. (2015) Circulating microRNAs as non-invasive biomarkers for early detection of non-small-cell lung cancer. Plos One 10(5), p.e0125026.
3. Butler, T.M., Johnson-Camacho, K., Peto, M., Wang, N.J., Macey, T.A., Korkola, J.E., Koppie, T.M., Corless, C.L., Gray, J.W. and Spellman, P.T. (2015) Exome sequencing of cell-free DNA from metastatic cancer patients identifies clinically actionable mutations distinct from primary disease. Plos One 10(8), p.e0136407.
4. Dryad. (2016) Data publishing charges. Dryad. Retrieved from http://datadryad.org/pages/payment on 15 November 2016.
5. The Royal Society. (2016). Data sharing and mining. The Royal Society. Retrieved from https://royalsociety.org/journals/ethics-policies/data-sharing-mining/ on 15 November 2016.
6. Uzwyshyn, R. (2016) Research Data Repositories: The What, When, Why, and How. Information Today, Inc. Weblog. Available at: http://www.infotoday.com/cilmag/apr16/Uzwyshyn--Research-Data-Repositories.shtml [Accessed 15 Nov 2016].
7. Holdren, J.P. (2013) Increasing Access to the Results of Federally Funded Scientific Research. Office of Science and Technology Policy. Memorandum. Available at: https://www.whitehouse.gov/sites/default/files/microsites/ostp/ostp_public_access_memo_2013.pdf [Accessed 15 Nov 2016].
8. National Science Foundation. (2011) Chapter II - Proposal Preparation Instructions. National Science Foundation. Retrieved from https://www.nsf.gov/pubs/policydocs/pappguide/nsf11001/gpg_2.jsp#dmp on 15 November 2016.
9. MITLibraries. (2016) Data Management. MITLibraries. Retrieved from http://libraries.mit.edu/data-management/plan/why/ on 16 November 2016.
10. ICPSR. (2016). Elements of a Data Management Plan. ICPSR. Retrieved from http://www.icpsr.umich.edu/icpsrweb/content/datamanagement/dmp/elements.html on 16 November 2016.
11. DMPTool. (2016). FAQ. DMPTool. Retrieved from https://github.com/CDLUC3/dmptool/wiki/FAQ on 16 November 2016.
上一篇:实验可重复性和在线数据存储
下一篇:论文准备和投审稿过程中与杂志社编辑的沟通技巧(二)
返回