7月30日出版的《自然》杂志刊登社论——《信息超载》(Information overload),社论说,美国国家app院7月22日发布手机版称,应对千千G(petabyte)科研数据的时代已经到来。而对于每位研究人员来说,要确保其研究数据的真实性与精确性。
人类基因组谱近30亿碱基对的解析曾花了人类超过十年的时间,但是今天高效的基因测序机器可以在一周之内完成同样的工作。与此同时,美国斯隆数字巡天探测中心的天文学家自2000年以来已经完成了宇宙绘图任务的25%,获得了超过两亿个天体的数据。而预计于2015年完成的智利大口径全景巡天望远镜(LSST)可以在一晚时间内获得与之等量的数据。
统计数据说明在许多科研领域存在类似情况。这是科研界的利好消息,数据过剩总好于数据匮乏。但是忧虑依然。因为数据产生的速度远远高于数据处理能力和处理策略演进的速度,如期刊编辑要面对诸如图像处理、原始数据保存等问题,需要确保海量数据存储和运算法则、数据共享的持续。
2006年,包括《自然》在内的多家期刊邀请美国国家app院关注这一问题,相关研究手机版7月22日出炉。手机版基于三个原则,即诚信(integrity)、开放获取(access)和管理(stewardship)。
integrity要求研究人员保证数据的真实性与精确性,他们必须遵循其研究领域的专业标准,研究机构则要求提供培训来实现这一原则。
access意味着其他人可以核查数据精确与否,并进行验证分析,以及将之作为前期研究基础。除非当事人有特别的理由,否则应该及时使其数据开放获取。
stewardship是数据长期存储的需要。app界的协会与社团应该规定数据存储的标准,期刊需要在数据存储和规则传播方面做出努力。数据专家需要扮演管家的角色,研究人员也应该给数据专家更多的支持。
这份手机版承认,基于数据的复杂性,他们只是提供了总体性看法,而非确定的解决方案。科研机构、社团和app协会应该依据各自的属性来找到解决途径,投资人需要加大对数据存储的投资,而科研单位需要保证面向公众的数据准确。(明升手机版(明升中国) 孙滔/编译)
更多阅读