|
|
加密“云”为个性化医疗铺平道路 |
极致方法使安全访问敏感信息成为可能 |
基因测序数据云处理有望加速发现与疾病相关联的基因突变。图片来源:David Paul Morris
未来医疗的梦想是掌握基因与疾病之间的关系,并据此制定出个性化的医疗方案。但是app家认识到这种“个性化”或“精准”明升手机版存在一个问题:即如何在保证基因数据和医疗记录安全的同时,用基于云端的大规模数据分析处理这些数据。如今,一种方兴未艾的数据加密技术表明,这一难题或已得到解决。
在美国加州大学圣迭戈分校(UCSD)近日举行的一次研讨会上,密码学专家分析了用于测试的基因数据。他们利用较小的数据组以及一种叫作“同态加密”的方法,在10分钟左右就可以找到与疾病相关联的基因变异。而在现实中,计算机经常会在数小时内陷入停顿,例如要在相当于全基因组的数十万分之几的基因片段中找出与某种疾病相关联的基因异变。“这是一项很有前途的研究成果。”UCSD计算机学家、帮助组织此次研讨会的Xiaoqian Jiang说,“但在扩展其用途方面依然存在许多挑战。”
医生和研究人员认为,为了了解基因如何影响疾病,就需要获得采集自数千万个人的基因和健康数据。他们已经开始计划其中的一些项目,如美国总统奥巴马的“精准明升手机版计划”以及英国的“10万人基因工程”等。类似的重大研究项目需要具备云计算机网络处理能力,但近年来的网络安全问题却表明,把如此海量、敏感的信息放在网络空间会存在极大风险。例如美国国立卫生研究院的基因型和表型数据库(dbGaP)中的基因和明升手机版数据便因为安全问题,而禁止使用这些数据的用户把数据储存到联网的计算机上。
而同态加密则让这一问题得到解决,其方法是通过让app家仅在云端储存在数学上打乱的(或称作为加密)形式的数据。这种方法包括在一台本地电脑上对数据进行加密,然后把打乱的数据上传到云端。已加密数据的运算可以在云端进行处理,然后生成的加密结果被返回至本地计算机,最终由本地计算机解码答案。如果有数据窃取者想在此过程的任何一点上截取加密数据,那么其中的所有数据都将保持安全。
“如果我们可以证明,这些技术确实可以发挥作用,那么它将可以为通过计算机运算及储存这些需要保护个人隐私的高通量数据提供更安全的保证。” UCSD计算机学家及此次会议组织者之一的Lucila Ohno-Machado说。
同态数据加密首次在1978年提出,它与其他加密方法的不同之处在于:它可以交由云端操作打乱这些数据,而从本质上说,云端永远不会“看到”它所运作的数据。而且,和其他加密方法不同,当它进行加密数据运算时,其运算出的结果和正常情况没有出入。
然而,在2009年纽约州IBM托马斯·沃森研究中心的加密专家Craig Gentry证明这种方法可以对同态加密数据执行任何一种运算之前,该方法一直仅停留在理论概念层面。Gentry通过把每个数据点转化成一段加密信息,或称密码文本,而加密后的信息比初始数据更加庞大、复杂。一个未加密的数据可能会被加密成拥有数百万字节的密码文本——其大小相当于一张数字化照片的尺寸。这种方法是一个进步,但由于需要对其解密,相关运算却可能达到14个数量级。因此 Gentry的方法就其特点来说为解决上述难题提供了一种可能性,但其运算方面的复杂程度却让其难以走向现实应用。
自那时起,密码学专家就在开发新的系统解决这些问题,例如通过对许多数据片段一起加密,这样可以使它们同时得到处理;或是通过把真实数据直接加密为单个加密文本,而不是像起初那样把它们加密为多个加密文本。这些创新比原来对每个片段的数据分别进行加密及执行运算所花费的时间和内存都更少。来自IBM研究中心的Shai Halevi说,现在的同态加密运算速度比2009年的运算速度快15万倍。“同样的一项运算,2012年可能要花费一天半,但现在我们5分钟就能搞定。”他说,“现在是时候提出,这样的速度是否足以达到应用阶段了。”
尽管如此,依然有人对这种方法持怀疑态度。马里兰州贝塞斯达国家生物技术信息中心收藏部主管Steven Sherry表示,即便同态加密可以起作用,也不足以保护研究人员电脑中的数据。但是一些密码学专家已经开始在生物医药领域配置有限的同态密码系统。例如,瑞士一些艾滋病病毒研究管理人员和一家生物明升手机版库就在利用这种方法:他们仅对一小部分相对简单的运算采取这种方法,因此并不介意当前的系统并不适宜快速地进行复杂运算。
尽管如此,也有人担心这些基因数据存在被泄露的潜在风险。设计该系统的瑞士联邦理工大学Jean-Pierre Hubaux说:“app家确实担心不久的将来可能会出现一些丑闻,而他们却因为没有事先采取恰当的防范措施遭受批评。”(红枫)
《明升中国app报》 (2015-03-30 第3版 国际)
更多阅读