新浪科技 李根
国家基因库将于9月22号正式运营,这将是中国首个获批筹建的国家基因库,同时也是目前为止的唯一一个。该基因库由国家发展改革委、财政部、工业和信息化部、原卫生部联合批复,并由华大基因最终负责承建运营。
在开业前夕,新浪科技受邀前往国家基因库所在地,并实地与国家基因库执行主任、华大基因研究院院长徐讯进行了交流。
为何落地深圳大鹏区?
国家基因库位于深圳市大鹏新区大鹏街道下沙片区禾塘仔,依山傍海,环境优美,占地面积超过5万平方米,建筑总面积11.6万平方米。其中I期建筑面积4.75万平方米。
在基因库I期的整体外观上,仿造了梯田造型,并在背山面海的情况下,将自然生态的原有面貌和建筑本身的功能性需求融合在一起,打造了一个与外界相对独立、层层梯田种植屋面、混泥土本色与垂直绿化结合的生态外墙、室内绿意盎然、零排放的生态建筑。
如果说落地深圳更多的考量是承接方华大基因在深圳,那具体选址方面,华大基因选定目前的大鹏区地址则有三个方面的考量:
一是大鹏区选址相距不远处,恰好有LNG(液化天然气)码头,在LNG运送过程中会汽化并产生大量的冷能,可以直接用于基因库样品冷却;
其次是基因库目前选址建筑倚山体自然坡度而建,因为有山体结构的支撑,每一层都相当于第一层,稳固性较好,可以摆放重量较大的基因检测和存储设备;
最后是考虑到政策方面的优势,目前深圳正在全力推进“东进战略”,将在深圳东部沿海大鹏半岛规划建设国际生物谷,并将其打造成为国际领先的生物科技创新中心,国家基因库将是大鹏新区的重要产业基础设施。
将成全球最大基因库
据华大基因方面介绍,国家基因库由基因信息数据库和生物样本资源库组成。目前已经实现对基因信息数据总量达60PB的访问支持,制定基因信息数据采集、储存和管理相关标准和技术规范;1000万份可溯源性生物样本的存储能力,研究制定生物样本采集、储存和管理的相关标准和技术规范。
此外,据国家基因库执行主任徐讯介绍,深圳国家基因库也是世界上最大的基因库。在世界范围内,之前最大的是美国的NCBI,欧洲有EBI,日本有DDBJ,但在国家基因库正式投入使用后,吞吐量将达到美国的NCBI同等规模,不过考虑到国家基因库兼具的数据库、干库和湿库样品库,以及活体库等,国家基因库将成为全球第一家综合性基因库,并且从样品保存的规模、存储量和可访问的数据量来看也将是全球最大的。
国家基因库建立后的影响
除了整体的重要意义,徐讯还在本次媒体开放日中向新浪科技介绍了国家基因库对于每个人的重要意义。
徐讯称主要会有两个方面的意义。首先是罕见病诊断治疗方面,可以从基因数据上实现集中管理和追本溯源,“比如有一些罕见病的家族,他们对自己的疾病基因很关心,他们希望通过他们的努力能够让大家这些疾病,但是以前没有一个这样的组织能够把这些疾病的信息和样品集中起来管理,能够同时把他们链接到科研机构、科研团队,我们后面会发起一系列的科研志愿者的活动,其中就包括了很多罕见病的项目,大家都能贡献样品,能引起全世界科学家的重视,大家都能去参与这个疾病的研究,这样对于所有的个人来讲他们很有希望能发现这些罕见病、未知原因疾病到底以后怎么治疗、诊断,这既对个人有意义,同时对整个科研界有意义。”
另一方面是细胞样品的保存方面,每个人都有了“基因银行”。国家基因库作为公共平台,提供包括干细胞和免疫细胞保存的平台。一方面利用于科研和应用的转化,另一方面如果个人使用,也能具有银行的功能。
徐讯还介绍称,目前基因库I期样品的整体存储能力大概在三千万份,到二期会扩展到三亿份样品的存储。但徐讯也表示,如果让每一个中国人都有基因样本存储,至少需要达到100亿样本存储的规模。
至于基因库更长远的意义,徐讯表示将对基因测序有进一步的推动和发展。“以前的数据量因为我们对整个测完序之后很多东西不知道它背后的含义是什么,我们每个人大约有3个GB的基因组大小,但是我们真正能读得懂的区域只有1%的区域,99%的区域我们是不理解的。”
基因库的意义将推动基因的进一步解读和利用。“怎么能理解更多呢?就像我们做人工智能研究一样,你要认识一个苹果要看一万个苹果,就像下象棋,要知道一步棋要看上万步的棋一样,这个也是一样的,要看懂人类基因组上大量的未知区域的解读必须产生大量的数据,增加10%的理解至少需要一百万到一千万新增人的数据,所以只有大量提供数据才能产生出新的理解,而产生出新的理解之后测序的价值意义就会更大。”
值得一提的是,在华大基因的努力下,目前其自主研发的基因测序仪,已经将基因测序的成本降低了很多,未来的普及目标将是1000元,这也意味着每一个人对于储存在自己基因中的秘密,将有更加数据化的了解。