您当前的位置:首页 >> 科技中心 >> 科技进展 >> 生物技术 >> 国内 >> 正文
宏基因组学挖掘新型生物催化剂的研究进展
日期:2012-06-19 作者:王魁 汪思迪 黄睿 刘玉焕 来源:《生物工程学报》.-2012,(4).-420-431 点击:
 

    宏基因组学起源于上世纪70年代土壤微生物基因组DNA的研究;1980年,Torsvik建立了土壤细菌总DNA的直接提取方法;1991年,Pace研究组通过构建环境样品的DNA文库筛选得到16S rRNA基因(rDNA),首次证明了从环境中克隆基因的可行性;1995年,Healv等以木质纤维素底物富集培养后的微生物为样品,通过构建基因组文库,筛选得到纤维素酶,证明了从环境样品中直接获得生物催化剂的可行性;1996年,Stein等通构建海水样品的基因组文库筛选到了一个新的古菌16S rRNA基因,确立了环境基因组学在挖掘新基因研究中的特殊地位。1998年,Handelsman等在前人研究的基础上,首次提出了“宏基因组(Metagenome)”的概念并使用了“Metagenomics”这一名词,由此宣告了宏基因组学(Metagenomics)的诞生。宏基因组是指某一特定生境中全部微生物遗传物质的总和,包含了可培养的和尚不能培养微生物遗传信息的总和。所谓宏基因组学就是利用非培养的分子生物学技术、方法和手段,对宏基因组进行系统研究,即分析微生物在环境中的基因组集合,研究其群落结构、进化关系、相互协作关系与生态功能等。它绕过了微生物分离培养过程,成为研究环境样品中高达99%的不可培养微生物(Uncultured microorganism)的有力手段,为后续的筛选提供更加全面和多样的基因资源,有效地提高了新型生物催化剂的筛选效率。宏基因组学从诞生至今仪有十余年时间,但已引起了世界的广泛关注。通过SCI检索发现,自2002年以来关于宏基因组的研究报道已经超过1200篇,而且呈现逐年升温的趋势(1)。宏基因组学在新型生物催化剂的研究中取得了令人瞩目的进展,成为国际生命科学技术研究的热点和重点之一。其基本策略流程为:采集样品;提取特定环境中的基因组DNA;构建宏基因组文库;筛选阳性克隆子;目的基因的亚克隆和表达;目的催化剂的生化特性分析(2)。近年来研究者们已利用宏基因组文库技术从不同环境样品中筛选到了脂肪酶/酯酶、淀粉酶、木聚糖酶、纤维素酶、β-葡萄糖苷酶等多种具有工业应用潜力的生物催化剂(1)。随着宏基因组学在挖掘新型生物催化剂中的广泛使用,我们进入了宏基因组学挖掘生物催化剂的时代。本文着重从宏基因组学研究的样品来源、宏基因组DNA的提取、宏基因组文库的构建和目标克隆的筛选策略4个关键方面着手,系统综述了采用宏基因组学方法进行新型生物催化剂研究的现状,并对今后的研究和发展方向提出了展望。

1  宏基因组文库的样品来源

    微生物数量巨大,种类繁多,广泛分布于不同的物理化学环境,在自然界长期缓慢的进化过程中,已经产生了功能多样的、在不同生理环境下具有高度精确性和特异性的生物催化剂,适应了各自的环境。所以,自然界的微生物中隐藏了一个巨大的宝藏,蕴藏着大量适于不同工业生产条件(温度、pH、压力、离子强度和化合物浓度)的生物催化剂,且不同微环境中生物催化剂的种类和生化性质大不相同,而人们一直在寻找的某种生物催化剂很有可能已经存在于某一特定环境的微生物中了。因此,在采用宏基因组学方法挖掘生物催化剂时,样品来源格外重要。随着构建的宏基因组文库类型的日渐增多,Ivanova等认为有必要将宏基因组文库进行分类,以便对不同环境中的基因组信息进行比较分析。迄今为止,为了筛选生物催化剂,研究者们构建了各种各样的环境样品文库,它们的样品来源可归为5大类:陆地环境,水生环境,寄生环境,人工环境及其他特殊环境(2)

    目前,宏基因组学研究的样品主要来源于土壤环境和海洋环境。这是因为土壤具有微生物进行生长繁殖和生命活动所需的各种条件,是微生物生活的最适宜环境。据估计,每克土壤中含有高达10000种不同的微生物,这表明土壤微生物宏基因组是一个巨大的基因资源库,对它们的挖掘能够获得大量的生物酶制剂;而海洋环境在压力、盐分、温度和营养成分上的极端变化赋予了海洋微生物在物种资源、基因功能和生态功能上无与伦比的生物多样性。本实验室从红树林、农药污染的棉田、油田等环境的土壤样品中筛选到了酯酶、漆酶、β-半乳糖苷酶、阿魏酸酯酶、单宁酶,并在此基础上研究了这些新型生物催化剂的酶学特性。

    为了获得性能更加多样的生物催化剂,研究者们需要广泛地采集环境样品,特别是一些极端环境中的样品。

2  宏基因组DNA的提取

    宏基因组DNA的提取是构建宏基因组文库的关键步骤,因为环境样品总DNA的浓度、纯度、片段大小和偏好性等因素将直接影响宏基因组文库的质量和代表性。DNA提取方法大体可分为两类:直接提取法和间接提取法。

    直接提取法,又称原位裂解法,这类方法是通过物理法、化学法或酶解法直接裂解环境样品中微生物的细胞壁来提取DNA并加以纯化。目前常用的裂解方法中,物理法有反复冻融法、超声法、玻璃珠击打法、液氮碾磨法等;化学法所采用的化学试剂有表面活性剂(SDS)、盐类、有机溶剂等;酶解法则主要采用溶菌酶和蛋白酶K。不同裂解法的差别在于细胞破壁的方式不同。直接提取法无需对环境样品中的微生物进行复苏处理,操作简便,且样品中的微生物能够被裂解得比较完全,故DNA提取得率高,所获得的基因组DNA能较好地反映样品中微生物种群的多样性。但由于操作过程中机械剪切力大,导致所获得的DNA片段较小(150kb),且多为平端;此外,由于提取的基因组DNA中混有金属离子、腐殖酸、多糖、多酚化合物等杂质,纯度较低,往往还需要经过纯化处理才能满足后续分子生物学操作(DNA酶切、PCR扩增)的需要。该法提取的DNA主要适用于以质粒或λ噬菌体为载体的小片段文库的构建。

    间接提取法,又称异位裂解法,是利用梯度离心或者差速离心等方法先把微生物从环境样品中分离出来,然后再用比较温和的方法提取基因组DNA。该方法受土壤中杂质的污染较小,提取条件比较温和,所获得的DNA纯度较高,片段大(20500kh),适合于构建以柯斯粘粒(Cosmid)和细菌人工染色体(Bacterial artificial chromosomeBAC)为载体的大片段文库;但该方法操作繁琐,前分离过程会造成部分微生物细胞的丢失,加上温和条件下细胞壁较厚的微生物不易被裂解,因此所获得的DNA中基因组信息的广泛性不及原位裂解法,得率只有原位裂解法的1%10%

    DNA产率、纯度、片段长度及对整个微生物群落的覆盖率等方面进行评价,直接法和间接法各有优势和不足。总体来看,国内外学者和研究人员采用直接提取法的较多。针对直接提取法得到的环境总DNA中杂质较多的问题,研究者们建立了多种DNA提取纯化方法。Zhou等通过在基因提取过程中使用PVPPCTAB去除多糖和腐植酸,获得了适于建库的高质量环境总DNA,此方法在后来的宏基因组学研究中被广泛采用;Braid等通过絮凝作用有效地去除杂质;Desai等采用温和的裂解方法裂解土壤微生物,然后通过活性炭吸附和离子交换层析两步法有效地去除了土壤中的离子和腐植酸等抑制剂,得到了可用于PCR反应的高纯度和高浓度土壤总DNAPang等针对堆肥环境中高浓度腐殖酸的存在(堆肥的腐殖酸含量比土壤高10100),使用Sephadex G200+酸洗PVPP层析柱与电洗脱两步纯化的方法纯化堆肥环境来源的DNA,成功地构建了一个含有10万个克隆的柯斯质粒文库,并从这个文库中筛选到一个新的6-葡萄糖甘酶基因。本实验室在Zhou法基础上进行改进,选用商品化的凝胶回收试剂盒对DNA粗提液进行纯化回收,实验操作简单,回收效率高,采用此法构建了棉田土壤宏基因组文库,并从中筛选得到一个具有菊酯农药降解酶活性、阿魏酸酯酶活性和单宁酶活性的酶蛋白的基因。

    随着宏基因组学的发展,许多新的DNA提取技术不断被提出,使得人们可以从各种各样的环境样品中获得高质量的总DNA。然而,并没有一种标准的或通用的环境DNA提取方法。任何DNA提取方法都存在一定的偏好性,导致选择性地富集某些微生物的DNA,同时选择性地遗漏某些微生物的DNA,从而影响所提取的DNA的种群覆盖率。在实际应用中,应根据所研究生境的特性和研究目的进行选择和优化。

3  宏基因组文库的构建

3.1  载体的选择

    载体在宏基因组技术中具有重要地位,常用载体有质粒(Plasmid)、细菌人工染色体(BAC)、柯斯粘粒(Cosmid)、福斯黏粒(Fosmid)等,此外还有噬菌体P1隆系统(P1-clone)、由P1衍生的人工染色体(Pl-derived artificial chromosomePAC)、酵母人工染色体(Yeast artificial chromosomesYAC)和哺乳动物人工染色体(Mammalian artifical chromosomeMAC)(3)。目前,在新型催化剂的研究中,所采用的载体有质粒、CosmidFosrnidBAC、九噬菌体以及各种穿梭载体等。载体的选择应考虑以下因素:研究目的、所提取的环境总ONA的质量、欲插入目的片段的最大长度、所需要的载体拷贝数、欲采用的宿主以及筛选策略。如对腐殖质含量较高或剪切较严重的DNA样品适宜构建质粒文库,而对于含较大基因簇或大片段的DNA样品则适宜构建CosmidFosmidBAC文库。但是,无论以何种载体构建文库,都必须使文库最大程度地覆盖样本中所有微生物的基因组。

3.2  宿主的选择

    宿主的选择应考虑以下因素:所选择的载体类型,宿主的转化效率、重组载体在宿主细胞中的稳定性、宿主能否为相关功能基因提供必需的转录表达体系、对异源表达基因产物是否有较强的相容性、以及目标性状(如抗菌性)缺陷型等。目前,构建用于筛选新酶的宏基因组文库时,最常用的宿主为大肠杆菌E. coli,其优点在于操作简单、繁殖迅速、培养代谢易于控制、遗传信息明确。其次是芽胞杆菌Bacillus、变铅青链霉菌Streptomyces lividans 和恶臭假单胞菌Pseudomonas putida

4  目标克隆的筛选

    由于环境样品中微生物种类众多,文库容量庞大,如何有效得到目标克隆,是研究者们必须解决的一个难题。目前,从宏基因组文库中筛选新型生物催化剂的策略可分为3种:基于活性的筛选,基于序列的筛选和底物诱导的筛选。

4.1  基于活性的筛选

    基于活性的筛选(Activity-based screening),也称功能驱动筛选(Function-driven screening),是指通过活性检测手段从基因组文库中获得具有特殊活性的克隆方法。该方法经常借助于显色反应、选择性表型和形成水解圈等特性进行筛选,如Diaz-Torres等将构建的口腔唾液宏基因组文库涂布于含有四环素的LB平板上,筛选得到了一个四环素抗性基因;本实验室利用生色底物5--4-3-吲哚-辛酸盐(5-Bronmo-4-chloro-3-indolyl-caprylateX-Cap)5--4--3-吲哚-β-D-半乳糖苷  (5-Bromo-chloro-3-indoly β-D-galactopyranosideX-gal)水解后会产生蓝色物质的特性,从土壤宏基因组文库中分别筛选到了多个酯酶基因和β-半乳糖苷酶基因目前已利用基于活性的筛选方法获得了许多新型生物催化剂,如木聚糖酶、纤维素酶、酯酶和  脂肪酶等。该方法最大的优点是:不依赖于已知序列的信息,故能够筛选到具有优良特性的酶。此外,该方法还可以快速鉴别有开发潜力的克隆子及全长基因,在工业生物催化剂的开发上具有一定的用途。但此方法也存在以下缺点:

    1)由于目前DNA文库的构建中所采用的克隆系统是大肠杆菌系统,真核生物的基因在这个系统中往往无法表达,因而提取到的宏基因组中存在的真核生物基冈组DNA会影响到基因组文库的筛选效率;2)受所选择的表达系统的影响(宏基因组来源的基因转录效率低;翻译效率低;外源蛋白质难以分泌到胞外;目标蛋白质由于缺乏分  子伴侣形成不正确的折叠;缺乏合成的辅因子;与宿主菌密码子使用存在差异),导致许多基因无法正确表达而遗漏;3)工作量大,筛选效率较低,有时需要分析几千甚至几万个克隆子才能检测到一个阳性克隆子。针对上述不足,研究者们提出了一些改进方法,如在DNA提取过程中,通过差速离心法去除样品中的真核生物,从而减少总DNA中的真核生物DNA;应用穿梭载体构建文库,从而使宏基因组DNA能够在大肠杆菌、链霉菌、或者假单胞菌中稳定表达;也有对大肠杆菌进行修饰以增加基因的表达范围。总而言之,操作时应注意选择合适的载体/宿主系统,优化筛选方法,这样才能提高挖掘新型生物催化剂的效率。

4.2  基于序列的筛选

    基于序列的筛选是以序列相似性为基础,根  据已知相关功能基因的保守序列设计探针或  PCR引物,然后通过杂交或PCR扩增来筛选月标克隆。不断扩大的基冈库为这种方法提供了坚实的基础。迄今采用这种方法筛选到的新型催化剂有纤维素酶、铁过氧化物歧化酶、脂肪酶,延胡索酸酶、木聚糖酶等。与活性筛选法相比,该方法不依赖于重组基因在外源宿主中表达,且利用基因芯片技术、基因盒系统、荧光原位杂交技术  Fluorescent in situ hybridizationFISH)和微阵列技术(Microarray)还可大大提高筛选效率,并有望获得基因的全长序列。但是该方法仍然存在3个主要的缺陷:1)由于探针和引物是基于已知序列的保守区域,而大部分具有实际用途的基因在序列上差相很大,通过PCR扩增或探针杂交很难找到全新的同源基因,因此难以发现新型的酶分子,但有可能筛选到某一类结构或功能的蛋白质中的新分子;2)一般只能获得结构基因的一个片段,而不是全长基因;3)对于新鉴定或推测的功能基因需要通过生化测定进一步验证。

4.3  底物诱导的筛选

    底物诱导筛选(Substrate induced gene expression screeningSIGEX)Uchiyama等于2005年首次提出,用于筛选那些受底物诱导的靶标基因。Uchivama等成功的关键在于设计了一个具有操纵子陷阱(Operon-trap)的载体(命名为p18GFP),该载体含有一个报告基因——绿色荧光蛋白基因(gfp),并将多克隆位点置于lac启动子和gfp基因之间,使gfp基因的表达受到插入片段中启动子的调控。这样的设计保证了p18GFP载体既能用于构建文库,又能使用荧光激活细胞分离仪(Fluorescence-activated cell sortingFACS)进行高通量筛选。Uchiyama等采用p18GFP载体构建了一个含有152000个克隆子的基因组文库,并对文库进行SIGEX分析:以苯甲酸盐为底物得到58个阳性克隆子;以萘为底物得到4个阳性克隆子。整个筛选过程只用了4d。由此可见,该方法灵敏度高、快速经济,而且不需要对底物进行修饰;可以从底物推断出目标基因的功能。但SIGEX法存在以下缺陷:1)无法利用不能进入细胞质的底物,从而无法诱导相关目的基因的表达。因此,SIGEX法不能用于筛选大分子底物的酶如淀粉酶、蛋白酶、脂肪酶、纤维素酶和木聚糖酶等,而这些酶在工业上具有重要用途;2)对目标基因的结构和插入方向敏感,容易导致漏检,如SIGEX无法检出组成型表达的目标基因,也无法检出与gfp基因插入方向相反的目标基因;3)当分解代谢基因和gfp基因之间存在转录终止子时,阳性克隆子元法被检出,而大的插入片段中通常含有高丰度的转录终止子,所以SIGEX法不能有效筛选大片段插入文库;4)有时仅能获得基因的部分片段;5)对设备要求较高,应用受到一定的限制。

    以上3种筛选方法各有优缺点,研究者应根据具体情况进行选择。鉴于它们之间可以相互补充,因此,将它们巧妙结合可以大大提高宏基因组文库的筛选效率。

5  展望

    应用宏基因组学挖掘新型生物催化剂是宏基因组学研究中的一个重要方向,引起了全世界科研工作者的关注。但在研究过程中还存在一些亟待解决的问题。首先,现行的环境样品DNA提取方法还存在很多不足,导致某些环境样品中的基因组DNA无法被有效提取;其次,目前使用的载体/宿主系统使得很多基因(特别是真核微生物的基因)无法进行异源表达,无法利用基于活性的筛选及底物诱导筛选两种策略进行筛选;再次,现行的各种筛选方法都存在一些缺陷,无法对宏基因组文库进行全面而有效的筛选;最后,筛选获得的生物催化剂在酶学性质上还存在很多不足,无法应用于工业化生产。根据目前研究中存在的问题,可以从以下几个方面着手:1)与传统的微生物分离培养技术相结合,使一些不可培养的微生物能够进行富集培养,同时尝试更多的环境样品DNA提取纯化方法,使提取的DNA在产率、纯度、片段长度及种群覆盖率等方面不断提高;2)探索更加适合构建宏基因组文库的载体和真核表达宿主,同时与宏转录组学结合,挖掘存在于真核微生物中的生物催化剂;3)与生物信息学结合,设计更加多样、完备的探针和PCR引物,开发更加灵敏、快速、高效的检测手段,提高筛选目标克隆的效率;4)与蛋白质工程结合,对已获得的生物催化剂进行改造以获得高性能的工业生物催化剂。随着生物学的不断发展,DNA提取方法的突破,更适宜的载体和宿主的获得,文库构建水平和筛选效率的不断提高,宏基因组来源的工业生物催化剂将会不断地被挖掘出来,进而极大地推动工业生物技术的进步。

    作者单位:(中山大学生命科学学院,广东 广州 510275

    文章采集:caisy

    注明:国家自然科学基金(No. 31170117),国家海洋公益性行业科研专项(No.201205020-07),广东省重大科技专项(No.201IA080403006),广东省科技计划项目(No. 2010A080403005),国家高技术研究发展计划(863计划)(No. 2007AAl0z308),中山大学实验教学研究(改革)基金项目(No. YJ201027)资助。

注:本网站为公益性网站,若单位或个人不同意刊载本信息请与本站联系。
版权所有:北京市农林科学院农业科技信息研究所
电 话: 010-12396(按0转人工) 地 址:北京市海淀区板井曙光花园中路9号
京ICP证090834号 京ICP备09045065号