CRISPR/Cas9:一种新型的基因组定点编辑技术
摘要:CRISPR/Cas9系统是原核生物抵御病毒或质粒等外来遗传物质入侵的一种获得性免疫系统,主要由非特异性的Cas9核酸酶和起识别作用的crRNA所组成。相较于传统的基因组编辑技术,基于CRISPR/Cas9系统的基因组定点编辑技术具有快速、简单、高效等优点,并且几乎可以用于任何物种的基因编辑。尽管CRISPRJCas9系统的基因组特异性还有待进一步确认,但该系统在基因组编辑方面的简便性和有效性必将促进生物学的研究和人类疾病基因治疗方面的发展。
关键词:人工核酸内切酶:基因编辑:CRISPR/Cas9
基因组定点编辑技术是研究基因功能的一种重要手段,同时也是许多基因相关疾病的潜在治疗方法。早期主要依赖于基因同源重组及体细胞核移植技术来完成对特定基因的改造,然而自然情况下基因重组效率极低,且细胞核移植技术费时费力[1,2],严重制约了基础研究和临床应用。因此,在不断寻求高效、简便的基因编辑方法过程中,人工核酸内切酶(engineered endonuclease.EEN)介导的基因定点编辑技术快速发展成为一种主流方法。
人工核酸内切酶进行基因编辑的第一步是在修饰位点诱导产生DNA双链断裂缺口(doublestrand breaks,DSB)。核酸酶诱导产生的DSBs可借助非同源末端连接(non homologous end-join-ing,NHEJ)机制或同源重组(homologous recombi-nation,HR)机制进行修复。NHEJ将断裂的双链末端直接连接起来,可有效地引起基因的插入/缺失突变,即inclel突变,从而使基因的功能遭到破坏。当引入模板DNA序列时,可通过同源重组修复(HR),插入或删除特定的基因序列。通过人工核酸内切酶介导的DSBs,基因突变的几率大于1010,有时甚至超过50%[3] ,因此,人工核酸内切酶被称为“DNA
剪刀”。锌指核酸内切酶(zinc finger en-donuclease,ZFN)和类转录激活因子效应物核酸酶 (Lranscriplion activator-like effector nuclease,TALEN)分别作为第一代和第二代“DNA剪刀”,都是由DNA结合蛋白与核酸内切酶Fok I融合而成。但由于这两种人工核酸内切酶制备复杂,成本昂贵,难于开展大规模基因编辑的筛选,使其应用有所局限。近年来,细菌获得性免疫系统CRISPR (clustered regularly interspaced shortpalinclromic repeats)的应用使得基因组编辑技术进一步简化.CRISPR/Cas9作为第3代人工核酸内切酶迅速成为目前研究的热点,其独特性和灵活性在于该系统是通过RNA介导核酸酶与靶DNA序列结合的。与以DNA结合蛋白为基础的ZFN和TATJFJN相比,以RNA介导的CRISPR/Cas9系统原理更加简单,只需要遵循RNA与DNA之间的碱基互补配对原则。
本文重点介绍了CRISPR/Cas9的作用机理及其应用,最后就CRISPR/Cas9技术目前存在的问题及其应对策略进行了探讨。
1 CRISPR/Cas9的结构及作用机理
CRISPR广泛存在于细菌和古细菌的基因组中,是细菌和古细菌的一种适应性免疫系统,该系统可以介导外源DNA的降解,从而抵御病毒等外来入侵者[4,5]。1987年,日本学者首次在大肠杆菌中发现该间隔重复序列[6];2002年,Jansen等[7,8] 将其正式命名为CRISPR,基因编码的蛋白质统称为CRISPR附属蛋白(CRISPR-associa七ion pro-teins,Cas)。CRISPR/Cas系统具有Type I、TypeⅡ、TypeⅢ3种不同类型,其中研究最多、应用最广的是Ⅱ型CRISPR/Cas系统。产脓链球菌(Strepto-coccus pyogenes SF370)的Ⅱ型CRISPR基因座主要由三部分组成,包括Cas9核酸酶基因、不编码蛋白质的tracr RNA基因和CRISPR基因(图1),其中CRISPR基因由前导序列(leader sequence)、间隔序列( spacers)和重复序列(repeats)组成[9] 。CRISPR/Cas9系
统介导的适应性免疫主要分为3个步骤。首先是新的间隔序列的获取:外来质粒或病毒DNA首次入侵时,Ⅱ型CRISPR系统将外来DNA整合入CRISPR重复序列之间形成一段新的间隔序列,并随着宿主DNA -起编码;其次是crRNA的表达、加工与成熟:CRISPR重复序列和间隔序列经转录加工为pre-crRNA,tracrRNAs与pre-crRNA的重复序列区域配对杂交,然后内源性的RNaseⅢ从每一个间隔序列的5’端裂解杂合的pre -crRNA -tracrRNAs,产生成熟的tracr-RNA-crRNAs,并与Cas9核酸酶结合[10] ;最后,当同样的外源DNA再次出现时,CRISPR-Cas复合体可与双链DNA的靶位点结合并切割双链。靶标的识别和DNA链的裂解既需要间隔序列和靶序列之间的互补,又需要靶DNA序列3’端存在PAM (Protospacer adjacent motif)序列[11],PAM序列的存在还避免了CRISPR基因本身被作为靶标识别,提供了一个识别“自己”和“异己”的机制。不同的Ⅱ型CRISPR系统有不同的PAM序列,基于产脓链球菌CRISPR系统的PAM序列为NGG,N指的是任意核苷酸[10] 。
Cas9实际上是一种核酸酶,它具有两个独立的核酸酶位点:一是HNH核酸酶位点,可以断裂与crRNA互补的那条链;另一个是类似于RuvC核酸酶位点,可以裂解另一条非互补链。研究[12,13]发现Cas9家族的所有成员都具有相同的结构核心,这个结构核心的特征为一种具有两个主叶(major lobe)-核酸酶结构域叶和a-螺旋叶的结构,其中核酸酶结构域叶是由HNH结构域、RuvC结构域以及与PAM序列相互作用的C末端结构域组成。这两个主叶含有保守性的裂缝,而这些裂缝在核酸结合中发挥功能。Cas9蛋白本身以非活性的状态存在,它的核酸酶活性被C末端结构域的方向所抑制,而且不能与DNA结合;但当其与crRNA-tracrRNA复合体结合时,这种蛋白的两个主叶之间就会构建出一条作为DNA结合界面发挥功能的通道,从而在结构上激活Cas9,使得它能够与靶DNA结合,PAM序列则将其核酸酶活性激活[12—14]。
因篇幅问题不能全部显示,请点此查看更多更全内容