跳转到内容

生物化学与分子生物学/基因功能研究

维基教科书,自由的教学读本

基因结构功能分析和疾病相关基因鉴定克隆 - 基因结构分析 - 基因功能研究 - 疾病相关基因鉴定和克隆原则 - 疾病相关基因鉴定克隆的策略和方法
基因的功能就是基因产物的功能,也就是编码基因的蛋白质功能和非编码基因RNA的功能,前者是本节讨论的重点。非编码RNA, 如miRNA、lncRNA等所谓的调节RNA功能,最近引起了广泛的关注,可参考基因表达调控的相关章节内容。基因产物的功能可以从三个不同水平来描述:①生物化学水平,主要描述基因产物参与了何种生化过程,如蛋白激酶、转录因子等;②细胞水平,主要论述基因产物在细胞内的定位和参与的生物学途径,例如,某蛋白质定位于核内,参与DNA的修复过程,有可能并不了解确切的生物化学功能;③整体水平,主要包括基因表达的时空性及基因在疾病中的作用。对人类基因功能的研究是后基因组时代生命科学领域中的重大命题。通过基因功能的研究可以阐明人体细胞的增殖、分化、衰老、死亡和通讯等方面的分子机制,确定人类疾病发生发展及转归的机制,进而研发新的诊断技术及治疗干预措施,提供药物开发的靶标分子,是开展精准医疗的基础。

生物信息学全面了解基因已知的结构和功能[编辑]

在以往的研究中,已经对大量的基因功能产物的功能有了详尽的了解,获得了足够多的信息,建立了共享资源数据库,其中最为著名的就是美国的GenBank。这些数据库是进行基因序列比对,诠释基因功能的基础。依据分子进化的理论,核酸或氨基酸序列相似的基因,应表现出类似的功能。这些序列相似的基因称之为同源基因。基本的方法是基因序列比对分析。
两个或多个符号序列按字母比较、尽可能确切地反映它们之间的相似和差异,称为序列比对,又称序列联配。通常所讲的序列比对包括核酸序列比对和蛋白质序列比对。根据每次参与比对的序列数又可分为双序列比对和多序列比对。

基因发挥作用的本质是其编码产物的生物化学功能[编辑]

人类基因组DNA有3×l09bp,包括2万个蛋白质编码基因,决定了人类作为高等动物及其复杂的生物学性状。编码基因表达的蛋白质分子包括:转录因子,是一类能与基因调控区域专一性结合的蛋白质分子,调控基因表达的时空性;核骨架蛋白质,是由纤维蛋白构成的网架结构,维持细胞核的基本结构;信号分子,一类参与胞内信号转导的蛋白质分子;酶,是一类生物催化剂,支配着生物的新陈代谢参与营养和能量转换等许多催化过程,与生命过程关系密切的反应大多是酶催化反应;细胞骨架蛋白质,是由蛋白质与蛋白质搭建的骨架网络结构,主要作用是维待细胞的一定形态;细胞膜受体,位于细胞质膜上,用于识别和结合小的非脂溶性信号分子;离子通道蛋白质,是横跨质膜的亲水性通道,允许适当大小的离子顺浓度梯度通过;转运体,是一类具有从胞外向胞内转运物质的蛋白质分子;激素,是一类由分泌细胞合成的信号分子,可调节机体的代谢、生长、发育、繁殖、性别、性欲等重要生命活动;细胞因子,是一类由免疫细胞(如单核、巨噬细胞、T细胞、B细胞、NK细胞等)和某些非免疫细胞(内皮细胞、表皮细胞、纤维母细胞等)经刺激而合成、分泌的一类具有广泛生物学活性的小分子蛋白质,可调节细胞生长、分化,调控免疫应答;抗体,是一种由浆细胞(效应 B细胞)分泌,被免疫系统用来鉴别与中和外来物质如细菌、病毒等的大型Y形蛋白质;凝血因子,是一类参与血液凝固过程的蛋白质组分;载体蛋白,是血浆中可与一些不溶或难溶于水的物质,以及一些易被细胞摄取或易随尿 液排出的物质结合的蛋白质;细胞外基质蛋白,是由细胞合成并分泌到细胞外、分布在细胞表面或细胞之间的大分子,主要是胶原蛋白或蛋白聚糖,支持并连接组织结构、调节组织的发生和细胞的生理活动。
在一些情况下,即使对基因的序列、结构和表达模式有清楚的认识,但仍然难以阐明基因所表达的蛋白质的功能。此时通过研究该蛋白质与已知功能蛋白质的相互作用,无疑将非常有助于对该蛋白质功能的了解。例如,某一未知功能的新蛋白质与另一参与RNA剪接的蛋白质存在相互作用,极有可能该蛋白质也参加了RNA的剪接过程。研究蛋白质相互作用的方法包括遗传学、生物化学和物理学方法。遗传学方法仅用于如果蝇、酵母等模式生物,而生化和物理的方法可直接用于人类细胞。常用的生化方法是亲和层析和免疫共沉淀。常用的高通掀筛查蛋白质间相互作用的方法是酵母双杂交技术和噬菌体展示技术。
噬菌体展示(phage display)是将外源性DNA插入到噬菌体衣壳蛋白编码基因中的一种表达克隆技术。重组基因以融合蛋白的形式,掺入病毒颗粒中,展示在噬菌体的表面。融合噬菌体可与表面展示的外源蛋白质相互作用的蛋白质结合,以筛查蛋白质的相互作用。噬菌体展示的缺点在千其本身是一种体外分析系统,另外,只有短肽可以展示在噬菌体表面。噬菌体展示也可用于抗体工程和普通的蛋白质工程。

利用工程细胞研究基因在细胞水平的功能[编辑]

在细胞水平研究基因功能,除了观察细胞在实验条件下该基因表达的改变,更重要的是人为地导入外源基因或干预正常基因的表达,以观察细胞生物学行为的改变。

采用基因重组技术建立基因高表达工程细胞系[编辑]

采用基因重组技术,将外源基因导入宿主细胞,使其表达目的基因,进而观察细胞的生物学特征改变。根据外源基因在宿主细胞表达的待续时间,可区分为瞬时转染和稳定转染细胞。稳定转染细 胞是一种最常用的细胞水平的转基因模型,外源基因通过转基因过程插入到细胞的染色体中,或以游离基因(episome)的形式存在于细胞中稳定表达。稳定表达外源蛋白的转染细胞可以用作基因功能研究的细胞模型,也可以利用这种方法获得外源基因产物,目前被广泛应用于细胞模型的建立。

基因沉默技术抑制特异基因的表达[编辑]

在细胞水平沉默研究基因的表达,进而观察基因沉默后细胞的生物学行为改变,是基因功能研究的有力工具。可以利用RNA干扰技术、反义技术以及基因组编辑(genome editing)技术等来实现对特 定基因表达的抑制。其中利用成簇规律间隔短回文重复(clustered regulatory interspaced short palindromic repeat, CRISPR)技术进行基因敲除,近年来发展迅猛并广泛应用于细胞、动物水平的特定基因沉默。

利用基因修饰动物研究基因在体功能[编辑]

人类基因组计划虽然解析了基因序列,但绝大多数基因的功能尚不清楚。因此,利用各种技术手段研究基因的功能将是“后基因组时代” 的主要内容之一。基因功能的确定必须通过实验来验证。通常采用基因功能获得和(或)基因功能缺失的策略,观察基因在细胞或生物个体中所导致的细胞生 物学行为或个体表型遗传性状的变化,从而从正反两方面对基因的功能进行鉴定。此外,基于正向遗传学的随机突变筛选技术也成为揭示基因功能的重要手段。由于基因的功能必须在完整的生物个体及其生命过程中才能得到完整的体现,因此,从整体水平研究基因的功能是必然的选择。

用功能获得策略鉴定基因功能[编辑]

基因功能获得策略的本质是将目的基因直接导入某一细胞或个体中,使其获得新的或更高水平的表达,通过细胞或个体生物性状的变化来研究基因功能。常用的方法有转基因技术和基因敲入技术。
1、用转基因技术获得基因功能 转基因技术(transgenic technology)是指将外源基因导入受精卵或胚胎干细胞(embryonic stem cell), 即ES细胞,通过随机重组使外源基因插入细胞染色体DNA,随后将受精卵或ES细胞植入假孕受体动物的子宫,使得外源基因能够随细胞分裂遗传给后代。
转基因动物(transgenic animal)是指应用转基因技术培育出的携带外源基因,并能稳定遗传的动 物,其制备步骤主要包括转基因表达载体的构建、外源基因的导入和鉴定、转基因动物的获得和鉴定、转基因动物品系的繁育等。在转基因动物中,以转基因小鼠最为常见。建立转基因小鼠的常用方法有两种,一是直接将目的DNA显微注射到受精卵的雄性原核,然后植入假孕母鼠体内,使之发育成幼仔;二是将带有目的基因的ES细胞注射到囊胚,然后在小鼠体内发育成幼仔。在出生的动物中即含有在一个等位基因的位点进行了DNA整合的小鼠,即转基因杂合子。经子代杂合子交配,在其后代中可筛选到纯合子。
利用转基因动物模型研究外源基因,能够接近真实地再现基因表达所导致的结果及其在整体水平的调控规律,把复杂的系统简单化,具有系统性和独立性。利用转基因技术建立的疾病动物模型具有遗传背景清楚、遗传物质改变简单、更自然更接近疾病的真实症状等优点。
然而,转基因动物模型仍存在一些亟待解决的问题,如外源基因插入宿主基因组是随机的,可能 产生插入突变,破坏宿主基因组功能;外源基因在宿主染色体上整合的拷贝数不等;整合的外源基因遗传丢失而导致转基因动物症状的不稳定遗传等。为解决上述问题,可以在转基因动物利用组织特异性启动子实现外源基因的时空特异性表达,或用化学或生物分子作为诱导剂,实现对外源基因表达时间及水平的精确控制。
2、用基因敲入技术获得基因的功能 基因敲入 (gene knock-in) 是通过同源重组的方法,用某一基因替换另一基因,或将一个设计好的基因片段插入到基因组的特定位点,使之表达并发挥作用。通过基因敲入可以研究特定基因在体内的功能;也可以与之前的基因的功能进行比较;或将正常基因引入基因组中置换突变基因以达到靶向基因治疗的目的。
基因敲入是基因打靶(gene targeting) 技术的一种。基因打靶是一种按预期方式准确改造生物遗传信息的实验手段。该技术的巧妙之处在于将ES细胞技术和DNA同源重组技术结合起来,实现对染色体上某一基因的定向修饰和改造,从而深入地了解基因的功能。基因打靶的原理如下: ①从小鼠囊胚(受精卵分裂至8个细胞左右即为囊胚,此时受精卵只分裂不分化)分离出未分化的ES细胞;②然后利用细胞内的染色体DNA与导入细胞的外源DNA在相同序列的区域内发生同源重组的原理,用含有筛选标记的打靶载体,对ES细胞中的特定基因实施“打靶”③将“中靶”的ES细胞移植回小鼠囊胚,进而与囊胚一起分化发育成相应的组织和器官,最后产生出具有基因功能改变的“嵌合鼠”。由于“中靶”的ES细胞保持分化的全能性,因此它可以发育成为嵌合鼠的生殖细胞,使得经过定向改造的遗传信息可以代代相传。
除基因敲入外,基因打靶还包括基因敲除、点突变、缺失突变、染色体大片段删除等。基因打靶与转基因技术均可用于基因功能研究,但两者的最大区别就是基因打靶能去除和(或)替换生物体内的固有基因,而转基因技术则未去除或替换固有基因。目前,基因打靶巳成为研究基因功能最直接和最有效的方法之一。

用功能失活策略鉴定基因功能[编辑]

基因功能失活策略的本质是将细胞或个体的某一基因功能部分或全部失活后,通过观察细胞生物学行为或个体遗传性状表型的变化来鉴定基因的功能。常用的方法主要有基因敲除和基因沉默技术。
1、用基因敲除技术使基因功能完全缺失 基因敲除 (gene knock-out)属于基因打靶技术的一种,其利用同源重组的原理,在ES细胞中定点破坏内源基因,然后利用ES细胞发育的全能性,获得带有预定基因缺陷的杂合子,通过遗传育种最终获得目的基因缺陷的纯合个体。
然而,基因被完全敲除之后使得表型分析受到很多限制,例如,有些重要的靶基因被敲除后会引起胚胎早期死亡,使得无法分析该基因在胚胎发育晚期和成年期的功能;某些基因在不同的细胞类型中执行不同的功能,完全敲除会导致突变小鼠出现复杂的表型,使研究者很难判断异常的表型是由一种细胞引起的,还是由几种细胞共同引起的。为了克服以上不足,条件性基因敲除 (conditional gene knock-out)技术应运而生,该技术可以更加明确地在时间和空间上操作基因靶位,敲除效果更加精确可靠,理论上可达到对任何基因在不同发育阶段和不同器官、组织的选择性敲除。
Cre/loxP 系统的条件敲除的原理:Cre 重组酶属于位点特异性重组酶,能介导两个34bp的loxP位点之间的特异性重组,使loxP位点间的序列被删除。重组酶介导的条件性基因敲除通常需要两种小鼠,一种是在特定阶段、特定组织或细胞中,表达Cre重组酶的转基因小鼠;另一种是在基因组中引入了 loxP 位点的小鼠,即靶基因或其重要功能域片段被两个loxP位点错定的小鼠。两种小鼠交配后,Cre 基因表达产生的 Cre 重组酶就会介导靶基因两侧的 loxP 间发生切除反应,结果将一个loxP 和靶基因切除。由于可以控制 Cre 重组酶在特定阶段、特定组织或细胞中表达,使得 Cre 介导的重组可以发生在特定的阶段、组织或细胞中,导致这些组织或细胞中的靶基因在特定的阶段被敲除,而其他组织或细胞中因不表达 Cre 而使得靶基因不被敲除。
条件性基因敲除的优势在于克服了重要基因被敲除所导致的早期致死,并能客观、系统地研究基 因在组织器官发生、发育以及疾病发生、治疗过程中的作用和机制。但这一技术亦存在一些缺点,如费用太高、周期较长,而且许多基因在敲除后,可能是这些基因的功能被其他基因代偿,并未产生明显的表型改变。
2、用基因沉默技术可使基因功能部分缺失 基因沉默策略通常是利用反义技术,在转录或翻译水平特异性阻断(或封闭)某些基因的表达(即沉默相应基因),然后通过观察细胞生物学行为或个体遗传性状表型的变化来鉴定基因的功能。以下简要介绍几种常用的基因沉默技术。
(1)用 RNA 干扰(RNA interference, RNAi) 技术研究基因功能:利用 RNAi 能在短时间内高效特异地抑制靶基因表达的特点,可以很方便地研究基因的功能。用于基因沉默的干扰小 RNA(small interfering RNA, siRNA)既可以在体外进行化学合成或体外转录生成,也可以基于具有合适启动子的载体或转录元件,在哺乳类动物或细胞中转录生成。
研究者既可以将 siRNA 导入特定细胞,在细胞水平上研究基因的功能;也可以通过转基因的方法,在动物体内实现特异、稳定、长期地抑制靶基因的表达,从而在整体水平上研究基因的功能。与基因敲除相比,RNAi技术具有简单、易操作、周期短等优势,因此已被作为一种简便和有效的工具而广泛用于基因功能的研究。然而,该技术可能对靶基因的相似序列发生作用,导致脱靶(off-targeting)效应。
(2) 用 miRNA 技术研究基因功能:尽管 miRNA 的作用机制与 siRNA 类似,但因其可通过与mRNA 不完全互补配对结合而抑制翻译,故 1 种 miRNA 可沉默多个靶基因,而 siRNA 通常沉默单一基因。目前,miRNA 在基因功能及基因表达调控研究中都得到了广泛应用。
(3) 用反义 RNA 技术研究基因功能:即通过反义RNA(与 mRNA 互补的一段 RNA 序列)与细胞中的 mRNA 特异性结合,从而抑制相应 mRNA 的翻译。
(4) 核酶(ribozyme) 技术:天然的核酶通常是单-RNA 分子,具有自剪切作用。另外,核酶也可由两个 RNA 分子组成,两者通过互补序列相结合,形成锤头状二级结构,并组成核酶的核心序列,进而发挥剪切作用。核酶通过剪切靶 RNA 分子(即破坏靶 RNA 分子)而抑制基因的表达。

用随机突变筛选策略鉴定基因功能[编辑]

尽管利用转基因、基因敲入/敲除、基因沉默等技术,从特定基因的改造到整体动物表型分析的“ 反向遗传学”研究大大推动了功能基因组学的进展,但是也存在明显的局限性:首先,由于生物体的代偿机制,使得基因敲除动物常常观察不到异常表型;其次,由于“反向遗传学”只能对已知基因进行研究而人类基因组中尚有90%以上的非编码序列处于未知状态;第三,由于“功能缺失”和“功能获得”小鼠常出现胚胎期死亡,而目前可用于条件性基因改造的启动子还很少,从而阻碍了特定基因在成体动物中的功能分析;第四,由于一个蛋白质有多个不同的功能域,特定基因在不同位点上的突变可能产生不同的表型,应用单一的“功能缺失”方法,显然不可能发现这些不同的异常表型。因此,只应用“反向遗传学”不足以完成功能基因组学的任务,而基于“正向遗传学”的、从异常表型到特定基因突变的随机突变筛选策略逐渐受到青睐。
随机突变筛选策略的第一步是通过物理诱变、化学诱变或生物技术产生大量的基因组 DNA 突变。 其中乙基亚硝基脲(ethyl nitrosourea, ENU) 诱变是近年来发展起来的研究基因功能的新手段。 ENU 是一种化学诱变剂,它通过对基因组 DNA 碱基的烧基化修饰,诱导 DNA 在复制时发生错配而产生突变。它主要诱发单碱基突变,造成单个基因发生突变(双突变的情况非常少),更接近于人类遗传性疾病的基因突变情况。同时,ENU的突变效率非常高,可以达到0.2%, 是其他突变手段的 10倍左右。例如,经ENU处理可使雄鼠精子基因组发生点突变,进而使得后代小鼠有可能出现突变表型,经筛选及遗传试验即可得到突变系小鼠。通过对突变小鼠的深入研究、对突变基因定位以及位置候选法克隆突变序列,就会得到突变基因的功能信息。
另外,基因捕获(gene trapping) 技术也是一种产生大规模随机插入突变的便利手段,对于揭示基因序列所对应的基因功能具有重要的应用价值。基因捕获技术的基本过程是:将一个含报告基因的 DNA 载体随机插入基因组,产生内源基因失活突变,通过报告基因的表达,提示插入突变的存在以及内源基因的表达特点。利用基因捕获可以建立一个携带随机插入突变的ES细胞库,每一种 ES 细胞克隆中含有不同的突变基因,ES 细胞克隆经囊胚注射发育为基因突变动物模型,通过对动物模型的表型分析鉴定突变基因的功能。基因捕获技术可节省大量构建特异打靶载体以及筛选基因组文库的工作和费用,成为可同时对基因的序列、基因的表达以及基因的功能进行研究的高效技术。
随机突变筛选策略能够获得研究基因功能的新材料以及人类疾病的新模型,这种“表型驱动”的 研究模式有可能成为功能基因组学研究最有前景的手段和捷径之一 。

利用基因编辑技术鉴定基因功能[编辑]

近几年来,越来越多专注于基因功能的研究取得了成功,同时,基因功能研究过程中所面临的诸多技术瓶颈也愈加凸显,以基因敲除/敲入等技术为中心的试验愈加不能满足功能研究与临床技术转化的需要。在过去一段时间中,以锌指核酸酶 (zinc-finger nuclease, ZFN)和转录激活样效应因子核酸酶 (transcription activator-like effector nuclease, TALEN) 技术为代表的序列特异性核酸酶技术,以其能够高效率地进行定点基因组编辑,在基础研究、基因治疗和遗传改良等方面展示出了巨大的潜力。然而,由于 ZFN 和 TALEN 技术本身所存在的多种技术瓶颈,这两种技术并不能实现快速发展并满足各种科研和临床需求。令人振奋的是,最新问世的成簇规律间隔短回文重复 (clustered regulatory interspaced short palindromic repeat, CRISPR) 技术拥有其他基因编辑技术无可比拟的优势。通过不断的技术改进,CRISPR 技术被认为能够在活细胞中最有效、最便捷地“编辑”任何基因。同时,基于 CRISPR技术相对较低的实验成本和高成功率,该技术有望应用于临床药物研究与基因治疗,并已在目前的商业化和临床转化过程中取得了令人瞩目的成就。
CRISPR 是一种来自细菌降解入侵的病毒 DNA或其他外源 DNA 的免疫机制。CRISPR 系统共分成 3 类,其中I类和Ⅲ类需要多种 CRISPR相关蛋白质即 Cas 蛋白,共同发挥作用,而Ⅱ类系统只需要 一种 Cas 蛋白即可,因此目前 CRISPR/Cas9 系统应用最为广泛。
Cas9 蛋白含有两个核酸酶结构域,可以分别切割 DNA 两条单链。Cas9 首先与 crRNA 及tracrRNA 结合成复合物,然后通过PAM 序列结合 DNA,形成 RNA-DNA 复合结构,进而对目的DNA 双链进行切割,使DNA双链断裂。优化和改造后的CRISPR/Cas9系统仅包括两个元素:Cas9 蛋白和 sgRNA (single guide RNA)。CRISPR/Cas9 通过对预设的 DNA 位点进行切割,造成 DNA 双链断裂(double strand break, DSB), 细胞内的修复机制随即启动,主要包括两种修复途径:
一是非同源末端连接途径(non-homologous end joining, NHEJ) , 此修复机制非常容易发生错误,导致修复后发生碱基的缺失或插入,从而造成移码突变,最终达到基因敲除的目的。 NHEJ 是细胞内主要的 DNA 断裂损伤修复机制。利用靶向核酸酶可以在受精卵水平高效的实现移码突变,从而制备基因敲除模式动物。
二是 DNA 断裂修复途径为同源介导的修复 (homology-directed repair, HR), 这种基于同源重组的修复机制保真性高,但是发生概率低。在提供外源修复模板的情况下,靶向核酸酶对DNA 的切割可以将同源重组发生的概率提高约1000倍。利用这种机制可以实现基因组的精确编辑,如:条件性基因敲除、基因敲入、基因替换、点突变等。