生物信息学/甲基化芯片

维基教科书,自由的教学读本

背景介绍[编辑]

甲基化是基因组 DNA 的一种主要的表观遗传修饰形式,与人类的癌症、衰老、老年痴呆等许多疾病密切相关,Illumina 甲基化芯片是有效的甲基化高通量筛选技术,可捕捉到单个碱基的甲基化变化。

该芯片不仅实现基因区域和 CpG 岛的全面覆盖,还包括 CpG 岛之外的甲基化位点,在人类干细胞中鉴定出了非 CpG 甲基化位点、miRNA 启动子区域以及肿瘤和正常组织中差异表达的甲基化位点等。

Illumina Human Methylation 450K BeadChip芯片可检测人全基因组近450,000个甲基化位点,具有单碱基的分辨率。全面覆盖了96%的CpG岛,并根据需求加入了CpG岛以外的CpG位点、人类干细胞非 CpG甲基化位点、正常组织与肿瘤(多种癌症)组织差异甲基化位点、编码区以外的CpG岛、miRNA 启动子区域和GWAS疾病相关区域的位点,同时覆盖了Human Methylation27 BeadChip的90%的位 点。

  1. A探针(非甲基化)的数目U
  2. B探针(甲基化)的数目M
  3. β值或者m值
  4. β值反映了能够和给定被甲基化的序列匹配的寡核苷酸的比率,序列中的甲基化率
  5. M值可以消除探针不同而造成的影响

甲基化公开数据[编辑]

1. GEO:http://www.ncbi.nlm.nih.gov/geo/

2. TCGAEBI等其它网站

甲基化分析软件(R语言扩展包)[编辑]

预处理[编辑]

  • HumMeth27QCReport:用于HumanMethylation27k芯片的质控和标准化,后续分析与450k芯片相同。
  • minfi:用于分析和可视化 Illumina Infinium 甲基化阵列的工具。

数据补全[编辑]

  • impute:芯片数据缺失值填补

甲基化位点注释[编辑]

甲基化位点差异分析[编辑]

  • wateRmelon:15 种beta值和三个性能指标,以及由methylumi 和 minfi 包生成的对象的方法。

综合流程[编辑]

  • ChAMP:用于HumanMethylation27k,HumanMethylation450k,HumanMethylation850k芯片的idat格式的原始数据分析流程,综合了多个经典的甲基化分析R包。也可用于EPIC芯片的分析。

甲基化驱动基因[编辑]

MethylMix:鉴定甲基化驱动的癌症基因(Identifying methylation driven cancer genes)

甲基化免疫细胞浸润模式[编辑]

免疫细胞浸润是指免疫细胞从血液中移向组织,开始发挥它的作用,可以从组织中分离出的浸润免疫细胞。 肿瘤中免疫细胞的浸润与临床结果密切相关,肿瘤中浸润的免疫细胞最有可能作为药物靶标来提高患者的生存率。

简称 全称 中文
B B cells B细胞
NK NK Natural killer cells 自然杀伤细胞
CD4T CD4+ T cells CD4+ T细胞
CD8T CD8+ T cells CD8+ T细胞
Mono Monocytes 单核细胞
Gran Granulocytes 粒细胞
Neutro Neutrophils 中性粒细胞
Eosino Eosinophils 嗜酸性粒细胞

EpiDISH:是一个 R 包,用于推断样本中存在的先验已知细胞亚型的比例,代表此类细胞类型的混合物,包括 8 种细胞亚型(B 细胞、CD4+ T 细胞、CD8+ T 细胞、NK 细胞、单核细胞、中性粒细胞、嗜酸性粒细胞和粒细胞。请注意,粒细胞由中性粒细胞和嗜酸性粒细胞组成)的一种参考。 该参考数据集基于 450k DNAm 阵列; 但是,它可以直接用于 450k 和 EPIC 阵列数据。

甲基化富集分析[编辑]

methylGSA:methylGSA 的主要功能是 methylglm 和 methylRRA。 甲基 GSA 实施逻辑回归调整探针数量作为协变量。 methylRRA 通过 Robust Rank Aggregation 调整每个基因的多个 p 值。

甲基化在线分析工具[编辑]

注释工具[编辑]

wANNOVAR:https://wannovar.wglab.org/

wANNOVAR格式示例如下:
Chr Start End Ref Alt
chr1 25257191 25258236 0 0
chr1 2397201 2397977 0 0
chr6 31938372 31939112 0 0
wANNOVAR输出格式示例
Chr Start End Ref Alt Func Gene
chr1 25257191 25258236 0 0 intronic RUNX3
chr1 2397201 2397977 0 0 ncRNA_intronic CD81-AS1
chr6 31938372 31939112 0 0 exonic DXO

包含甲基化分析的综合在线工具[编辑]