生物信息學/甲基化晶片

維基教科書,自由的教學讀本

背景介紹[編輯]

甲基化是基因組 DNA 的一種主要的表觀遺傳修飾形式,與人類的癌症、衰老、老年痴呆等許多疾病密切相關,Illumina 甲基化晶片是有效的甲基化高通量篩選技術,可捕捉到單個鹼基的甲基化變化。

該晶片不僅實現基因區域和 CpG 島的全面覆蓋,還包括 CpG 島之外的甲基化位點,在人類幹細胞中鑑定出了非 CpG 甲基化位點、miRNA 啟動子區域以及腫瘤和正常組織中差異表達的甲基化位點等。

Illumina Human Methylation 450K BeadChip晶片可檢測人全基因組近450,000個甲基化位點,具有單鹼基的解像度。全面覆蓋了96%的CpG島,並根據需求加入了CpG島以外的CpG位點、人類幹細胞非 CpG甲基化位點、正常組織與腫瘤(多種癌症)組織差異甲基化位點、編碼區以外的CpG島、miRNA 啟動子區域和GWAS疾病相關區域的位點,同時覆蓋了Human Methylation27 BeadChip的90%的位 點。

  1. A探針(非甲基化)的數目U
  2. B探針(甲基化)的數目M
  3. β值或者m值
  4. β值反映了能夠和給定被甲基化的序列匹配的寡核苷酸的比率,序列中的甲基化率
  5. M值可以消除探針不同而造成的影響

甲基化公開數據[編輯]

1. GEO:http://www.ncbi.nlm.nih.gov/geo/

2. TCGAEBI等其它網站

甲基化分析軟件(R語言擴展包)[編輯]

預處理[編輯]

  • HumMeth27QCReport:用於HumanMethylation27k晶片的質控和標準化,後續分析與450k晶片相同。
  • minfi:用於分析和可視化 Illumina Infinium 甲基化陣列的工具。

數據補全[編輯]

  • impute:晶片數據缺失值填補

甲基化位點註釋[編輯]

甲基化位點差異分析[編輯]

  • wateRmelon:15 種beta值和三個性能指標,以及由methylumi 和 minfi 包生成的對象的方法。

綜合流程[編輯]

  • ChAMP:用於HumanMethylation27k,HumanMethylation450k,HumanMethylation850k晶片的idat格式的原始數據分析流程,綜合了多個經典的甲基化分析R包。也可用於EPIC晶片的分析。

甲基化驅動基因[編輯]

MethylMix:鑑定甲基化驅動的癌症基因(Identifying methylation driven cancer genes)

甲基化免疫細胞浸潤模式[編輯]

免疫細胞浸潤是指免疫細胞從血液中移向組織,開始發揮它的作用,可以從組織中分離出的浸潤免疫細胞。 腫瘤中免疫細胞的浸潤與臨床結果密切相關,腫瘤中浸潤的免疫細胞最有可能作為藥物靶標來提高患者的生存率。

簡稱 全稱 中文
B B cells B細胞
NK NK Natural killer cells 自然殺傷細胞
CD4T CD4+ T cells CD4+ T細胞
CD8T CD8+ T cells CD8+ T細胞
Mono Monocytes 單核細胞
Gran Granulocytes 粒細胞
Neutro Neutrophils 中性粒細胞
Eosino Eosinophils 嗜酸性粒細胞

EpiDISH:是一個 R 包,用於推斷樣本中存在的先驗已知細胞亞型的比例,代表此類細胞類型的混合物,包括 8 種細胞亞型(B 細胞、CD4+ T 細胞、CD8+ T 細胞、NK 細胞、單核細胞、中性粒細胞、嗜酸性粒細胞和粒細胞。請注意,粒細胞由中性粒細胞和嗜酸性粒細胞組成)的一種參考。 該參考數據集基於 450k DNAm 陣列; 但是,它可以直接用於 450k 和 EPIC 陣列數據。

甲基化富集分析[編輯]

methylGSA:methylGSA 的主要功能是 methylglm 和 methylRRA。 甲基 GSA 實施邏輯回歸調整探針數量作為協變量。 methylRRA 通過 Robust Rank Aggregation 調整每個基因的多個 p 值。

甲基化在線分析工具[編輯]

註釋工具[編輯]

wANNOVAR:https://wannovar.wglab.org/

wANNOVAR格式示例如下:
Chr Start End Ref Alt
chr1 25257191 25258236 0 0
chr1 2397201 2397977 0 0
chr6 31938372 31939112 0 0
wANNOVAR輸出格式示例
Chr Start End Ref Alt Func Gene
chr1 25257191 25258236 0 0 intronic RUNX3
chr1 2397201 2397977 0 0 ncRNA_intronic CD81-AS1
chr6 31938372 31939112 0 0 exonic DXO

包含甲基化分析的綜合在線工具[編輯]