生物信息學/單細胞轉錄組資料庫
DRscDB:DRSC scRNA-seq資料庫
[編輯]視頻教程。
DRscDB資料庫支持人類,小鼠,果蠅,斑馬魚四種物種,可以查詢某個物種中的單個基因在某種組織或全部組織中的表達,可以設置條件來過濾結果,支持單個或多個基因列表的富集分析,基因名的轉換,細胞類型的marker標籤,截至2021年5月25日共收錄48條單細胞轉錄組數據集。
此外,資料庫還支持用戶提交自己的研究數據(上傳模板與示例)。
參考文獻:Hu Y , Tattikota S G , Liu Y , et al. DRscDB: A single-cell RNA-seq resource for data mining and data comparison across species[J]. Computational and Structural Biotechnology Journal, 2021.
scRNASeqDB:人類單細胞轉錄組表達資料庫
[編輯]單細胞RNA-Seq(scRNA-seq)是一種新興的方法,有助於探索單個細胞中的綜合轉錄組。為了給生物學和醫學提供有用和獨特的參考資源,開發了scRNASeqDB資料庫,其中包含從GEO收集的36個人類單細胞基因表達數據集,涉及來自174個細胞群的8910個細胞。提供了不同狀態細胞基因表達的詳細信息及特徵,包括基因表達的熱圖和箱線圖、基因相關矩陣、GO和通路注釋。
網址:scRNASeqDB
參考文獻:Yuan Cao, Junjie Zhu, Guangchun Han, Peilin Jia, Zhongming Zhao. scRNASeqDB: a database for gene expression profiling in human single cell by RNA-seq (in review). bioRxiv
Cell BLAST:單細胞轉錄組數據查詢和注釋(BLAST)
[編輯]網址:Cell BLAST
參考文獻:Cao Z. J.†, Wei L.†, Lu S., Yang D. C., Gao G.*. Searching large-scale scRNA-seq databases via unbiased cell embedding with Cell BLAST. Nat. Commun. 11, 3458 (2020).[PubMed][Website][Press]
Cell BLAST是一個自帶高質量參考資料庫的scRNA-seq數據檢索/注釋工具,能做細胞類型鑑定、發現新細胞類型、注釋連續細胞狀態。這個網站由北京大學的研究團隊研發,今年7月份相關論文發布在在《Nature Communications》這一資料庫為有效利用現有數據進行細胞注釋和跨數據集研究提供了新的工具和資源。
iSyTE:眼睛發育資料庫
[編輯]網址:https://research.bioinformatics.udel.edu/iSyTE/ppi/index.php
DBTMEE:小鼠早期胚胎發育資料庫
[編輯]參考文獻:Park SJ, Shirahige K, Ohsugi M, Nakai K. DBTMEE: a database of transcriptome in mouse early embryos. Nucleic Acids Res. 2015 Jan;43(Database issue):D771-6. doi: 10.1093/nar/gku1001. Epub 2014 Oct 21. PMID: 25336621; PMCID: PMC4383872.
StemMapper:幹細胞發育資料庫
[編輯]網址:http://stemmapper.sysbiolab.eu
參考文獻:https://academic.oup.com/nar/article/46/D1/D788/4555230
EMAGE: 小鼠胚胎發育空間轉錄組資料庫
[編輯]網址:http://genex.hgu.mrc.ac.uk/Emage/database
參考文獻:
stemformatics:針對幹細胞構建的單細胞資料庫
[編輯]網址:https://www.stemformatics.org/expressions/gene_expression_graph
參考文獻:
scTPA:單細胞轉錄組通路激活標籤
[編輯]網址:scTPA
參考文獻:Zhang Y*, Zhang Y*, Hu J*, Zhang J, Guo F, Zhou M, Zhang G#, Yu F#, Su J#. scTPA: A web tool for single-cell transcriptome analysis of pathway activation signatures. Bioinformatics. 2020. Zhang Y*, Ma Y*, Huang Y, Zhang Y, Jiang Q, Zhou M, Su J#. Benchmarking algorithms for pathway activity transformation of single-cell RNA-seq data. Computational and Structural Biotechnology Journal (Accepted) scTPA是用於在人和小鼠中基於生物途徑激活進行單細胞轉錄組分析和注釋的網絡工具。資料庫收集了具有不同功能和分類的大量生物途徑,這有助於識別細胞類型注釋和解釋的關鍵途徑簽名。優化了四種不同的途徑激活評估方法的可執行代碼,以使運行時間減少4至56倍。提供了單細胞途徑激活概況的分析和可視化功能,例如細胞聚類和注釋,標記途徑及其相關基因的鑑定,從面向途徑的角度,這將有助於更好地了解細胞類型和狀態。
SC2disease:單細胞測序與疾病(已無法使用)
[編輯]網址:SC2disease
參考文獻:https://academic.oup.com/nar/article/49/D1/D1413/5917662
SC2disease是一個人工收集的資料庫,能為研究者提供各種疾病的各種細胞類型準確的基因表達譜資源,瀏覽感興趣的基因的表達、搜索細胞類型標記、尋找多種疾病的生物標誌物、比較處於疾病和非疾病狀態的各種類型細胞的表達譜。由西北工業大學計算機學院的彭佳傑教授課題組開發建立,於2020年10月3號發表在國際著名雜誌《Nucleic Acids Research》(IF=11.501)。SC2disease包含946481條數據,對應341種細胞類型、29種組織和25種疾病。SC2disease資料庫中的每個條目都包含不同細胞類型、組織和疾病相關健康狀況之間差異表達基因的比較。
CellMarker:細胞標籤庫
[編輯]網址:CellMarker
參考文獻:Zhang X, Lan Y, Xu J, Quan F, Zhao E, Deng C, Luo T, Xu L, Liao G, Yan M, Ping Y, Li F, Shi A, Bai J, Zhao T, Li X, Xiao Y. CellMarker: a manually curated resource of cell markers in human and mouse. Nucleic Acids Res. 2019 Jan 8;47(D1):D721-D728. doi: 10.1093/nar/gky900. PMID: 30289549; PMCID: PMC6323899.
細胞標誌物(Marker)是我們用來對細胞定義和分選的重要標誌。在進行單細胞轉錄組數據分析時,非常關鍵的一步是根據細胞的特徵性基因和特徵性生物學功能去定義每一個細胞亞群。CellMarker是2019年1月份由哈爾濱醫科大學Yun Xiao等老師發表於核酸研究 (Nucleic Acids Research),該團隊通過梳理100,000+發表的文獻,梳理出人的158個組織 (亞組織)的467個細胞類型的13,605個Marker基因,和鼠的81個組織 (亞組織)的389個細胞類型的9, 148個Marker基因,CellMarker資料庫可搜索,可瀏覽,可下載。
Human Cell Landscape
[編輯]
HCL是由浙江大學團隊打造的人類細胞譜圖平台,包含60種人體組織和7種細胞系的細胞,跨越胚胎和成年兩個時期,涵蓋八大系統的人類細胞圖譜。該成果於2020年3月份發表於Nature,作者開發了scHCL單細胞比對系統,可幫助鑑定人類細胞類型。
其中幾大功能介紹如下:
名稱 | 功能介紹 |
Landscape | 可對人體102種細胞類型進行可視化、也可以對細胞分組、篩選特定組織或基因進行可視化。 |
Gallery | 可下載特徵組織的單細胞的表達矩陣以及基因聚類分析的結果。 |
Search | 可選擇特定組織下的感興趣基因,並獲取該基因表達的柱狀圖和tSNE聚類圖。 |
Run-scHCL | 允許用戶自行上傳RNA表達矩陣(scRNA或bulk RNA都可以),運行該模塊後,可鑑定數據中的細胞類型,並提供交互式熱圖和csv文件結果。 |
Human Cell Atlas:人類細胞圖譜(HCA)計劃
[編輯]參考文獻:
人類細胞圖譜(Human Cell Atlas)計劃是一項與「人類基因組計劃」相媲美的大型國際合作項目(比如華大基因、扎克伯克、南方科技大學等名企名人名校都參加在內),致力於建立一個健康人體所包含的所有細胞的參考圖譜,包括細胞類型、數目、位置、相互關聯與分子組分等,旨在全面解碼人體所有細胞的類型、數目、位置、相互關聯與分子組成等,構建細胞基因表達等高維數學特性的精細圖譜,建成人體發育、生理、病例的完善和精細的參照系,最終建立全息生命信息網絡。這項計劃目前已經得到了不同類型的圖譜。已收錄33個組織、289位供體、450,0000個單細胞的測序數據,並在持續更新中。
Human Protein Atlas的single cell type atlas
[編輯]網站:https://www.proteinatlas.org/humanproteome/celltype
參考文獻:
HPA最近又出了一個新的板塊叫做」single cell type atlas」,替換原有的」Cell Type」。該板塊包含了來自13個人體組織的單細胞RNA測序數據,共192個細胞類型。可以檢索不同細胞類型中基因的數目,以及聚類umap圖和表達柱狀圖,並配有免疫組化切片、空間蛋白表達等結果。
Mouse Cell Atlas:小鼠細胞圖譜
[編輯]郭國驥團隊設計出了基於瓊脂糖材料的高通量單細胞捕獲系統。以此為基礎研發的Microwell-seq高通量單細胞測序平台,在提升現有單細胞技術精確度的同時,大大降低了單細胞測序文庫的構建成本。並且由Microwell-Seq繪製的scMCA可以清楚地顯示每個單個細胞的分化,病變和衰老。郭國驥團隊的細胞測序還涵蓋了哺乳動物體內的各種主要細胞類型,並對每一種器官內的組織細胞亞型,基質細胞亞型,血管內皮細胞亞型,和免疫細胞亞型進行了詳細的描述。
JingleBells(連結不上)
[編輯]網站:http://jinglebells.bgu.ac.il
參考文獻:
JingleBells是標準化單細胞RNA-Seq數據集的存儲庫,用於在單細胞水平上進行分析和可視化。用戶在JingleBells上可以直接下載到單細胞數據的BAM文件。
Tabula Muris:小鼠單細胞分析項目
[編輯]網站:https://tabula-muris.ds.czbiohub.org
參考文獻:https://www.nature.com/articles/s41586-018-0590-4
分析代碼:https://github.com/czbiohub/tabula-muris
Tabula Muris是史丹佛大學Chan Zuckerberg Biohub,VA Palo Alto醫療保健系統中心以及加州大學舊金山分校的研究人員對小鼠的整個生命周期內來自20個器官的529823個細胞進行單細胞RNA測序,生成了一個Tabula Muris Senis圖譜,同期發表在Nature雜誌上,所建立的資料庫。他們使用兩種方法從20個小鼠器官中分離出100,000多個細胞。第一種方法稱為螢光激活細胞分選(FACS),用於分離44,949個細胞,第二種是微流體液滴技術,用55,656個細胞。在相對較低的覆蓋範圍內對每個器官的數千個細胞進行了調查,為研究人員提供健康小鼠細胞生物學的路線圖。
PanglaoDB:人類和小鼠單細胞資料庫
[編輯]網站:https://panglaodb.se/index.html
參考文獻:Oscar Franzén, Li-Ming Gan, Johan L M Björkegren, PanglaoDB: a web server for exploration of mouse and human single-cell RNA sequencing data, Database, Volume 2019, 2019, baz046, doi:10.1093/database/baz046
PanglaoDB,這是2019年年初瑞典和美國的研究人員共同開發、發布的一個單細胞轉錄組資料庫。包含了超過1000個單細胞實驗的預處理和預計算分析,涵蓋了大多數主要的單細胞平台和分析流程,基於來自各種組織和器官的超過400萬個細胞。它包含了6000多個marker基因,可用於細胞分群注釋的marker資料庫,數據主要源於已經公開發表的單細胞轉錄組數據。PanglaoDB可以讓用戶查詢和探索細胞類型、遺傳途徑和調控網絡。它是由,致力於探索人類和小鼠的單細胞轉錄組數據,該資料庫的優點是適合零基礎的人使用、探索。
CancerSEA:癌症單細胞資料庫
[編輯]網站:http://biocc.hrbmu.edu.cn/CancerSEA/
參考文獻:CancerSEA: a cancer single-cell state atlas. Nucleic Acids Res. 2019.
CancerSEA是一個旨在單細胞水平上全面探索癌細胞的不同功能狀態的多功能網站,涉及14個細胞功能狀態,是25種癌症類型的900個癌症單細胞。
CDCP:細胞組學數據坐標平台
[編輯]參考文獻:
19個項目,6452個樣本,6種生物。
CDCP(細胞組學數據坐標平台)共享和集成複雜的單細胞數據集,並提供單細胞分析工具和可視化服務,以促進和使研究人員能夠訪問和探索已發布的單細胞數據集。
SCPortalen:單細胞資料庫
[編輯]網址:http://single-cell.clst.riken.jp
參考文獻:Abugessaisa I., Noguchi S., Böttcher M., Hasegawa A., Kouno T., Kato S.,Tada Y., Hiroki U., Abe K., Shin JW., Plessy C., Carninci P., Kasukawa T.; SCPortalen: human and mouse single-cell centric database, Nucleic Acids Research, Volume 46, Issue D1, 4 January 2018, Pages D781–D787, https://doi.org/10.1093/nar/gkx949s
人類和小鼠單細胞中心資料庫。當前該網站收錄了人類79種細胞類型的20761個單細胞以及小鼠119種細胞類型的46385個單細胞的單細胞轉錄組數據。
SignatureDB:B細胞資料庫
[編輯]網址:https://lymphochip.nih.gov/signaturedb/
參考文獻:
Betsholtzlab的單細胞資料庫
[編輯]成年小鼠大腦和肺血管和血管周圍細胞的基因表達資料庫
[編輯]網址:http://betsholtzlab.org/VascularSingleCells/database.html
參考文獻:1.Vanlandewijck, M., He, L. et al. A molecular atlas of cell types and zonation in the brain vasculature. Nature, 554, 475-480 (2018).
2. He, L., Vanlandewijck, M. et al. Data Descriptor: Single cell RNAseq of mouse brain and lung vascular and vessel-associated cell types. Scientific Data, Volume 5, Article number: 180160 (2018)
構建了小鼠腦和肺血管及血管相關細胞類型資料庫, 資料庫包含腦的3436個單細胞單細胞轉錄組以及小鼠肺的1504個單細胞轉錄組。
成年周細胞缺乏Pdgfbret/ret小鼠大腦內皮細胞基因表達資料庫
[編輯]網址:https://betsholtzlab.org/Publications/RetECscRNAseq/database.html
參考文獻:https://pubmed.ncbi.nlm.nih.gov/33375813/
從多個器官分離的成年小鼠成纖維細胞和血管壁細胞的基因表達資料庫
[編輯]網址:https://betsholtzlab.org/Publications/FibroblastMural/database.html
參考文獻:https://pubmed.ncbi.nlm.nih.gov/32769974/
PlantscRNAdb:植物單細胞資料庫
[編輯]網址:http://ibi.zju.edu.cn/plantscrnadb/
參考文獻:Hongyu Chen, Xinxin Yin, Longbiao Guo, Jie Yao, Yuwen Ding, Xiaoxu Xu, Lu Liu, Qian-Hao, Zhu, Qinjie Chu*, Longjiang Fan*. PlantscRNAdb: A Database for Plant Single-cell RNA Analysis. 2021. Unpublished
植物單細胞marker gene資料庫,通過PlantscRNAdb資料庫,研究者可以更加高效和準確地分析植物scRNA數據。PlantscRNAdb資料庫目前涵蓋了已開展單細胞研究的4個模式植物(擬南芥、水稻、番茄和玉米),提供了多種來源的細胞類型標記基因信息,如早期實驗、RNA-Seq和scRNA-Seq等途徑獲得的標記基因。目前提供的標記基因中,大多數(> 90%)來自最近的植物scRNA表達差異鑑定。為明確這類標記基因的可信度等級,樊龍江團隊重新分析scRNA數據,並將鑑定出的標記基因進行了分類:當特定細胞類型中某個標記基因的讀序數占該基因讀序總數的80%以上時,即該標記基因的表達主要由這一特定細胞類型貢獻,記為「Marker#1」(即「Marker80」),否則記為「Marker#2」。
此外,通過標準化處理,PlantscRNAdb提供了全基因組水平細胞類型之間或對照處理之間基因表達及其差異信息。針對大多數非模式植物物種可用的細胞類型標記基因非常少,難以確定這些物種細胞類型等,PlantscRNAdb還提供了一個在線BLAST工具,通過在其近源模式物種標記基因中查找同源候選基因的方法,克服上述分析困難。
LnCeCell:單細胞lncRNA和ceRNA測序
[編輯]網址:http://www.bio-bigdata.net/LnCeCell/
對單細胞lncRNA和ceRNA分析感興趣的話可以關注。
LnCeCell對來自25種癌症的數千種細胞的細胞特異性ceRNA調控的整理,包含:
(i)>9000個實驗支持的腫瘤轉移、復發、預後、循環和耐藥性的lncRNA生物標誌物;
(ii)原發性、惡性和轉移性癌細胞和免疫細胞的細胞特異性ceRNA網絡;
(iii)從文獻和相關數據源手工輸入的ceRNA亞細胞位置的詳細信息;
(iv)表現出血管生成、凋亡、細胞周期、侵襲、增殖和乾性等不同行為的不同細胞群集群。
LnCeCell提供超便捷、超顏值的搜索和瀏覽界面,並貼心的提供了一系列靈活的工具,方便數據的檢索和分析,包含:在不同細胞群中發現的ceRNAs的全局圖、ceRNAs的亞細胞位置、可視化單個細胞中失調的ceRNA網絡、查看每個細胞的功能狀態、識別ceRNA的失調功能、識別ceRNA的癌症Hallmark、進行Cox回歸分析、繪製ceRNAs的生存曲線。
ColorCells:單細胞lncRNA資料庫
[編輯]網址:http://rna.sysu.edu.cn/colorcells/ 。
CellPhoneDB:細胞通訊
[編輯]網址:https://www.cellphonedb.org/
細胞間通訊網絡研究必備,由英國Wellcome Sanger Institute的Teichmann Lab和Vento-Tormo Lab開發。需下載自行分析。
SpatialDB:單細胞空間轉錄組
[編輯]網址:https://www.spatialomics.org/SpatialDB/
2019年11月,中國科學院生物物理研究所高通量測序中心陳潤生院士團隊發布第一個單細胞空間轉錄組資料庫及數據在線可視化平台:SpatialDB,為研究組織的空間細胞結構提供了一個資源庫,並可能為理解疾病中的細胞微環境帶來新的見解。其相關研究成果已發表在《Nucleic acids research》。
SpatialDB系統收錄了來自5個物種由8種空間轉錄組技術產生的數據,建立了空間轉錄組數據分析處理流程,實現了空間轉錄組數據的在線可視化,同時提供了空間差異表達基因及其功能富集分析的注釋。包括5個物種(人類、小鼠、果蠅、秀麗隱杆線蟲和斑馬魚)的24個空間轉錄組數據集,這些數據集由8種空間分辨轉錄組技術生成,包括ST、Slide-seq、LCM-seq、seqFISH、MERFISH、Liver single cell zonation、Geo-seq和Tomo-seq。
用戶可以從不同技術的所有數據集中獲得目標基因的空間表達信息、瀏覽數據集中的空間差異表達基因及目標基因的空間表達信息、比較任意兩個數據集的空間基因表達譜、也可以上傳或下載數據。
使用參考:Fan Z, Chen R, Chen X. SpatialDB: a database for spatially resolved transcriptomes[J]. Nucleic Acids Research, 2020, 48(D1): D233-D237.
GRNdb:基於單細胞數據構建的基因轉錄調控資料庫
[編輯]轉錄因子及其下游靶基因形成的基因調控網絡(Gene Regulatory Network, GRN)資料庫。由華東師範大學等多家機構科研團隊開發,是一個免費的人類和小鼠資料庫,旨在方便搜索和分析轉錄因子(TFs)和下游靶基因(稱為調控子)在各種組織/條件下形成的調控網絡。
基於已知的TF-target關係和從公共資料庫收集的大規模單細胞轉錄組數據,以及TCGA和GTEx數據,研究人員系統地預測了184種不同生理和病理條件下的人和小鼠的GRNs,涉及超過633000個細胞和超過27700個樣本。GRNdb可搜索、比較、瀏覽、可視化和下載77746個GRN、19687841個TF-target以及相關結合motif的預測信息。
GRNdb:單細胞水平的基因調控網絡資料庫 https://my.oschina.net/u/4594634/blog/4950816
腦細胞資料庫
[編輯]網址:https://web.stanford.edu/group/barres_lab/brain_rnaseq.html
專門針對人腦單細胞構建的資料庫。
該資料庫純化了小鼠大腦皮層的神經元、星形膠質細胞、少突膠質前體細胞、新形成的少突膠質細胞、髓鞘少突膠質細胞、小膠質細胞、內皮細胞和周細胞,通過RNA測序為這八種細胞類型生成了轉錄組資料庫。進一步通過生物信息學分析鑑定了數千種新的細胞類型富集基因和剪接異構體,這些基因和異構體將為細胞鑑定提供新的標記物。
CellTalkDB:基於文獻的細胞標籤
[編輯]網址:http://tcm.zju.edu.cn/celltalkdb/index.php
參考文獻:https://academic.oup.com/bib/advance-article/doi/10.1093/bib/bbaa269/5955941
CellTalkDB包含文獻支持的人類和老鼠配體受體(LR)對,這些配體受體對由STRING資料庫中的蛋白質-蛋白質相互作用(PPI)進行精選,並由三名評審人員在Pubmed中手動驗證。
單細胞轉錄組數據集
[編輯]Cell Types Database:人類與小鼠大腦單細胞轉錄組資料庫
[編輯]網址:https://portal.brain-map.org/atlases-and-data/rnaseq
參考文獻:
腦細胞資料庫包含從人類和老鼠的單細胞數據中提取的生物特徵調查。這是創建哺乳動物大腦細胞普查的多年期項目的一部分。
博德研究所的單細胞轉錄數據集
[編輯]網址:https://singlecell.broadinstitute.org/single_cell
參考文獻:
截止2021年6月2日,341個單細胞數據集。
bioconductor提供的單細胞數據集
[編輯]網址:https://bioconductor.org/packages/release/data/experiment/vignettes/scRNAseq/inst/doc/scRNAseq.html
參考文獻:
EMBL的單細胞數據集
[編輯]網址:https://www.ebi.ac.uk/gxa/sc/home
參考文獻:
217個研究,18個物種,5 312 183個細胞。
KIT(腎臟單細胞資料庫)
[編輯]網址:http://humphreyslab.com/SingleCell/
對一些腎臟單細胞文章進行了整理,構建了一個腎臟單細胞數據集的在線分析資料庫。
Hemberg單細胞數據集
[編輯]網址:https://hemberg-lab.github.io/scRNA.seq.datasets/
This website contains a collection of publicly available datasets used by the Hemberg Group at the Sanger Institute. 包含小鼠和人的多個組織。
10x官網數據集
[編輯]10x Genomics 官方提供了多種測序數據,主要探究 10x Genomics 技術差異。
單細胞轉錄組:https://support.10xgenomics.com/single-cell-gene-expression/datasets
單細胞免疫vdj測序:https://support.10xgenomics.com/single-cell-vdj/datasets
單細胞空間轉錄組:https://support.10xgenomics.com/spatial-gene-expression/datasets
單細胞靶向基因轉錄組:https://support.10xgenomics.com/spatial-gene-expression/datasets