簡介
單細胞轉錄組測序(scRNA-seq)作為解析細胞異質性的核心技術,能夠在單個細胞水平上捕獲基因表達譜,為生命科學研究及臨床應用提供了高分辨率的分子層面視角。以下從技術原理、關鍵流程、數(shù)據(jù)分析及應用方向等方面進行詳細說明。
一、技術背景與核心優(yōu)勢
傳統(tǒng) bulk RNA-seq 基于細胞群體的基因表達平均水平進行分析,難以捕捉細胞間的異質性。而scRNA-seq可實現(xiàn)單個細胞的轉錄組檢測,其核心優(yōu)勢體現(xiàn)在:
1. 能夠識別組織中低豐度細胞類型(如腫瘤微環(huán)境中的癌干細胞);
2 解析細胞分化軌跡及動態(tài)基因表達變化;
3. 揭示基因表達的隨機性及細胞狀態(tài)轉換機制。
該技術已成為腫瘤學、發(fā)育生物學、神經(jīng)科學等領域的關鍵研究工具。
二、核心技術原理與流程
(一)單細胞捕獲
單細胞捕獲是scRNA-seq的首要步驟,需滿足高捕獲效率、低交叉污染的技術要求。目前主流技術包括:
1. 微流控芯片技術(以10×Genomics Chromium系統(tǒng)為例)
原理:利用微流控通道將單細胞、帶有條形碼(Cell Barcode)及UMI(Unique Molecular Identifier)的凝膠微珠與反應試劑包裹于油包水液滴(GEMs)中。
技術參數(shù):單次實驗可捕獲500–100,000個細胞,捕獲效率達65%±5%,雙細胞率<0.4%(細胞濃度在700–1200 cells/μL條件下)。
2. 其他捕獲方法
流式細胞分選結合孔板接種:適用于低通量需求(<1000細胞),需嚴格控制細胞活性(活細胞率>90%)。
微滴式數(shù)字PCR平臺:如Drop-seq技術,成本較低但捕獲效率相對較低(約20%–30%)。
(二)RNA 逆轉錄與cDNA擴增
1. 逆轉錄反應:細胞裂解后釋放的RNA與微珠表面的寡核苷酸引物結合,引物包含:Poly (dT)序列(靶向mRNA的3'端 Poly (A) 尾)、Cell Barcode、UMI 及測序接頭序列。逆轉錄酶(如MMLV逆轉錄酶)催化合成cDNA第一鏈,UMI 在此過程中與每個mRNA分子特異性結合,用于后續(xù)定量校正。
2. cDNA 擴增:采用PCR擴增或體外轉錄(IVT)線性擴增:PCR擴增適用于多數(shù)平臺,需控制循環(huán)數(shù)(通常12–18個循環(huán))以減少擴增偏倚;IVT線性擴增可降低偏好性,但產(chǎn)量相對較低。
3. 質量控制標準:擴增后cDNA濃度需達到5–30 ng/μL,片段分布峰值在1000–2000 bp(Agilent 2100檢測)。
(三)文庫構建與測序
1. 文庫構建
經(jīng)cDNA片段化、末端修復、加A尾及接頭連接后,通過PCR富集構建測序文庫。
文庫質量要求:片段大小集中在300–500 bp,無接頭二聚體,Qubit定量濃度>2 nM。
2. 高通量測序
推薦測序平臺:Illumina NovaSeq 6000或NextSeq 1000/2000。
測序深度設計:
①細胞分群及基礎分析:50,000–100,000 reads/細胞;
②高分辨率基因表達分析(如稀有細胞類型鑒定):150,000–300,000 reads/細胞。
數(shù)據(jù)產(chǎn)出要求:Q30堿基比例>85%,均一性誤差<10%。
(四)數(shù)據(jù)分析流程
1. 原始數(shù)據(jù)處理
數(shù)據(jù)拆分:基于Cell Barcode將測序數(shù)據(jù)分配至對應細胞;
質量過濾:去除含N堿基比例>5%、低質量堿基(Q<20)占比>20%的序列;
UMI 去重:通過UMI計數(shù)校正PCR擴增偏差,生成基因表達矩陣。
2. 細胞質量控制
檢測基因數(shù):排除<200或>6000基因的細胞(排除死細胞或雙細胞);
線粒體基因占比:通常<20%(避免細胞凋亡導致的RNA降解干擾);
核糖體基因占比:根據(jù)組織類型設定閾值(如免疫細胞通常>30%)。
3. 標準化與降維分析
標準化方法:采用LogNormalize或SCTransform消除測序深度差異;
降維算法:通過主成分分析(PCA)進行特征提取,選取前20–50個主成分用于后續(xù)分析;
可視化:使用UMAP或t-SNE算法進行二維投影,保留局部與全局細胞聚類結構。
4. 細胞聚類與注釋
聚類算法:采用Leiden算法(分辨率參數(shù)通常設為0.4–1.2);
細胞注釋:基于已知標記基因(Marker Genes)及參考數(shù)據(jù)庫(如CellMarker、PanglaoDB)進行細胞類型注釋,可結合單細胞注釋工具(如SingleR)實現(xiàn)自動化注釋。
5. 差異表達與功能分析
差異基因篩選:使用MAST、DESeq2等算法,設定閾值(|log2FC|>0.25,Adjusted P-value<0.05);
功能富集:通過GO、KEGG數(shù)據(jù)庫進行通路分析,結合SCENIC等工具預測轉錄調控網(wǎng)絡。
三、技術難點與解決方案
1. 低起始量RNA擴增偏差
問題:單個細胞RNA含量僅 10–30 pg,易導致擴增效率差異及基因丟失。
解決方案:采用UMI標簽校正定量偏差;優(yōu)化逆轉錄體系(如添加RNA酶抑制劑、使用高保真逆轉錄酶)。
2. 批次效應消除
問題:不同實驗批次的測序數(shù)據(jù)存在系統(tǒng)性偏差。
解決方案:實驗設計:采用統(tǒng)一試劑及操作流程;計算校正:使用Harmony、Seurat Integration等算法進行批次效應去除。
3.稀有細胞類型檢測
問題:低豐度細胞(占比<1%)易被聚類算法忽略。
解決方案:提高測序深度至200,000 reads/細胞以上;采用亞群細分算法(如SubCluster分析)。
四、應用領域
1. 腫瘤微環(huán)境解析:識別腫瘤浸潤免疫細胞亞群(如exhausted T 細胞、M2型巨噬細胞),分析其基因表達特征及與預后的關聯(lián)。
技術要求:需結合TCR/BCR測序實現(xiàn)免疫細胞克隆型分析。
2. 發(fā)育細胞譜系追蹤:通過Monocle3等工具重構細胞分化軌跡,鑒定關鍵分支點及調控基因。
技術要求:需獲取時間序列樣本或結合譜系示蹤技術。
3. 臨床樣本分析:對穿刺活檢樣本進行單細胞水平分子分型,指導個體化治療。
技術要求:樣本需新鮮處理(24 h內(nèi)完成單細胞捕獲),或采用單細胞保存液(如10× Genomics Cryopreservation Kit)。
參考文獻
[1] https://www.illumina.com.cn/techniques/sequencing/rna-sequencing/ultra-low-Input
-single-cell-rna-seq.html
[2] Zheng G X Y, Terry J M, Belgrader P, et al. Massively parallel digital transcriptional profiling of single cells. Nat. Commun. 8, 14049[EB/OL].(2017)
[3] Macosko E Z, Basu A, Satija R, et al. Highly parallel genome-wide expression profiling of individual cells using nanoliter droplets[J]. Cell, 2015, 161(5): 1202-1214.
[4] Butler A, Hoffman P, Smibert P, et al. Integrating single-cell transcriptomic data across different conditions, technologies, and species[J]. Nature biotechnology, 2018, 36(5): 411-420.
[5] Stuart T, Butler A, Hoffman P, Hafemeister C, Papalexi E, Mauck WM, Hao Y, Stoeckius M, Smibert P, Satija R. Comprehensive integration of single-cell data[J]. Cell. 2019 Jun 13;177(7):1888-902.