单细胞转录组测序
A、定义
单细胞转录组测序(Single-cell RNA sequencing, scRNA-seq)是一种在单细胞水平解析基因表达谱的高通量测序技术。
相较于传统Bulk RNA-seq,单细胞技术能够:
· 精准解析组织或血液中的细胞异质性
· 鉴定罕见细胞群
· 重建细胞发育轨迹
· 揭示疾病发生的分子机制
· 构建细胞图谱
该技术广泛应用于肿瘤学、免疫学、发育生物学、神经科学以及人群遗传学研究。

B、实验方案
技术路线
根据样本类型与研究目标,可选择:
· 单细胞3’端表达谱测序
· 单细胞5’端表达谱测序
· 全长转录本测序
· 单细胞免疫组库测序
· 单细胞多组学联合分析

实验流程
1. 样本制备
2. 单细胞捕获与条码标记
3. cDNA反转录与扩增
4. 建库与质控
5. 高通量测序
6. 生物信息分析

样本Pooling方案(可选)
为降低成本并提升批量处理能力,可支持:
· 多样本混样策略
· 基因型驱动解卷积分析
· 大规模人群研究设计

C、测序策略
1️ 建库策略
· 3'端表达定量(高性价比方案)
· 5'端表达+免疫组库分析
· 全长转录本分析(高分辨率研究)

2️ 推荐测序深度
|
研究类型 |
推荐测序深度 |
|---|---|
|
常规表达谱分析 |
20,000–30,000 reads/细胞 |
|
低表达基因研究 |
30,000–50,000 reads/细胞 |
|
免疫组库 |
≥50,000 reads/细胞 |
3️ 细胞捕获数量建议
· 小规模研究:5,000–10,000 细胞/样本
· 人群研究:1,000–2,000 细胞/个体
· 复杂组织:10,000–50,000 细胞/样本

D、应用方案
🔬 基础研究
· 细胞类型鉴定
· 细胞异质性分析
· 发育轨迹重建
· 细胞通讯分析
🧬 遗传研究
· 单细胞eQTL分析
· 人群遗传调控机制
· SNP功能注释
🩺 疾病研究
· 肿瘤微环境解析
· 免疫细胞动态变化
· 药物响应机制研究
🌍 大规模人群项目
· 参考细胞图谱构建
· 遗传背景对细胞组成的影响分析
· 高通量样本多重化测序

E、送样建议
样本要求:
样本类型一:新鲜组织
(1)切取 200-400mg (1-2颗黄豆大小)新鲜组织,用预冷的 1×DPBS 或者生理盐水洗净组织中的血液、体液,将清洗后的组织样本置于加满提前预冷的组织保存液的离心管中,使用封口膜将离心管封闭好,于 2~8℃保存/运输。
注意事项:
1. 样本采集时剔除坏死损伤组织:坏死组织为大量死细胞,影响组织解离后的活性和结团。
2. 样本采集时剔除脂肪、结缔组织等:细胞含量低,碎片多,影响组织解离结果。
3. 避免灼烧导致的死细胞产生:如激光刀、电刀等工具采集样本,应剔除灼烧部分组织,以免对后续实验造成影响。
4. 血液清洗干净:大量血液残留会造成后续裂解红细胞困难,影响其他细胞的活性。 5. 对于动物的心脏、肌肉、血管(静脉、动脉)等需要提取细胞核的组织,提核后会存有大量的碎片、杂质,严重影响上机结果,此类样本提核后需过流式除杂,降低上机风险。
6. 动物的癌症、肿瘤组织(坏死细胞较多)、脂肪组织(提核后含一定的碎片、杂质)、静脉(提核后含一定的碎片、杂质),此类需要提核的样本,可根据提核后的质检结果判定是否需要过流式除杂,降低上机风险。
样本类型二:冻存组织
切取 200-400mg (1-2颗黄豆大小)组织,用预冷的 1×DPBS 或者生理盐水洗净组织中的血液、体液,将清洗后的组织样本置于冻存管中,液氮速冻 20 min 以上,使用封口膜将离心管封闭好,干冰运输。
注意事项:
1. 冻存组织送样指导一般用于长期储存的样本,此类样本建议直接提核,如有解离成单细胞再提核的需求,可以先进行售前沟通。
2. 部分样本(如动物的心脏、肌肉、血管、脂肪等组织、以及癌症、肿瘤组织)提核可根据提核后的质检结果判定是否需要过流式除杂,降低上机风险。
样本类型三:液体类样本
(1)血液样品
3 ml - 6 ml 血液置于紫色 EDTA 抗凝管中保存。4℃保存运输不超过 24 h,转移至实验室,立即分离PBMC;如果血液用于分离 PMN,需常温保存,取样完成后 2 h 内开展实验不建议邮寄。
(2)体液样本
腹水、关节液和脑脊液等体液,捕获 500-10,000 个细胞,需要10-50ml;4℃保存运输不超过 12 h;捕获 10,000-20,000 个细胞, 腹水、关节液和脑脊液等体液,需要 20-100 ml。
样本类型四:其他较为脆弱样本
(可预约上门服务,不建议邮寄)
(1)胰腺、胃、甲状腺、下丘脑等分泌激素或者消化液的器官组织,建议上门解离或者 2 h 内闪送到实验室开展解离实验。
(2)脑、眼球等组织结构较脆弱的样本,建议上门解离或者2 h 内闪送到实验室开展解离实验。
(3)分离中性粒细胞的全血,建议上门解离或者 2 h 内闪送到实验室开展解离实验。
F、常见FAQ
Q1:单细胞测序与普通RNA-seq有什么区别?
单细胞测序在单细胞水平解析表达谱,而普通RNA-seq为群体平均表达。
Q2:细胞活率多少可以做单细胞?
· ≥85%:最佳
· 75–85%:可接受
· <70%:建议优化或改为单核方案
活率过低会导致:
· 空滴率升高
· 背景RNA污染增加
· 有效细胞数下降
Q3:是否支持样本混样?
支持10–20样本pooling,并可结合基因型进行解卷积分析。
Q4:样本活率低怎么办?
可优化细胞分离流程或采用核转录组测序(snRNA-seq)。
Q5:数据分析是否包含?
提供标准生信分析流程,包括:
· 质控
· 聚类
· 注释
· 差异表达分析
· 可视化报告
· Q6:应该选择“单细胞解离”还是“单核提取(snRNA-seq)”?
两种方案适用于不同场景:
|
情况 |
推荐方案 |
|---|---|
|
新鲜组织 |
单细胞解离 |
|
冷冻组织 |
单核测序 |
|
难以解离的组织(脑组织、纤维化组织) |
单核测序 |
|
需要完整转录本信息 |
单细胞优先 |
|
细胞活率低 |
单核更稳定 |
区别说明:
· 单细胞测序(scRNA-seq)检测胞质+核内RNA,信息更全面
· 单核测序(snRNA-seq)仅检测核内RNA,但对冻存样本更友好
· 单核测序通常背景低、批次稳定性更高
如样本为PBMC或新鲜悬液细胞,优先选择单细胞方案。
Q7:技术重复是否有必要?
一般建议3-6个生重复
建议在以下情况考虑:
· 新样本类型
· 新解离流程
· 极其重要的关键样本
多数情况下:
增加生物学重复优于增加技术重复
G、经典文献
1. Tang, F. et al. (2009). mRNA-Seq whole-transcriptome analysis of a single cell. Nature Methods.
2. Macosko, E. Z. et al. (2015). Highly parallel genome-wide expression profiling of individual cells using nanoliter droplets. Cell.
3. Zheng, G. X. Y. et al. (2017). Massively parallel digital transcriptional profiling of single cells. Nature Communications.
4. Stuart, T. & Satija, R. (2019). Integrative single-cell analysis. Nature Reviews Genetics.
5. Kang, J. B. et al. (2023). Single-cell eQTL analysis. Annual Review of Genomics and Human Genetics.
6. Gao, X. et al. (2025). Sample multiplexing and deconvolution methods. Advanced Science.
解决方案1:癌症方向整体研究方案
恶性肿瘤发生以及快速发展离不开它独特的分子机制特征:1、自给自足的生长信号;2、对生长抑制信号不敏感;3、逃避凋亡和免疫清除;4、无限复制的潜力;5、持续的血管生成;6、组织侵袭和转移;7、细胞能量代谢的失控;8、基因组的不稳定性和突变;9、非突变表观遗传重编程。肿瘤对机体产生的危害主要体现在,促炎症作用、解锁表型可塑性,而肿瘤环境的多态性微生物组、衰老细胞可能都会促进肿瘤的发生发展。针对以上特征,肿瘤微生物组研究、肿瘤代谢物研究、衰老微环境研究以及免疫抑制点研究都是科学界较为关注的主题。
近年来,组学技术的发展极大地推动了人们对肿瘤的认识和临床精准诊治。从单一组学到多组学联合,这几乎是所有组学的应用趋势。单一组学仅能检测样本某一方面的特征使其形成的生物学解释,具有一定的片面性。这促使了多组学联合分析策略的应用,加速人类对于生理病理过程的了解。从基因、转录、蛋白和代谢等多个水平进行全局性研究,同时还能够相互验证,减少单一组学分析的局限性和假阳性,有助于构建机体调控网络,深层次阐述各分子水平之间的调控关系及因果关系。
1.样本准备注意事项
1.1取样策略
建议着重选取癌症发展过程中几个关键的转折点作为研究焦点。首先是正常细胞向癌变细胞转变的初期阶段,其次是癌变前细胞向早期癌细胞的演变过程。此外,还可关注第三个重要转折点,即原始肿瘤向转移性肿瘤的转化,因为具备转移特性的癌细胞有可能扩散到机体的其他部位。这些过渡点的深入研究将有助于我们更全面地理解癌症的发展机制。
利用单细胞转录组测序鉴别肿瘤组织中细胞种类,整合空间转录组、空间代谢组学和空间脂质组学等测序技术,在同一肿瘤组织样本的相邻切片上,实现肿瘤组织微区中代谢组、脂质组和转录组数据的原位精准联合分析,构建代谢物/脂质和上游调控基因的关联网络,实现肿瘤组织微环境中肿瘤细胞、免疫细胞和基质细胞等代谢调控及交互作用的原位表征。
1.2生物学重复
单细胞转录组建议每组至少3个生物学重复,空间转录组建议每组至少2个生物学重复,空间代谢组临床样本的生物学重复建议至少5个。
2.整体研究思路
2.1癌症方向单细胞转录组研究思路


案例解析
背景信息
文章题目:Spatially restricted drivers and transitional cell populations cooperate with the microenvironment in untreated and chemo-resistant pancreatic cancer
中文题目:未治疗和耐药胰腺癌中空间因素和过渡细胞群与微环境的相互作用
发表期刊:Nature Genetics
影响因子:30.8
发表时间:2022年8月
测序类型:单细胞/核转录组(Sc/SnRNA-seq)、空间转录组、Bulk RNA-seq、WES、磷酸化蛋白质组学
样本情况:21名接受标准治疗的胰腺导管腺癌(PDAC)患者中收集了73份样本,包括4份正常的邻近组织样本。其中治疗组包括7例初治病例、8例新辅助FOLFIRINOX(包括叶酸、5-氟尿嘧啶、伊立替康和奥沙利铂的治疗方案)病例、4例新辅助吉西他滨+nab-紫杉醇病例、1个混合病例(FOLFIRINOX和吉西他滨+nab-紫杉醇)和1例放化疗(Chemo-RT)病例;另外10个病例生成了具有匹配空间转录组学、RNA-seq和WES数据的SnRNA-seq组学数据。其中治疗组包括3例初治病例、4例新辅助FOLFIRINOX病例、1例混合治疗(FOLFIRINOX和吉西他滨+nab-紫杉醇)和1例Chemo-RT病例。
总队列为31例患者,共83个Sc/SnRNA-seq样本和15个空间转录组。
主要研究内容
1. 利用单细胞转录组测序,研究者对73个样本进行聚类,并利用标志物的基因表达鉴定出176个肿瘤细胞亚群。通过对亚群进行通路富集分析,进一步发现了具有特定功能的细胞簇。例如,一些亚群表达增强特征基因,而其他亚群则以KRAS信号传导或上皮间质转化(EMT)为特征。研究者进一步将单细胞转录组与空间转录组数据进行联合分析,并结合H&E染色整合组学特征来表征空间异质性,发现在同一患者样本中的肿瘤细胞亚群具有不同的转录以及空间表达模式。
2. 研究者将突变和拷贝数变化映射到单个细胞,通过比较具有给定KRAS突变的每个肿瘤细胞亚群的基因表达谱来测试KRAS热点突变的影响,确定了五个具有多个KRAS热点驱动因素的病例。使用inferCNV分析,识别出HT061P1病例中各自KRAS亚克隆所特有的拷贝数变异(CNV)特征。接着使用WES进一步评估拷贝数变化。最终提出了一个整合基因表达和CNV数据的模型。为了评估蛋白质组异质性,研究者用9例肿瘤患者的30个样本进行了全局比对相关分析。通过分析几种致癌途径中蛋白质和磷酸化水平的相关性,研究者确定了突变对下游靶点的影响。
3. 一种理论认为PDAC来源于腺泡细胞,这些细胞经历了腺泡-导管化生(ADM)。因此研究者为了验证PDAC来自经历ADM的腺泡细胞的假设,从多个样本中鉴定出表达腺泡标记物(PRSS1、CELA3A)的腺泡细胞群。他们发现,ADM细胞群同时表达癌基因和抑癌基因,这表明它代表了一种过渡或动态状态。此外,KRAS驱动突变的发展似乎将ADM细胞推向胰腺导管腺癌。研究者通过SnRNA-seq对两个样本进行了正交试验,以确定是否可以从冷冻组织中识别出表达腺泡和导管特征,并且用免疫荧光染色进行了验证,观察到多个肿瘤区域的多个单细胞内腺泡和导管标志物的共同染色。最终通过对诱导胰腺炎、KRAS驱动的早期和晚期转化(KPC-OG-GEMM小鼠)和正常胰腺组织的小鼠模型进行了ScRNA-seq分析,数据也进一步证实了上述关于ADM发生的结果,这些发现能够将提出的腺泡起源的模型扩展到人类PDAC发育。
4. 癌症相关成纤维细胞(CAF)同时具有驱动癌症和抑制癌症的活性的能力,但其具体作用尚不清楚,研究者分析了肿瘤样本内的CAF,在样本中鉴定出iCAF、myCAF和apCAF三种亚型,并确定了不同的标志物和通路在不同亚型中差异表达。研究者发现,在接受过治疗的患者样本中,与炎症相关的iCAF含量较高,而在接受吉西他滨联合白蛋白紫杉醇治疗的患者样本中,iCAF中的金属硫蛋白基因上调,这与化疗耐药性有关。
5. 此外,研究者还分析了免疫检查点阻断疗法为何不适用于胰腺导管腺癌。通过检查免疫抑制性的肿瘤微环境,发现NK细胞、CD4+和CD8+T细胞以及Treg细胞都高度表达Ki67阳性标记物。他们还发现NECTIN受体在所有肿瘤细胞中高表达,而TIGIT在调节性T细胞和耗竭T细胞中高表达,表明靶向NECTIN-TIGIT轴可增强抗肿瘤的T细胞活性。
取样策略

分析方法解读
● 生信技术性解读
1. Sc/SnRNA-seq 数据预处理
应用 Cell Ranger v3.1.0 对下机 FASTQs 数据进行分析,得到矩阵文件之后用 Seurat v3.1.2 进行后续分析。
在质控这一步,过滤掉以下条件的 cells:
1. Counts < 300
2. Gene 数 < 200,或者 > 10000
3. UMIs < 1000,或者 > 10000
4. 线粒体基因表达比例 > 10%
过滤后,共得到 232,764 个细胞 的单细胞数据。
2. 降维分群和大类注释
对质控后的单细胞数据,使用 SCTransform 函数进行归一化处理。
利用 Louvain 算法 和 top30 的 PCA 维度,使用 FindNeighbors 和 FindClusters 函数进行聚类分析(分辨率为 0.5)。
并且采用常见的 marker 基因进行人工注释,最后定义了 20 个细胞大群。

3. 空间转录组的细胞大类定义
这篇研究工作中,研究者在定义完细胞大群之后,结合单细胞转录组中每类细胞的 marker 基因的表达,定义出空间转录组每个 spot 的细胞类型。这里使用的是 Seurat 中的函数 FindTransferAnchors 和 TransferData。

4. 肿瘤亚群分析
由于肿瘤具有样本异质性,研究者对 73 个样本的肿瘤亚群进行分析,共得到 176 个亚群并进行功能富集。研究者将通路分成 4 类:cell proliferation、cell stress response、epithelial-to-mesenchymal transition 和 immune-related pathways。

5. ScRNA-seq 和 WES 数据联合分析
每个样本除了有 ScRNA-seq 数据外,还有对应样本的 WES 数据,因此可以分析得到变异信息。研究者用 scVarScan 软件,能够识别出在各个细胞中存在的,从 WES 数据中检测到的突变位点。

6. CNV 分析
在肿瘤相关的研究中,研究者常常会关注 CNV 信息。基于 ScRNA-seq 数据,应用 inferCNV 软件对于每个细胞的 CNV 信息进行挖掘。

7. 轨迹分析
研究者假设 PDAC 是从腺泡细胞(acinar cells)演化过来的,于是针对腺泡细胞、肿瘤细胞又进行了亚群细分,并且用 monocle3 进行轨迹分析。
从结果来看,腺泡细胞可能经历两种分化路径:
一种是经历 ADM_normal 细胞,进一步分化为 Duct_like 细胞;
另一种是经历 ADM_tumor 细胞,进一步分化为 PanIN 细胞。

8. 空间特定区域分析
针对空间转录组数据,研究者还可以基于 H&E 图和病理信息,划分出特定的区域进行研究。如下图所示,研究者结合单细胞转录组数据反卷积到空间转录组的结果和病理特征,圈出 PDAC、Pancreatitis-like、PanIN 特征的区域,然后针对这些区域的基因表达特征进行分析。

解决方案2:免疫方向多组学整体研究方案
免疫系统是机体执行免疫应答及免疫功能的重要系统,由免疫器官、免疫细胞和免疫分子组成。免疫细胞包括一个先天性的和适应性的系统,其中先天性细胞包括树突状细胞、巨噬细胞、嗜中性粒细胞和一系列先天性淋巴细胞,不仅在防御中而且在组织稳态和修复中都具有关键作用。在面对不同的疾病,如轻微的感冒、新冠病毒感染乃至癌症时,人体的免疫系统会展现出不同程度的反应。我们可以通过研究免疫治疗来深入了解免疫系统在各种疾病过程中的激活方式及其持续作用的机制,并探讨为何某些疾病难以治愈的问题。
1. 样本准备注意事项
1.1 取样策略
建议选择具有代表性不同免疫阶段的样本开展测序,如治疗前后、病毒感染前后、用药不同时间点等。如果联合空间转录组,那么单细胞的样本类型需要涵盖空间转录组的样本类型。
1.2 生物学重复
单细胞转录组建议每组至少 3 个生物学重复,空间转录组建议每组至少 2 个生物学重复。
2. 整体研究思路
2.1 免疫方向单细胞转录组研究思路

案例解析:
文章题目:
Single cell transcriptomics shows that malaria promotes unique regulatory responses across multiple immune cell subsets
中文题目:
单细胞测序技术揭示疟疾患者免疫细胞亚群的动态变化
发表期刊:
Nature Communications
影响因子:
17.5
发表时间:
2023 年 11 月
测序类型:
ScRNA-seq
样本情况:
6 名疟疾患者外周血(感染第 0 天、药物治疗后第 7 天和第 28 天)以及 2 名健康对照外周血
主要研究思路
1. 为了对疟疾感染期间的免疫反应进行全面分析,对 6 名无并发症患者和 2 名健康对照单细胞转录组数据整合分析,发现疟疾感染期间免疫细胞亚群发生变化,比如 CD4 T 细胞和增殖细胞增加,而 NK 细胞、γδ T 细胞和 B 细胞的比例减少。
2. 疟疾期间单核细胞和树突状细胞表现出特异性免疫抑制特征,首先是调节性先天免疫显著富集,其下调多种细胞因子和趋化因子反应以及 HLA-DR 相关基因和途径,这些基因和途径是以细胞亚群特异性方式进行抗原呈递和炎症调控所必需的。相反,参与抗体介导的功能的多种体液通路上调,这与感染期间先天免疫在抗体清除中的潜在作用一致。
3. 研究者发现 NK 细胞在疟疾期间存在亚群特异性激活和调节,NK 细胞根据聚类标记注释为 CD56 bright、Transitional、IFNγ+ Adaptive、IFNγ− Adaptive 和 PD1+ 细胞五个亚群。
4. 对 T 细胞群研究发现,γδ T 细胞是关键先天细胞应答者,在疟疾感染期间存在激活调节,其细胞亚群中 Cytotoxic γδ T 细胞比例增加。而 CD4 T 细胞在预防疟疾方面发挥多种重要作用,疟疾感染期间主要以 Tr1 细胞亚群为主,并且 Tr1 细胞上调 IL10 和 IFN-γ 的表达。
5. 疟疾特异性 B 细胞反应对于发展抗疟免疫力至关重要,该研究中 B 细胞共识别 7 个亚群,其中 IL-10 Bregs 是人类疟疾感染期间调节性/耐受性反应的潜在重要因素。

分析方法解读
● 生信技术性解读
1. 单细胞数据质控
采用 Cell Ranger v3.1.0 对下机 FASTQs 数据进行分析,与数据库 GRCh38-3.0.0 比对分析。得到矩阵文件之后用 Seurat v4 进行后续分析。
在质控这一步,保留以下条件的 cells:
1. less than 20% of mitochondria DNA transcripts;
2. at least 250 genes and 500 UMIs。
最终得到 106,076 个细胞。
2. 数据整合-降维分群-细胞注释
经过质控后,用 Seurat 中的函数 FindIntegrationAnchors 和 IntegrateData function 进行数据整合。
然后用 Seurat 的 Louvain algorithm 聚类算法,进行降维分群聚类,得到 15 个大群。
然后基于 marker 基因,对大群进行命名:

3. 细胞占比分析
通过散点图进行不同时间节点(感染第 0 天、药物治疗后第 7 天、药物治疗后第 28 天,以及 2 名健康对照)之间的亚群间细胞占比统计,可以鉴定出占比在组间有明显差异的细胞亚群。这些占比有明显差异的亚群可能是疾病研究的重点。
采用的统计学方法 P-value(two-sided) is calculated by Mann Whitney U test。
在疟疾感染期间,细胞类型的分布发生了一些变化:
· CD4 T 细胞(p = 0.059 第 0 天与第 28 天)和增殖细胞(p = 0.03 第 0 天与第 28 天)有增加的趋势;
· NK 细胞(p = 0.024 第 0 天与第 7 天)、γδ T 细胞(p = 0.035 第 0 天与第 28 天)和 B 细胞(p = 0.026 第 0 天与第 28 天)细胞明显减少。
4. 差异基因分析
· 为了表征疟疾感染期间的基因表达谱,我们在急性感染(第 0 天)以及治疗后 7 天和 28 天之间的每个细胞大群进行了差异基因表达分析。使用 FindMarkers 函数对所有的细胞大群进行不同时间节点之间的差异基因分析,并比较第 0 天和第 28 天之间的差异基因数量。
· 从分析结果可以看出,单核细胞和 cDC 相对于其他细胞类型表现出最高的转录变化。在第 28 天(恢复期)和地方性对照之间也检测到 DEG,这可能表明转录谱在感染后一个月内持续变化。
· 随后,为了识别与恢复期相比疟疾感染引起的差异基因,后续重点分析第 0 天(16,192 个细胞)和第 28 天(34,286 个细胞)之间识别的 DEG。

5. 亚群细分及功能分析
对于研究者关注的某类大群,可以进一步进行亚群细分,并对每个亚群进行功能分析。以 NK cell 细胞群为例,可以进一步将其细分为 5 群。多个 NK 细胞亚群的细胞毒性潜力增加,具有已知细胞毒性功能的基因(GZMB、GZMA、GZMK57、GNLY、PRF1)上调。
6. 转录因子分析
使用 HOMER v4.9 软件对 CD14⁺ 和 CD16⁺ 单核细胞两类细胞的上游调节因子进行分析,确定了之间共享的基序,包括 NFκB-p65、IRF2、STAT5 和 JUN-AP1 结合顺式元件,以及每个子集特有的调节因子。
对于 CD16⁺ 单核细胞,这包括 p53、STAT1、IRF1 和 IRF8 结合顺式元件。
p53 被鉴定为先天细胞反应和疟疾免疫的重要贡献者,IRF1/8 和 STAT1/5 的富集与 I 型 IFN 通路在疟疾先天免疫细胞反应的激活和调节中起关键作用,印证了研究者研究的结论。