单细胞全长转录组测序

一、技术简介

单细胞全长转录组测序融合10x Genomics单细胞高分辨率与Oxford Nanopore三代长读长测序的双重核心优势,突破传统短读长单细胞测序仅捕获转录本末端片段的技术局限,可直接读取单个细胞中mRNA从5帽到3尾的完整序列,实现转录本异构体精准解析、融合基因全长组装、可变剪接动态追踪**,将单细胞转录组分析从基因表达水平推进至转录本结构与功能调控层面。

该技术能有效规避群体平均化对稀有细胞类型(如癌症干细胞、特异性免疫应答细胞)的掩盖,精准揭示细胞功能多样性、转录调控分子机制及疾病相关的结构变异,是解析细胞异质性、发育调控、肿瘤微环境重塑、罕见病分子诊断的革命性工具,广泛应用于发育生物学、肿瘤学、神经科学、精准医学、免疫生物学等研究领域。

相比传统测序技术,单细胞全长转录组测序解决了异构体盲区、复杂结构变异遗漏、低表达稀有转录本检测不足三大核心问题,可在单细胞维度挖掘更精细的分子调控规律,为科学研究与临床转化提供更精准的分子数据支撑。

 

二、核心技术原理

单细胞全长转录组测序基于微流控单细胞分选与三代长读长测序的技术整合,依托10x Genomics Chromium平台实现单个细胞的精准捕获与标记,结合Oxford Nanopore超长读长优势完成全长转录本的无拼接测序,整体技术原理与流程如下:

1. 单细胞悬液制备:将组织/细胞样本解离为高活性单细胞悬液,保证单分散性与细胞完整性,为后续分选奠定基础;

2. 微流控单细胞捕获:通过10x Genomics平台完成油包水(GEMs)制备,将单个细胞与带有独特Barcode和UMI序列的凝胶珠包裹形成独立反应体系,实现单个细胞的特异性标记;

3. 全长cDNA文库构建:在独立GEMs体系中完成细胞裂解、mRNA释放与逆转录,合成全长cDNA,基于Barcode序列区分不同单细胞的转录本,避免样本交叉污染;

4.三代测序建库与测序:将单细胞全长cDNA文库进行Oxford Nanopore专属建库处理,通过三代长读长测序平台完成测序,直接获得无拼接的全长转录本序列;

5. 生物信息分析:通过专属分析流程完成原始数据质控、Barcode拆分、序列比对、转录本组装,实现异构体分析、融合基因鉴定、可变剪接检测、细胞分群与功能注释等多维度分析,同时可关联基因表达与转录本结构,解析分子调控网络。

 

配套图片建议

 

三、技术核心优势

单细胞全长转录组测序整合单细胞与三代测序的技术优势,相比传统短读长单细胞测序(10x 3/5端测序)、bulk三代全长转录组测序,具有以下不可替代的核心优势:

1. 全长覆盖,无拼接解析转录本结构

    直接读取mRNA完整序列,无需拼接,精准解析剪接位点、UTR变异、RNA编辑事件、启动子/终止子多样性,彻底解决传统技术的异构体盲区问题,可区分同一基因的不同功能剪接变体(如促癌型/抑癌型异构体)。

2. 单细胞分辨率,精准解析细胞异质性

    独立分析每个细胞的全长转录组信息,避免群体平均化掩盖稀有细胞类型与低表达转录本,可实现细胞亚群的精细化分类**,挖掘细胞亚型特异性的转录本调控规律。

3. 全景解析融合基因,鉴定新型结构变异

    超长读长可精准组装融合基因的全长结构,有效鉴定传统技术难以发现的新型融合基因、基因重排、复杂结构变异,并可在单细胞维度定位结构变异的细胞来源,为肿瘤异质性与耐药机制研究提供新视角。

4. 实时追踪可变剪接动态,揭示调控分子开关

    可在单细胞、细胞亚型、发育阶段/处理时间等多个维度,实时检测**可变剪接类型(外显子跳跃、内含子滞留、TSS/TES变异等)**的动态变化,解析剪接因子导的细胞状态转换分子机制。

5. 高灵敏度检测低表达稀有转录本

    三代长读长测序无PCR扩增偏好性,可有效检测低表达的功能性非编码RNA、新转录本、稀有异构体,丰富转录组注释信息,完善分子调控网络。

6. 一库多分析,兼顾基因表达与结构解析

    一次实验可同时获得单细胞基因表达谱与全长转录本结构信息,无需单独构建多套文库,降低样本消耗,提升研究效率,实现“基因表达-转录本结构-细胞功能”的三重关联分析。

7. 兼容性强,适配多样本类型与研究需求

    兼容新鲜/冷冻的细胞、组织样本,可应用于发育轨迹追踪、肿瘤微环境解析、罕见病突变检测、免疫细胞调控等多种研究场景,同时支持与单细胞ATAC-seq、scTCR/BCR-seq等技术进行多组学联合分析。

 

 

四、样本要求

(一)适用样本类型

兼容动物/人源的新鲜/冷冻细胞、组织样本,经优化的解离方案可适配难处理组织,具体包括:

- 细胞样本:细胞系、原代细胞、PBMC、分选后的特异性细胞亚群;

- 组织样本:肿瘤组织、癌旁组织、神经组织(海马体、皮层、视网膜等)、免疫器官(脾、胸腺)、肺、肝、卵巢、乳腺等实体组织;

- 特殊样本:类器官、胚胎组织、微量穿刺样本。

 

(二)送样核心要求

为保证单细胞捕获效率与全长转录本测序质量,样本需满足以下核心要求,全程遵循无RNase污染操作规范:

1. 细胞悬液样本

    - 细胞活率**≥85%**,无明显团聚、细胞碎片与红细胞污染;

    - 细胞浓度**700-1200 cell/μL推荐总细胞量≥10,000个;

    - 采用无血清培养基/PBS重悬,避免含EDTA、肝素等抑制试剂。

2. 组织样本

    - 新鲜组织优先,取材后30分钟内进行解离或保存,避免RNA降解;

    - 组织重量≥50mg,剔除结缔组织、脂肪组织等非研究区域;

    - 冷冻组织需经液氮速冻后-80℃保存,避免反复冻融,解冻后立即解离。

3. 通用要求

    - 样本全程无RNase污染,使用RNase-free耗材与试剂;

    - 若需进行多组学联合分析,需保证样本DNA/RNA完整性(RNA RIN值≥7.0);

    - 明确样本信息:物种、组织/细胞类型、处理条件、重复数,建议提供对照组与实验组样本。

 

(三)样本运输规范

根据样本类型选择对应的运输方式,全程保证样本活性与核酸完整性,具体要求:

1. 新鲜单细胞悬液:4℃低温冰浴运输,运输时间≤24h,全程避免剧烈震荡,到达后立即处理;

2. 新鲜组织样本:浸泡于RNAlater组织保存液中,4℃密封运输,24h内送至实验室解离;

3. 冷冻细胞/组织样本:液氮速冻后,用干冰密封运输,保证干冰足量(运输过程中不挥发),干冰量≥5kg/24h;

4. 分选后细胞样本:分选后立即用无血清培养基重悬,4℃冰浴运输,12h内送至实验室。

 

五、测序与数据分析策略

(一)推荐测序策略

基于Oxford Nanopore三代测序平台,结合单细胞样本的特性,采用**标准化测序策略**,保证全长转录本的覆盖度与数据质量,具体参数:

| 测序平台 | 测序模式 | 推荐测序深度 | 核心适用场景 |

|----------------|----------|--------------------|----------------------------|

| Oxford Nanopore | 长读长   | ≥10G/样本 | 单细胞全长转录组常规分析 |

| Oxford Nanopore | 长读长   | ≥20G/样本 | 稀有异构体、低表达转录本检测 |

 

(二)标准化数据分析流程

采用wf-single-cell上游分析软件结合Seurat下游分析体系**,搭建专属的单细胞全长转录组分析流程,分为基础质控、核心分析、高级分析三个层级,兼顾数据可靠性与分析深度,核心分析步骤如下:

1. 原始数据质控

    - 过滤低质量reads、接头序列与污染序列,评估测序质量(Q20≥80%);

    - 拆分Barcode序列,校正UMI,去除重复序列,统计每个单细胞的有效reads数与转录本数;

    - 过滤低质量细胞(基因/转录本表达量过低、线粒体基因占比过高),保留高质量单细胞用于后续分析。

2. 核心分析

    - 细胞聚类与注释:基于基因/转录本表达谱进行PCA降维与UMAP聚类,结合Marker基因/转录本进行细胞类型注释,实现细胞亚群的精细化分类;

    - 全长转录本组装与注释:完成单细胞转录本的从头组装,与参考基因组比对,注释V/D/J基因、剪接位点、UTR区域,鉴定已知/新型转录本;

    - 异构体分析:统计异构体类型与数量,分析细胞亚型/样本间的异构体表达差异,鉴定亚型特异性异构体;

    - 可变剪接分析:检测外显子跳跃(SKIP)、内含子滞留(IR)、TSS/TES变异等可变剪接类型,分析可变剪接的细胞特异性与动态变化;

    -融合基因分析:鉴定全长融合基因,统计融合基因类型与表达丰度,定位融合基因的细胞来源;

    - 差异分析:分析实验组与对照组间的**差异基因、差异转录本、差异异构体,筛选关键调控分子。

3. 高级分析

    -细胞通讯分析:基于分泌型转录本解析细胞亚群间的通讯网络,结合转录本结构分析通讯分子的功能变异;

    -转录调控网络构建:整合转录因子、靶基因、异构体表达数据,构建单细胞维度的转录调控网络;

    -发育轨迹分析:结合拟时序分析,追踪细胞发育/分化过程中转录本结构与表达的动态变化;

    -多组学联合分析:支持与单细胞ATAC-seq、scTCR/BCR-seq、空间转录组等数据联合,解析“染色质可及性-转录本结构-基因表达-细胞功能”的关联机制;

    -可视化分析:绘制UMAP聚类图、异构体表达热图、可变剪接类型分布图、融合基因定位图、细胞通讯网络图等多维度可视化图表。

(三)关键质控指标

为保证实验数据的可靠性与分析结果的准确性,设定多维度核心质控指标,所有指标达标后方可进行后续分析,具体要求:

1. 单细胞捕获与测序:有效细胞捕获率≥60%,每个细胞平均有效reads数≥10,000,测序饱和度≥85%;

2. 转录本组装:全长转录本组装率≥70%,与参考基因组比对率≥85%,新型转录本注释率≥30%;

3.细胞质控:过滤后高质量细胞占比≥90%,线粒体基因占比≤20%,无明显样本交叉污染(污染率≤0.5%);

4. 重复性:生物学重复间细胞聚类结果一致性≥80%,核心异构体/融合基因表达趋势一致。

注各环节的核心分析内容与质控指标)

 

六、核心应用方向

单细胞全长转录组测序凭借全长转录本解析与单细胞分辨率的双重优势,可在分子、细胞、组织多个维度挖掘精细的调控规律,为基础研究与临床转化提供全新的研究视角,核心应用方向包括:

🔬 发育生物学研究

1. 解析胚胎发育、器官发生过程中,**细胞命运决定**的转录本异构体调控规律,鉴定发育关键节点的特异性剪接变体;

2. 追踪干细胞分化过程中**启动子/终止子多样性**与细胞亚型特化的关联,揭示转录本结构重塑介导的细胞谱系分化;

3. 研究不同发育阶段的组织/器官中,细胞亚型特异性的可变剪接动态,挖掘发育调控的分子开关(如Wnt、Notch通路的异构体调控)。

 

🧫 肿瘤学研究

1. 肿瘤异质性解析:在单细胞维度鉴定肿瘤细胞的亚型特异性异构体、融合基因,解析肿瘤干细胞与普通肿瘤细胞的转录本结构差异;

2. 肿瘤微环境(TME)重塑:研究肿瘤微环境中免疫细胞、成纤维细胞、内皮细胞的全长转录本变化,揭示细胞间通讯的分子机制(如EMT过程中的胶原基因UTR变异);

3. 耐药机制研究:鉴定化疗/靶向治疗后,耐药细胞的新型融合基因、耐药相关异构体,挖掘耐药性产生的分子靶点;

4.肿瘤精准分型:基于肿瘤细胞的异构体表达谱、融合基因类型,实现更精细的肿瘤分子分型,为个性化治疗提供依据。

 

🧠 神经科学研究

1. 解析大脑不同脑区(海马体、视皮层、纹状体等)神经元、胶质细胞的**亚型特异性剪接模式**,揭示脑功能特化的分子基础;

2. 研究神经发育、神经退行性疾病(阿尔茨海默病、帕金森病)中,可变剪接的动态变化与神经元功能异常的关联;

3. 鉴定神经细胞中与疾病相关的**极可变外显子(EVExs)**,挖掘神经疾病的潜在治疗靶点。

 

🩺 精准医学与罕见病研究

1. 罕见病分子诊断:直接检测单细胞中因**剪接错误、基因重排、UTR变异**导致的隐性致病变异(如脊髓性肌萎缩症SMN1/2外显子跳跃),明确罕见病的分子病因;

2. 免疫治疗优化:解析T/B细胞受体(TCR/BCR)的**全长多样性**,鉴定免疫细胞的特异性克隆型与转录本结构变异,预测免疫检查点抑制剂的治疗响应;

3.个性化靶点筛选:基于患者单细胞的全长转录组数据,鉴定特异性的融合基因、功能异构体,为靶向药物研发提供个性化靶点。

 

🧬 免疫生物学研究

1. 研究免疫激活、免疫耐受过程中,免疫细胞(T细胞、B细胞、巨噬细胞)的转录本结构重塑,揭示免疫应答的分子调控规律;

2. 解析感染免疫中,免疫细胞识别抗原后,可变剪接导的功能转换(如记忆性T细胞的亚型特异性异构体表达);

3. 鉴定自身免疫病中,致病性免疫细胞的特异性异构体、融合基因,为自身免疫病的治疗提供新视角。

 

七、经典研究案例

案例1 大脑发育的剪接多样性与细胞功能特化研究

期刊:Nature Neuroscience(IF=20)

研究主题:基于单细胞长读长测序揭示小鼠与人脑发育中的特化剪接模式

样本:不同发育阶段(P14/P21/P28/P56)的小鼠脑区(海马体、视皮层、纹状体等)、6份健康人类海马体样本

研究结果:

1. 72%的基因在细胞亚型、脑区、发育阶段中存在全长异构体表达差异,神经元的异构体变异性显著高于胶质细胞;

2. 青春期(P21-P28)是剪接变异性的关键过渡期,突触相关基因的剪接模式发生显著变化,介导脑发育的功能特化;

3. 小鼠细胞类型特异性剪接在人类海马体中大部分保守,同时人类大脑存在进化获得的新型功能异构体,为脑功能进化研究提供新视角;

4. 16%的极可变外显子(EVExs)与阿尔茨海默病、精神分裂症等神经疾病相关,为神经疾病的机制研究提供新靶点。

案例2 卵巢癌的异构体多样性与肿瘤微环境重塑研究

期刊:Nature Communications(IF=15.7)

研究主题:高通量全长单细胞RNA测序解析卵巢癌的异构体与基因组改变

样本:3例高级别浆液性卵巢癌患者的5份网膜样本(3份转移灶、2份无肿瘤组织)

研究结果:

1. 共检测到152,546种异构体,其中34.7%为新型未报道异构体,42%的新型异构体为蛋白编码型,丰富了卵巢癌的转录组注释

2. 肿瘤细胞中异构体多样性显著增加,8%的肿瘤特异性异构体为单细胞独有,为肿瘤异质性研究提供新依据;

3. 发现患者特异性IGF2BP2::TESPA1融合基因,为卵巢癌的靶向治疗提供全新靶点;

4. 网膜转移灶中间皮细胞通过TGF-β/miR-29/胶原轴的转录本结构变异(COL1A1 3UTR延长)转化为癌相关成纤维细胞,揭示肿瘤微环境重塑的分子机制。

案例3 单细胞全长转录组技术优化与免疫细胞研究

期刊:Cell Discovery

研究主题:第三代测序平台的高通量、高灵敏度全长单细胞RNA-seq方法开发(SCAN-seq2)

研究结果:

1. 开发的SCAN-seq2技术可一次测序3072个单细胞,每个细胞可检测到**4000+基因与4500+全长RNA异构体**,兼具高通量与高灵敏度;

2. 可在单细胞维度精准确定**TCR/BCR基因的V(D)J重排事件**,准确检测免疫细胞的克隆多样性;

3. 低交叉污染率(≤0.5%),数据重复性与Smart-seq3相当,为单细胞全长转录组研究提供了新的技术工具。