二代宏基因组测序
A、定义
二代宏基因组测序(Shotgun Metagenomic Sequencing)是一种基于高通量测序平台,对环境或宿主样本中的全部微生物DNA进行随机打断并测序的技术。
与 16S rRNA 扩增子测序相比,宏基因组测序具有:
· 不依赖特定扩增引物
· 可检测细菌、真菌、病毒、古菌等多种微生物
· 可获得物种水平甚至菌株水平分辨率
· 可分析功能基因与代谢通路
广泛应用于:
· 肠道微生态研究
· 感染性疾病病原检测
· 环境微生物研究
· 抗生素耐药基因分析
B、实验方案
1️ 技术原理
1. 提取样本总 DNA
2. DNA 片段化
3. 建立双端文库
4. 高通量测序
5. 生物信息分析(物种组成 + 功能注释)
2️ 样本类型
· 粪便样本
· 口腔/鼻咽拭子
· 血液
· 痰液
· 组织样本
· 环境样本(水、土壤等)
3️ 实验流程
· 样本预处理与去宿主 DNA(可选)
· DNA 提取与质控
· 建库
· 测序
· 物种注释
· 功能分析
C、测序策略
1️ 建库模式
· 双端测序(PE150 推荐)
· 高复杂度文库
2️ 推荐测序深度
|
研究目的 |
推荐数据量 |
|---|---|
|
基础菌群结构分析 |
≥6–10 Gb/样本 |
|
功能基因分析 |
≥10–15 Gb/样本 |
|
病原检测(低丰度) |
≥20 Gb/样本 |
|
环境样本(高复杂) |
≥15–30 Gb/样本 |
3️ 数据分析流程
· 原始数据质控(Trimmomatic/Fastp)
· 去宿主序列(Bowtie2)
· 物种注释(Kraken2 / MetaPhlAn)
· 丰度分析
· α/β 多样性分析
· 功能注释(KEGG、COG、GO)
· 抗性基因分析(CARD数据库)
· 宏基因组组装(MEGAHIT)
4️ 关键质控指标
· Q30 ≥ 85%
· 有效 reads 比例
· 宿主污染比例
· 文库重复率
D、应用方案
🔬 微生态结构研究
· 肠道菌群多样性分析
· 菌群失调研究
· 饮食/药物影响分析
🧬 功能与代谢通路研究
· KEGG 通路注释
· 短链脂肪酸相关通路
· 氨基酸代谢通路
🦠 感染性疾病检测
· 未知病原体筛查
· 病毒与真菌鉴定
· mNGS 临床辅助诊断
🧪 抗性基因研究
· 抗生素耐药基因分布
· ARG 丰度分析
· 多重耐药菌监测
🌍 环境微生物研究
· 水体微生物生态
· 土壤微生物群落
· 极端环境微生物
E、送样建议
1️ 粪便样本
· 新鲜采集
· -80℃ 保存
· 避免反复冻融
· 建议 ≥200 mg
2️ 拭子样本
· 无菌采集
· 保存于 DNA 稳定液中
· 低温运输
3️ 血液/体液样本
· EDTA 抗凝管
· 及时分离
· 控制宿主 DNA 污染
4️ 环境样本
· 记录采样环境信息
· 低温保存
· 避免污染
F、常见 FAQ(科研导向版)
Q1:宏基因组与 16S 测序的区别?
|
项目 |
16S 测序 |
宏基因组 |
|---|---|---|
|
分辨率 |
属/部分物种 |
物种/菌株 |
|
功能分析 |
预测 |
实测 |
|
病毒检测 |
不可 |
可 |
Q2:是否可以检测病毒?
可以,但 DNA 宏基因组主要检测 DNA 病毒。
RNA 病毒需转录组宏基因组(RNA mNGS)。
Q3:宿主 DNA 含量高怎么办?
· 可进行宿主 DNA 去除
· 增加测序深度
· 优化样本处理流程
Q4:是否必须做生物学重复?
建议:
· 每组 ≥3 个生物学重复
· 统一采样时间与条件
Q5:宏基因组是否可以用于临床诊断?
可以(mNGS),但需:
· 严格污染控制
· 临床解读标准
· 高灵敏度分析流程
G、经典文献
1. Qin, J. et al. (2010). A human gut microbial gene catalogue established by metagenomic sequencing. Nature.
2. Human Microbiome Project Consortium (2012). Structure, function and diversity of the healthy human microbiome. Nature.
3. Franzosa, E. A. et al. (2015). Species-level functional profiling of metagenomes. Nature Methods.
4. Wilson, M. R. et al. (2019). Clinical metagenomic sequencing for pathogen detection. NEJM.
5. Li, D. et al. (2015). MEGAHIT: ultra-fast metagenomic assembly. Bioinformatics.