宏基因组dene novo测序技术解决方案
1、概况
宏基因组测序,是指利用高通量测序技术,以某一特定环境中微生物的基因组为研究对象,采用生物信息学的分析方法,研究微生物的多样性、微生物的群落结构,探索微生物的潜在功能以及与环境之间的互作关系。与传统的微生物组研究方法相比,宏基因组测序技术突破了有些微生物不可培养的瓶颈,能够快速高效地获取整个微生物群落的基因组信息,因此近年来该技术在各种环境微生物学研究中得到了广泛应用。
2、实验技术路线
3、生物信息学分析内容
4、测序须知
(1)送样要求
Ø 土壤:10g
Ø 粪便:3-5g
Ø 血液:10ml
Ø 污泥:5-10g
Ø DNA:总量 ≥4μg、浓度≥ 20 ng/μL、1.8 < OD260/280 < 2.0
(2)平台选择
Ø Illumina PE100/125/150
(3)推荐测序量
Ø 土壤:>8G
Ø 粪便:>6G
Ø 肠粘膜:>6G
Ø 水样:3-5G
Ø 沉积物:>8G
Ø 皮肤表面:>6G
5、优势与问题
(1)优势
Ø 微生物无需进行分离、培养
通过对样本中所有微生物遗传物质DNA进行测序,可以获知微生物的分类地位,解决了环境中大部分微生物不能分离培养的局限性问题。
Ø 客观还原微生物菌群结构
宏基因测序技术无需PCR扩增环节,可以近乎完整、全面、客观的呈现微生物菌群的原始结构,并从整体上研究不同菌群的结构与功能关系。
Ø 直接对微生物的基因进行研究
传统的微生物基因研究方法,一般需要构建大量的克隆,通过文库筛选,才能获得功能基因,而宏基因组测序技术可以直接对微生物的功能基因进行深入研究。
(2)问题
Ø 难于发现含量稀少的物种
Ø 有宿主基因组干扰
Ø 分析方法复杂,价格相对较贵
6、应用方向及解决的关键问题
1. 医学与健康领域
国内外利用宏基因组技术对肠道菌群与肥胖、肠炎等疾病的关系进行了深入研究,并通过控制饮食对肠道菌群进行有目的的调节,对肥胖和肠炎的治疗起到了显著的效果。
2. 宿主消化道微生物研究
猪、牛、鱼等在不同饲料喂养或者不同处理后,利用宏基因组技术对消化道不同部位微生物多样性进行研究,同时监测宿主的生理生化指标,揭示微生物群落变化与宿主健康的紧密联系。
3. 土壤微生物研究
通过根际微生物多样性的研究,定位了与植物生长互惠互利的微生物,对生物肥料的优化起到了指导作用;植物与土壤微生物联合修复污染土壤过程中微生物的动态变化,也可以通过宏基因组技术进行监控。
4. 活性污泥中微生物研究
利用宏基因组技术对活性污泥中微生物多样性进行研究,监测活性污泥处理污水过程中微生物的动态变化,找到与水质净化相关的关键微生物及重要功能基因。
7、主要结果展示
图1、组间基因数目差异箱图

图2基因数目韦恩图(花瓣图)分析
说明:当样本(组)数小于5时,展示韦恩图,当样本(组)数超过5个时,展示花瓣图

图3、样品间相关系数热图

图4、群落微生物物种组成柱状图(Species level)

图5、显著差异物种的箱图

图6、样本与属水平物种关系图

图7、PCoA分析
图8、差异物种之间的互作分析

图9、差异物种之间的互作分析
图10、KEGG差异功能的LDA值分布图
说明: LDA值分布柱状图中展示了LDA Score大于设定值(默认设置为3)的功能,即组间具有统计学差异的Biomarker,柱状图的长度代表差异功能的影响大小(即为 LDA Score)

图11、COG聚类结果
备注:COG数据库是根据蛋白序列的功能,把相关功能聚到一个大类中,如RNA合成相关的功能类,转录相关的功能类等25个大类,每个分类中都会包含很多相关的功能蛋白。
表1 代谢通路与基因对应关系统计
备注:map00364为代谢通路图的编号,4表示我们预测出的基因有4个出现在该代谢通路中,分别为ene_id_11957、gene_id_7351、gene_id_13043、gene_id_12012,Metabolism;Xenobiotics biodegradation and metabolism;Fluorobenzoate degradation是该代谢通路的功能分类情况;对应几个基因后边几列分别为该基因比对上的KEGG数据库中基因的名字,KO号,酶号,以及该酶的功能描述。
图12 KEGG pathway图(三羧酸循环通路)
备注:图中标为绿色的基因/酶,表示该基因/酶存在于该样品中。
图13、多样品代谢通路比较分析示例图
图14、差异功能分析
8、案例分析
Metagenomic and metabolomic analyses reveal distinct stage-specific phenotypes of the gut microbiota incolorectal cancer
实验设计
作者收集了共616例临床粪便样本用于检测微生物组,406例样本用于检测代谢组,涵盖了不同结肠肿瘤时期的患者。随后作者分别利用宏基因组测序以及代谢组学(毛细管电泳-电喷雾电离飞行时间质谱联用技术,CE-TOFMS)检测,并通过后续分析揭示不同肿瘤时期的微生物以及代谢物特征。
实验结果
(1)不同结肠癌阶段肠道微生物以及代谢产物组成存在差异
图15 不同阶段结肠肿瘤患者粪便样本宏基因组分析
A.粪便样本Top30细菌属丰度热图。Healthy:n=251,MP:n=67,S0:n=73;SI/II:n=111,SIII/IV:n=74,HS:n=40。B. 细菌属水平的主坐标分析。C. 狄利克雷多项式混合模型算法聚类得到的四类菌群组成结构,图中展示Top30丰度菌属
图16 不同阶段结肠肿瘤患者粪便样本代谢组学分析
A.粪便样本Top30代谢产物丰度热图。Healthy:n=149,MP:n=45,S0:n=30;SI/II:n=80,SIII/IV:n=68,HS:n=34。B. 细菌属水平的主坐标分析。
(2)宏基因组与代谢组学手段联合鉴定不同时期结肠癌患者肠道内的差异特征
图17 不同时期的肠道菌群特征
A. 门水平下不同阶段患者体内变形菌门(Proteobacteria)、拟杆菌门(Bacteroidetes)、梭杆菌门(Fusobacteria)、厚壁菌门(Firmicutes)和放线菌门(Actinobacteria)丰度的升高或是下降。(绿色:普遍存在的;蓝色:与其他阶段相同;红色:是该疾病阶段特有的);B. 细菌进化树分析(共包含361种不同种属的细菌)。橘黄色代表细菌丰度升高,红色代表升高尤其明显,绿色代表细菌丰度降低。箱型图中展现了不同疾病进展阶段一些先前已有报导与CRC相关的菌群(绿色圆圈)、产丁酸盐细菌(黄色圆圈)、产H2S细菌(粉红圆圈)以及本文中新发现的差异细菌(蓝色圆圈)的丰度差异。
图18不同时期代表性肠道菌群的复制速率
纵坐标:生长速率指数(GRiD)。A~G:代表性的肠道菌群生长速率指数与不同阶段结肠癌患者之间的关系。+:升高且p<0.05;++:升高且p<0.01;+++:升高且p<0.005。
图19 不同阶段肠道代谢产物特征与细菌相关性
A. 不同结肠癌阶段粪便内胆汁酸盐的含量变化;B. 不同结肠癌阶段粪便内支链氨基酸(BCAA)和芳香类氨基酸(AAA)的含量变化;C. 不同结肠癌阶段粪便内支链脂肪酸异戊酸盐的含量变化;D. 不同结肠癌阶段患者肠道内脱氧胆酸盐和B. wadsworthia细菌的相关性分析;E. Atopobium的细菌相关性网络分析(节点大小越大,连接线越粗代表细菌之间的相关性越紧密);F. Atopobium与各细菌种之间的相关性分析热图,图中展示的细菌为丰度>1×10-5且斯皮尔曼相关系数>0.5。+:升高且p<0.05;++:升高且p<0.01;+++:升高且p<0.005。
图20 CRC引起细菌相关基因改变
A. 与氨基酸代谢相关的差异KEGG同源基因表达以及通路注释;B. 各细菌代谢通路的KEGG通路。
图21 CRC不同阶段的细菌丰度的动态变化以及诊断学价值
A.基于随机森林以及LASSO-logistic回归的宏基因组和代谢组学混合模型评价S0时期和SIII/IV期CRC患者marker;B.AUC曲线用于评价模型分类的准确性。
Deciphering of microbial community and antibiotic resistance genes in activated sludge reactors under high selective pressure of different antibiotics
实验设计
本研究土壤基于年代序列采集自美国Wise County城市,分别选取恢复6年、12年、22年以及恢复31年的样地作为采样点,以附近未开采的参考林地作为对照。每个采样点均设立三份圆形地块(三个重复,直径10m),控制景观和植被差异。本研究中采集0~10 cm深的土壤,从每个地块挖掘出3个5cm*5cm的土样。然后将这三种土壤样本均匀混合,以便更好地探究地块内的异质性。5个时间序列共获得15和宏基因组土壤样本。
实验结果
(1)分类学和功能基因丰度
图22. 基于物种组成(a)和功能基因组成(b)采用NMDS观察微生物群落的变化。(c)主要种类(相对丰度> 3%)适合基于物种组成的标准;(d)基于功能基因组成,在level 1水平上对主要类别(相对丰度> 1.5%)进行了拟合(时间序列的年龄分别为6、12、22和31:自采样时重新植树以来的年数;UM:附近未开采的土地作为对照)。
(2)高水平上分类学变化的模式
图23 时序序列(相对丰度> 0.5%)中门水平或科水平上(Proteobacteria)的变化(UM:附近未开采的土地作为对照)。•表示FDR < 0.1,*表示FDR < 0.05,**表示FDR < 0.01。
(3)功能变化模式
图24 level 1水平上功能类别随时序年龄的变化(UM:附近未开采的土地作为对照)。•表示FDR < 0.1,*表示FDR < 0.05,**表示FDR < 0.01)。
(4)与氮循环有关的变化
图25 随时序年龄变化的微生物功能群、属和功能基因的变化(UM:附近未开采的地方作为对照)。(a)达标AOB、NOB以及AOB和NOB中主要细菌属在时间序列上的变化(相对丰度> 0.005%)。(b)在时序年龄中参与N循环的主要功能基因(相对丰度> 0.001%)。•表示FDR< 0.1,*表示FDR < 0.05,**表示FDR < 0.01)。
(5)与甲烷循环有关的变化
图26 随时序年龄变化的微生物种类和功能基因的变化(UM:附近未开采的地方作为对照)。(a)在时间序列上主要甲烷营养菌和产甲烷菌(相对丰度> 0.005%)。(b)在时序序列年龄内涉及甲烷和一氧化二氮生产的主要功能基因(相对丰度> 0.001%)。•表示FDR < 0.1,*表示FDR < 0.05,**表示FDR <0.01)。
9、参考文献
[1] Shinichi Yachida, Sayaka Mizutani, Takuji Yamada et al. Metagenomic and metabolomic analyses reveal distinct stage-specific phenotypes of the gut microbiota incolorectal cancer , Nature Medicine, 2019, 25: 968-976.
[2] Renxin Zhao, Jie Feng, Jie Liu et al. Deciphering of microbial community and antibiotic resistance genes in activated sludge reactors under high selective pressure of different antibiotics,Water Research, 2019,151:388-402. |