宏基因组测序分析服务

宏基因组学研究不要求对每个微生物进行分离纯化培养,而是直接从样品中提取基因组DNA后进行测序分析。通过宏基因组测序,能够解释微生物群落多样性、种群结构、进化关系、功能活性及环境之间的相互协作关系,极大地扩展了微生物学研究范围。

宏基因组学概述

宏基因组学既指研究技术又指研究领域。宏基因组学,该领域可以定义为来自环境群落的微生物DNA的基因组分析。宏基因组学工具可以对不可培养或以前未知的微生物进行种群分析。这很重要,因为在实验室中只能培养1-2%的细菌(1)。在没有先验知识样本的情况下识别微生物的能力为微生物生态学,病毒学,微生物学,环境科学和生物医学研究等学科打开了新的大门。基于测序的宏基因组检测已成为产生新假设的有力工具。

宏基因组测序工作流程

基于测序的宏基因组学项目涉及几个步骤。这些包括DNA提取,文库制备,测序,装配,注释和统计分析。

样品提取

从微生物群落中提取DNA的可重复方法对于测量和全基因组宏基因组分析至关重要。分离和提取必须产生高质量的核酸用于随后的文库制备和测序。采样变化会对比较和丰度测量产生影响。这引入了一些挑战,因为一些样品必须在厌氧条件下输送。暴露于氧气或冷冻可改变给定微生物群落的动态组成。例如,冷冻,解冻和随后的珠击可以影响革兰氏阳性细菌的细胞壁,并且与在新鲜样品上进行的提取相比引入假象。

经常用于从环境样品中提取DNA的试剂盒包括:

  • MoBIO DNA提取试剂盒
  • Qiagen DNA Microbiome Kit
  • 用于水的Epicenter Metagenomic DNA Isolation Kit
  • Epicenter Meta-G-Nome DNA分离试剂盒

如果目标群落与宿主例如人或植物相关,则可以采用物理分级分离或选择性裂解来确保宿主DNA保持最小。在生物信息学过滤和绘图过程中也可以去除宿主材料。无论采用何种方法,重要的是要记住提取和分离方法会在微生物多样性,产量和片段长度方面引入偏差。强烈建议在比较样品时使用完全相同的提取方法。

图书馆准备

用于鸟枪宏基因组测序的环境样品的文库制备的最大考虑因素之一与扩增有关。某些类型的样品(水,拭子)产生少量DNA,在文库制备过程中需要扩增。通过PCR扩增可以过度扩增某些片段而不是其他混杂的丰度和微生物多样性测量。当面对低输入DNA时,用户通常没有选择。最小化可变性,将库一起构建以减少批次效应并使样品之间的文库制备步骤尽可能一致是良好的做法。如果您能够提取足够的DNA材料(~250 – 500 ng),建议使用无扩增的文库制备方法。以下文库制备试剂盒经常用于宏基因组文库制备:

  • Bioo Scientific NEXTflex无PCR DNA测序试剂盒
  • Illumina TruSeq无PCR文库制备试剂盒
  • Kapa Hyper Prep Kit

测序

南博屹生物宏基因组测序是独特的,因为您正在尝试对大量不同的微生物进行测序,每个微生物具有不同的基因组大小,通常与宿主DNA混合。目前的测序技术提供各种读取长度和输出。Illumina测序技术提供短读数,2×250或2×300 bp,但产生高测序深度。较长的读数是优选的,因为它们在组装期间克服短的重叠群和其他困难。然而,提供更长读取的仪器,例如PacBio和Oxford Nanopore,伴随着更高的错误率,更低的测序深度和更高的成本。使用循环共识测序(CCS)可以降低PacBio错误率,该测序涉及环状模板的重复测序和DNA插入物共有序列的产生。可生成高质量500-4000 bp,Q20精度> 99%。

不考虑成本并简单评估长PacBio读数与短Illumina读数,使用PacBio读取您可以预期改进的宏基因组装配统计和难以组装的表型的基因组合并。PacBio测序推荐用于分离株,或者当您只想检查几种丰富的生物时。在宏基因组学研究中推荐Illumina读数,其中稀有和丰富细胞之间的差异是显着的。许多现场使用的妥协Illumina和PacBio读取。使用PacBio CCS和HiSeq contigs的混合组件可改善装配统计数据,重叠群数量和总重叠群长度。通过组合两种读数(PacBio和Illumina),您获得完整染色体闭合的概率更高。罕见的微生物物种仍然必须依靠高深度的Illumina测序来进行适当的组装。

部件

装配涉及将来自相同基因组的读段合并成单个连续序列(重叠群)。大多数可用的工具建立在基因组装配的传统de Brujin图方法之上。组装的最大挑战之一是嵌合体的产生,其中来自不同基因组或基因组部分的两个序列由于相似的序列组成而错误地合并。这通常通过执行分箱步骤,将每个宏基因组序列分配给分类组然后独立地组装每个分箱来减轻。这有助于降低数据复杂性和嵌合体的可能性。

注解

组装后,可以预测基因和功能注释。基因通常以三种方式之一预测:1)从头基因预测,2)蛋白质家族分类,3)片段募集(分组)。通过使用序列或隐马尔可夫模型(HMM)数据库将预测的宏基因组蛋白分类为蛋白质家族来进行功能注释。经常使用的功能注释序列数据库包括:

  • SEED
  • KEGG
  • MetaCyc
  • EggNOG

用于宏基因组学分析的HMM数据库通常限于使用HMM来模拟蛋白质结构域的Pfam。

详情电询:400-080-3779

Posted in 高通量测序 and tagged .

发表评论

电子邮件地址不会被公开。 必填项已用*标注