Will Arnold于2017年8月3日首次发布,2021年4月6日最后更新。
2017年在所有来料质粒中引入NGS对Addgene来说是一个巨大的变化——我们使用Sanger测序进行质量控制已经超过10年。现在,多亏了a赫什家族的慷慨捐赠,我们能够采取更大的所有权这一过程与内部测序!除了测序质粒,我们还开始使用NGS来检查我们提供的其他服务的质量,包括病毒的家庭作业和集中库.
正如任何曾在NGS平台上从事DNA测序工作的人会告诉你的那样,尽管这个过程变得更加精细和友好,但完全拥有这个过程仍然是一项艰巨的任务。首要任务是确保这种转变不会影响我们向有需求的科学家提供高质量数据的能力!
Addgene的新内部NGS流程
首先,这一过程只有通过使用我们的高通量DNA分离过程才能实现,该过程可以产生足够数量的高质量分离DNA样本进行测序。该过程以平板形式完成,每周产生96个样本的2到6个平板。这就是我们新进程的起点。与seqWell合作,我们使用plexWell技术方便快捷地创建Illumina测序库。从开始到完成文库准备过程只需要一天左右,即使是6个板(576个个体质粒)!这些文库随后被QC,汇集,并准备Illumina测序我们新捐赠的MiSeq。
对于完全质粒测序,我们在MiSeq上执行2x251运行,大约需要两天完成。运行完成后,我们开始组装过程。再次,感谢我们的合作伙伴在seqWell我们利用一个管道,每个样本的原始数据池和单独组装读取到一个FASTA序列我们QC的科学家可以很容易地分析(见下文为我们寻找在分析质粒序列)。
与Addgene的所有事情一样,这个新过程的每个部分都涉及大量的QC。首先,我们对每一个分离的质粒样本进行Picogreen定量,并将每个质粒归一化至10倍范围内。不符合这个范围下限的质粒是“失败的”,从培养皿中取出再次进行准备。然后用队列中的其他样本(如用于病毒基因组测序的病毒样本)填充这些洞。QC在整个文库制备过程中进行,包括各种中间步骤的Picogreen定量、大小电泳凝胶和最终文库的qPCR定量。
对整个质粒的更广泛的观察
为了确认质粒的序列,我们检查了三件事:
- 将NGS结果与参考序列对齐,以确定骨干元素。
- 通过比对NCBI条目或使用BLAST确认基因/插入。
- 确认标签和融合蛋白。
我们将在下面详细分析每一个步骤。
调整顺序
在对新沉积质粒进行质量控制时,我们采取的第一步是将NGS结果与一个参考序列(如已知的骨干序列)相匹配。我们并不一定期待一个完美的匹配——我们经常会在复制的起点或其他常见的主干元素中发现一些不匹配。由于我们已经成功地在培养基中培养了质粒,为其测序做准备,我们相信这些微小的不匹配通常不会影响质粒的功能。
确认插入
我们通常确认插入爆炸或直接对准NCBI参考序列或存款人提供的序列。存放实验室通常提供插入序列或注释的Genbank文件,这些文件对更复杂的质粒很有用,比如那些包含合成区域的质粒,它们没有公开的参考序列或含有许多修饰基因的质粒。我们寻找可能危及功能的点突变、截断和插入。当我们发现突变时,我们会检查它们是否会影响转译的氨基酸。我们还证实了该基因的种类与质粒相关的数据相匹配。
确认标签和融合蛋白
最后,我们利用Snapgene检测共同特征,确定启动子、标签、融合蛋白和可选择标记。如果我们发现的信息与沉积实验室提供的数据不同,我们称之为“质量控制(QC)问题”。然后我们询问存放实验室审核差异.如果沉积实验室确认这些差异是预期的,并且不影响质粒功能,我们将更新质粒页面上的信息。
有时我们会丢失一部分质粒
有些质粒的某些区域特别难以测序和组装,包括GC丰富的区域。例如,CAG启动子,一个由CMV增强子、鸡-肌动蛋白启动子和兔-球蛋白剪接受体组成的杂交启动子,包含超过80% GC的序列。一些IRES序列还包含GC丰富的区域。由于NGS从许多较小的序列中组装更大的序列,具有重复序列的区域可能不能正确组装。由于这些问题,一些质粒的NGS不会形成一个完整的环状组装。大多数情况下,这些质粒以一个或两个部分组装的形式返回。如果我们得到一个有用的NGS结果,但不是100%完整的,我们仍然将这些数据作为partial序列标题为“Addgene Partial NGS Result”。在某些情况下,在质粒页面底部的存款人评论部分会有更多关于我们的测序结果的信息。
病毒准备和汇集库
除了常规的质粒测序,你们中的许多人将熟悉我们确保获得高质量、随时可用的病毒制剂和汇集库的努力。
病毒样本被填充到与我们正常的完整质粒测序(CPS)工作流程相同的过程中,并产生足够的数据来捕获整个病毒基因组。该工作流程的完整细节和分析可以在这里找到:从病毒DNA提取液中鉴定重组腺相关病毒制剂的新一代测序和分析平台.
合用库对NGS的QC来说更具挑战性,因为它们在不同的库之间往往有很大的不同。它们与CPS过程的不同之处在于,我们不是对池中的所有质粒进行完全测序,而是对池中质粒的可变部分进行选择性测序,例如CRISPR文库中的gRNA。一般来说,我们的QC科学家与沉淀实验室合作,开发适合该文库的PCR策略。我们将订购能放大文库插入物的引物。这个PCR步骤还添加了Illumina测序所需的适配器序列,以及每个样品的独特条形码,因此我们可以将测序读数分配给正确的样品。然后进行PCR,根据需要进行优化,并使用标准PCR清理试剂盒清除所有模板DNA和引物。
在对该样品进行广泛的QC之后,我们将把它加载到新的MiSeq中,并设置运行,确保为每个样品标注适当的条形码。大约24小时后,我们从仪器中卸下FASTQ数据并开始分析。我们使用的Python程序的修改版本jung等人,2017年,我们希望在不久的将来将其作为OpenBio知识库的一部分提供。呆了!
工具书类
Guerin K,“政府改造”,布尔日D,人我,Haery L, Harten DeMaio K,桑德斯E, Tasissa M, Kostman M, Tillgren M,汉利的马卡拉L,穆勒,Mitsopoulos,风扇M(2020)小说下一代测序和分析平台评估重组腺相关病毒制剂的身份从病毒DNA提取。人类基因治疗31:664-678。https://doi.org/10.1089/hum.2019.277
jyoung J, Konermann S, Gootenberg JS, Abudayyeh OO, Platt RJ, Brigham MD, Sanjana NE, Zhang F(2017)基因组级CRISPR-Cas9敲除和转录激活筛选。Nat协议12:828-863。https://doi.org/10.1038/nprot.2017.016
留下你的评论