这篇帖子由Guest Blogger Cameron MacPherson在Institut Pasteur贡献
CRISPR软件和piñata效应
两年前,我是团队的一部分(巴黎巴斯德研究所寄主-寄主相互作用生物学)改变了在疟疾社区中的基因组编辑更好(生物科技Nat。》。, 2014年).考虑到现在的时机,这也不足为奇CRISPR这涉及到一个系统。今天,同一个实验室在编辑人类基因组的工作中获得了超过90%的成功编辑率疟原虫疟原虫(引起疟疾的寄生虫)。我把他们的成功归功于专业的技术、周到的服务单导RNA (sgRNA)设计,气相色谱含量异常低疟原虫疟原虫基因组。从长远来看,最后一点是疟原虫疟原虫基因组仅包含66万个NGG PAM靶点,而人类基因组约有3亿个。有了这样一个稀少的目标基因,非靶向性就不那么令人担忧,而靶向性可能更有效。
如果没有计算支持,就很难理解这些见解。事实上,如果没有某种预先的分析,理性的sgRNA设计是不可能的。2014年底,我开始开发软件,让sgRNA的设计可以被所有人使用。当时我认为还有改进的空间,一年后我发现其他人也有同样的想法。自2013年1月以来,已经有33个CRISPR软件工具被发布和记录OMICtools.对于一个新手来说,决定使用正确的软件一定很困惑。有这么多的选择,我的问题是,我们一开始是怎么走到这一步的?
CRISPR创新是如何影响软件开发的
CRISPR,就像之前的miRNA泡沫一样,提供了一个有趣的观点,来了解创新是如何快速影响研究团体的。我把它比作围绕piñata的庆祝活动。从创建piñata的人的角度来看,他们的角色是用有价值的东西填充道具。他们是内容评论者。相反,“piñata”的目标却截然不同。他们心中充满了盲目的期待。他们对内容质量的信任隐含地由他们对piñata构建者——评论者的信任来定义。参加聚会的人经过一番努力,“piñata”突然爆裂,里面的东西掉落在地上。当人群试图衡量和确定散落在地板上的每一个糖果或玩具的价值时,这有点像一种疯狂。最后,一切都尘埃落定,每个项目的价值也从评论者煞费苦心的评估变成了更能代表社区意见的东西。 The trouble is, with so much choice, in those few moments after the pin突然间,价值被主观地归因于相对于每个人的基本需求;整个社区还没有确定任何真正的价值。我把这种现象称为“Piñata效应”,它指的是评论piñata内容的人和盲目接受它们的观众之间产生的脱节;它会导致高度相似的内容和迭代设计的缺失;这是因为没有时间评估公众的反应;我认为这是我们目前在CRISPR软件领域所处的阶段。CRISPR研究团体还没有机会就最好的CRISPR软件工具达成共识。
作为一种基因组编辑工具,CRISPR/Cas9技术自2012年问世以来一直被研究活动和开发的旋风包围。那只是三四年前的事了。这是一个创新的泡沫(piñata),软件开发已经赶上了它。同行评审过程受到了许多间隔很短的CRISPR软件提交的挑战。由于之前很少有文章发表,一份提交的手稿只能被视为一个显著的改进。结果,软件piñata充斥着一个主题的细微变化,却没有很多资源来审查它们。总的来说,CRISPR软件池包含了促进CRISPR工程中大多数实验性应用的解决方案。与集合实用程序相比,它很容易因为单个应用程序缺少特性而出错。那么问题是,我们是否应该将所有工具都当成一种元/科学怪人应用?或者有一个明显的赢家,有没有什么东西我们可以投入我们的时间去学习和提取最大的价值? This is only one of many decisions faced by those engaging in CRISPR design, but it is a significant hurdle made worse by an ever increasing marketplace. Since 2013 about 11 tools have been added every year.
打破障碍:我对当前sgRNA设计工具的看法
这篇文章的目的是提供一些关于可用CRISPR软件工具的见解,各种工具试图解决什么问题,以及我们未来可能如何进行。当我们考虑使用CRISPR设计实验时,有两个主要方面软件可以提供帮助。最重要的是处理sgRNA的设计,并代表了当前可用工具的最大份额(我们将在这篇博客文章中重点讨论这些工具)。第二个主要领域涉及实验后的质量控制,一个很好的例子是CRISPR-GA.这些工具按类型评估修复事件(NHEJ/HDR)和轨道在一个轨迹处,通常是目标网站。需要多基因座评估来完全评估偏离目标,但目前没有为此目的设计软件。第二个区域非常重要,凭借它缺乏关注,这是一个很明显的地方,可以关注进一步发展。然而,质量控制不是这个博客文章的重点。
我将sgRNA设计工具分为数据库和新创解决方案。数据库工具允许我们查看和了解sgRNA的设计以前是在什么条件下工作的。这些资源对于自动化的理性设计可能是非常有价值的。这是仅有的三个数据库中的第一个,EENdb(发表于2013年1月1日),是sgRNA设计报告的简单目录。第二个数据库,克里斯伯格(2015年6月27日发布),对其广泛的范围,策划内容和易于访问来值得注意。第三,w(发表于2015年9月15日),与CrisprGE相比,它更类似于EENdb,但它也是一个使用数据库工具辅助设计的好例子。这些数据库还很年轻,需要社区的通力合作才能成功。
关于新创SGRNA设计,我再次将其分为两类。一方面,我们有软件工具,应用一些近似或明智的规则来确定一个SGRNA设计的值。另一方面,一些软件工具利用经验派生的和/或先前的知识来告知确定良好SGRNA设计的质量。顺便提一下,SGRNA设计的第一个软件(通过徐等,2013)采用了经验和近似方法相结合的方法。他们的评分功能的细节可以在他们的在线工具中找到文档.自Hsu等人,2013年以来,其他工具已经纳入了新的参数,如Doench-Root评分(byDoench等人,2014年)进入他们的得分函数。许多工具还选择混合和匹配不同的评分算法和参数。正是这些想法让选择正确的工具变得令人困惑,这意味着没有放之四海而皆准的方法。你必须根据你的项目而不是一般的观点来选择工具。
我可以花很多时间来详细介绍每个工具,但是已经发表的文章已经介绍过了。相反,我将工具分解成使每个工具独一无二的独立功能。的CRISPR软件媒人由这些功能组成,并使您可以根据项目需求选择该工具。表中发现了8个主要类别,描述了从基本到高级功能的所有内容以及用户如何与工具交互(可以在上面找到表格截图和表的概述)。下面进一步讨论这些类别(表中也可以提供所有术语的定义):
- 基本功能:这些功能体现了该软件的主要目标,应该是您首先要确定工具适用性的地方。此类别的功能是工具之间最常见的。例子:“单目标设计”、“多目标设计”、“脱靶意识”、“高失配限”、“近似设计”、“经验设计”、“单pam设计”、“多pam设计”。趋势到2014年底,工具开始远离专为NGG PAM目标设计,开始允许任意PAM定义。这些更新的工具对于靶向Cas蛋白的最新NTT仍然有一定的用处,Cpf1.另外,目标上的效能仍然是一个只有少数工具试图解决的概念。
- 先进的功能根据设计目标,这些功能并非完全必要,但应该被认为是非常有用的。例子:“特征感知”、“SNP感知”、“二级结构感知”和“微同源感知”。趋势:使用高级功能发布的工具越来越少,似乎这些功能已委托给其他更合适的软件,如猿类或商业工作台等MacVector或Benchling.
- 效用函数:这些功能有助于加快sgRNA的设计过程,通过消除重复任务和/或提供功能,以帮助设计后的过程,如引物和质粒设计。例子:“多路复用设计”,“多方法设计”和“单方法设计”。趋势:最常见的实用功能是批量设计或多重功能。然而,辅助底漆设计的工具越来越普遍。
- 用户交互:属于这一类的软件设计元素描述了期望用户如何与软件交互。对于希望根据自己操作计算机的舒适程度来选择工具的用户来说,这一类别很重要。例子:“offline”、“online”、“CLI”和“GUI”。趋势:在线工具主导了软件空间,但通常依赖于更强大的算法来检测偏离目标。少数脱机工具主要在任何计算机上工作,但通常需要命令行或脚本的工作知识。
- 输入的灵活性:软件工具需要某种类型的数据输入才能产生结果。虽然不同类型的输入比其他类型更容易使用,但这并不像数据输出那么重要,因为不同类型的输入可以很容易地转换。例子:“有机体”,“序列”,“标识符”和“负载”。趋势:基于序列的输入是目前最常见的,大多数工具也要求用户指定一个有机体。
- 输出的多样性:不同的工具以不同的格式向用户提供结果。这可能对下游结果产生很大影响。例子:“HTML”、“visual track”、“plot”、“tabular”、“interactive”和“save”。趋势:大多数工具提供表格式HTML格式的输出。令人惊讶的是,只有2个工具提供FASTA输出。一些值得注意的工具允许用户保存结果并在稍后返回或共享它们。
- 社区排他性不同的社区根据自己的需要开发软件。这通常导致软件设计只适用于一个或一个有机体的子集。在少数情况下,软件是有机体不可知论的。大多数工具都是生物体的一个或一个子集所独有的。例子:“有机体不可知论”、“模式有机体”、“小基因组”、“大基因组”、“有机体偏差评分”。趋势许多工具可以处理任何大小的基因组,只是作者添加一个基因组所需的时间有限。有机体不可知论的工具是更好的解决方案,但通常打包为离线工具,需要一种或另一种编程语言的专业知识。
- 支持的生物:本节列出了每个工具支持的基因组。基因组用生物体名称和基因组组装版本表示。表格中的名称与软件中的名称相同。大多数sgRNA设计工具要求用户指定一种生物。它们之所以这样做,是因为它们依赖于预先构建的索引或数据库,以便尽快找到并向您展示结果。有些工具不需要特定的有机体,它们是真正的有机体不可知论者。其他工具需要指定一个有机体,但也允许你建立自己的数据库;这些工具将被标记为生物不可知论者,并在本节中列出了当前可用的生物。
CRISPR软件为特定用户提供建议
您会发现,一些工具通过开发的算法或专注于特定生物的方式来满足特定的使用情况。因此,我一般建议已经尝试过几个Crisp实验的实验室评估他们对每个工具建议的设计的设计感兴趣的每个工具的预测力。对于第一次进入SGRNA设计的人来说,最好选择基于即时需求的工具,并在几个实验后重新评估。或者,上面提到的数据库或者甚至更好地从相同生物中使用Crispr的实验室更好的第一手知识可以用作最后一种方法的代理。
新手的首选工具:您需要学习语言和参数表示的内容。最好的边做边学工具是E-CRISP.作者们付出了巨大的努力,使他们的工具既具有说教性又具有功能性。这也是我遇到的唯一一种工具,可以根据正在进行的CRISPR实验类型提供各种参数。你还应该看看术语表部分CRISPR软件媒人,它提供了一个术语列表,我认为为CRISPR软件空间定义很重要。您不太可能在其他任何地方找到这些条款,因为我为这篇文章开发了它们,但他们应该让您了解要留意的内容。
生物信息学家的顶级工具:在您自己的分析中灵活性,您需要访问原始数据,目标站点,偏离目标站点,分数和进入计算它们的统计数据。为此,一些在线工具如中科院就足够了。Cas-OFFinder提供了基因组中所有字符串的基本数据转储,使用任何IUPAC编码模式,在任何编辑距离。但是,它不会计算除编辑距离以外的任何分数。添加的功能由您来实现。您也可以下载该软件在任何机器上使用OpenCL启用硬件.这种对OpenCL的依赖是一个严重的限制,但这个工具足够快,如果你从事繁重的CRISPR设计(我说的是屏幕和/或非常大的基因组),那么值得买一台专用的机器。在脱机前端,有一个Python脚本名为SSFinder,但我发现它的实现速度太慢,不适合实际使用。基于R的包CRISPRseek提供良好的实用程序,并加上生物导体应该是任何已经熟悉R的人的首选。对于Java爱好者来说,看看SGRNACAS9..
将CRISPR技术转移到新生物的顶级工具出于显而易见的原因,你可以排除任何限制你的特定基因组子集的工具。这些是大部分的工具,但好消息是您只需要一个。protospacerwb.是为了将CRISPR技术应用于新的有机体而开发的,无论你是否拥有完整的组装,它都会帮助你。它是一个离线工具,但带有图形用户界面。
实验室的最佳策略:在购买之前,定义你需要这个软件工具做什么。使用CRISPR软件媒人根据您的需要选择最佳的工具。完善你的标准。重复,直到找到最好的工具。做几个实验,并使用结果来重新评估所有工具。报告你的发现以帮助其他人。
CRISPR技术已经达成了如此多的不同社区,即公正地判断个人工具是全部但不可能的。我相信这次只能客观地将工具分解为个人产品,并允许您根据您的需求选择它们。我们可能会开始看到具有越来越多的功能的可用工具的收缩集成到所谓的基因组编辑工作台等中Benchling(商业、在线)DESKGEN(商业、在线),或protospacerwb.(学术、离线)。虽然还有待观察,但我相信CRISPR软件的未来是光明的。这个领域的快速创新让我们处于一个有利的位置,可以退后一步,挑选出真正会对我们的实验和生活产生影响的功能。为了有效地做到这一点,开发人员和最终用户之间需要有良好的沟通。
感谢我们的客座博主Cameron MacPherson!
Cameron R. Macpherson是MilieuIntérieur项目的牵头数据科学家,巴黎斯特雷斯特州的MilieuIntérieur项目。你可以在推特上跟着他@CMacPhD.
工具书类
1.Ghorbal, Mehdi等。“使用CRISPR-Cas9系统对人类疟疾寄生虫恶性疟原虫的基因组编辑。”自然生物技术(2014)。PubMedPMID:24880488.
2.徐志强,张志强,等。rna引导Cas9核酸酶的DNA靶向特异性自然生物技术31.9(2013): 827 - 832。PubMedPMID:23873081..公共医学中心PMCID:PMC3969858.
3.杜恩奇等。“用于crispr - cas9介导的基因失活的高活性sgrna的合理设计”。自然生物技术(2014)。PubMedPMID:25184501.公共医学中心PMCID: PMC4262738.
资源Addgene
得到的建议如何设计gRNA
读我们CRISPR指南赶上所有的CRISPR基础知识
阅读其他关于CRISPR的博客帖子
发现验证gRNAs
主题:CRISPR,其他CRISPR工具
发表评论