18102225074(同微信) market@edgene.cn

【前沿资讯】免费开源!首个AI基因编辑器,已成功编辑人类基因组

2024423日,AI蛋白质设计初创公司Profluent Bio联合创始人兼首席执行官Ali Madani团队在bioRxi预印版上发表了一篇题为“Design of highly functional genome editors by modeling the universe of CRISPR-Cas sequences”的论文,研究展示了语言模型可以成功生成多样化的CRISPR-Cas蛋白,并证明它们可以在人类细胞中作为功能基因编辑器组装。这是首次通过完全由机器学习设计的蛋白成功编辑人类基因组,并发布了世界上第一个开源AI基因编辑器——OpenCRISPR-1工作原理与 CRISPR-Cas9 类似,但具有 400 多个突变,并且脱靶编辑减少了 95%,从而提高了其精确度。


这篇文章中,研究人员使用了人工智能(AI)技术,特别是大型语言模型(LLMs),来设计一种新的基因编辑工具OpenCRISPR-1。以下是他们设计OpenCRISPR-1的主要步骤:

1. 数据集构建:研究人员通过系统地挖掘26万亿字节的组装基因组和宏基因组数据,构建了一个包含超过一百万个CRISPR操作子的数据集,这个数据集被称为CRISPR-Cas Atlas

2. AI模型训练:研究人员使用数据集训练AI模型,以生成新的CRISPR-Cas蛋白序列。


1  CRISPR-Cas系统设计的语言建模方法概述

3. 序列生成:通过微调AI模型,研究人员生成了四百万序列,其中一半是直接从模型生成的,另一半是通过使用自然蛋白的N端或C端序列作为提示来引导生成特定家族的序列。

4. 序列筛选:所有生成的序列都根据一系列BLASTHMM比对标准进行了筛选,以去除退化序列。

2  生成的蛋白家族在不同CRISPR-Cas系统类型中的频率

5. 结构预测:研究人员使用AlphaFold2对生成的序列进行了结构预测,以确保它们能够采用与自然蛋白相似的折叠结构。


3  Cas9样蛋白的预测结构

6. 功能评估:研究人员在人类细胞中对生成的Cas9样蛋白进行了功能评估,以确定它们是否能够作为基因编辑工具。

4  对合成的Cas酶进行编辑效率、脱靶编辑效率特异性比较等功能评估

7. 特异性编辑:研究人员特别关注了与SpCas9(一种广泛使用的CRISPR-Cas效应蛋白)兼容的序列,以便于在相同的基因组靶标上直接比较蛋白质活性。

8. OpenCRISPR-1的选定:在一系列实验和评估之后,研究人员确定了一种名为PF-CAS-182的蛋白,它在活性和特异性方面与SpCas9相当,但在序列上与之有显著差异。这个蛋白被命名为OpenCRISPR-1,并公开发布,以促进其在研究和商业应用中的广泛使用。

9. 进一步的实验验证:研究人员还对OpenCRISPR-1进行了额外的实验验证,包括测试其在不同PAM序列上的活性,以及将其转化为底编辑系统的能力。

5  OpenCRISPR-1蛋白编辑效率、相对活性比较和不同靶位点的编辑效率比较

CRISPR基因编辑已经有彻底改变医学领域的潜力,而将人工智能添加到其中将其提升到一个全新的水平。Ali Madani等人的研究是AI在生物技术领域应用的一个突破,为未来的基因编辑技术发展提供了新的可能性,OpenCRISPR-1只是冰山一角,未来AICRISPR的结合将会更加紧密,让我们拭目以待吧。

参考链接:https://www.profluent.bio


  • 艾迪基因专注CRISPR领域多年,依托上千例CRO基因编辑项目,优化升级Cas9蛋白,已为全球各高校与研究所提供高质量的CRISPR文库筛选、基因点突变、基因敲除、基因敲入等基因编辑CRO服务


近期资讯:

【本月之星】人表观遗传基因敲除文库、鼠全基因组敲除文库、人全基因组激活文库

【文献解读】利用工程化crRNA提高LbuCas13a检测灵敏度

CRISPR文库筛选进阶指南!七大实验要点在这里!


联系我们

18102225074(微信同号)

market@edgene.cn