通过制作体内和体外的基因编辑及基因人源化鼠模型,可以帮助基础研究者进行基因功能研究,也可以帮助药物开发者进行药效学研究。过去十几年我们主要做这类大小鼠基因编辑模型和细胞基因编辑模型,当然我们的工作还远不局限于此。
罕见病多由单基因突变引起,大多数病人都无药可医,他们只能默默承受甚至早早夭折。近年来随着我国国力增强,罕见病这个不被制药业看重的领域开始受到更多关注,我国也开始制定罕见病的种类名录。近几年西方国家在基因治疗上的突破也使领域迅速升温。这个领域,在小鼠模型上开展研究几乎是不可逾越的第一步,这正好是我们赛业生物的专长。
本世纪初科学家刚刚拿到人类基因组计划的第一个草本的时候异常激动,认为我们很快可以通过解读基因组来攻克人类疾病,随后,一大批基于基因组学的生物制药公司也应运而生。但很快大家发现事情没有这么简单。人类基因组是一本没有太多注释的天书,要解读它还要拿出比完成人类基因组计划大百倍千倍的努力。20年过去了,虽然问题仍然是远远多于答案,但却已经发生了翻天覆地的变化。在全球数以万计的科学家的共同努力下,数以千计的基因病与数以千计的基因之间已经建立起关联,我们对罕见病的发病机理也越来越清楚了,这就给我们下一步对症下药创造了条件。
事实上,我们每个人身上都携一些隐性致病突变,没有一个人的基因是完美的。人群中单个基因上的致病突变大都是小概率事件,因此这些单基因突变导致的疾病往往也是罕见病,但由于罕见病种类繁多,已知的就不下七千种,所以涉及全球的病人总数也达到了3.5亿。这些疾病几乎都是由于基因缺陷所致,现有的治疗手段效果甚微,而在基因层面上去干预有可能在根本上解决问题。
基于二代测序的基因组学和数据共享加速了新的致病基因的发现,基因治疗领域的技术进步和成功案例让我们对罕见病治疗燃起了希望。在这个近些年热起来的新领域,我们赛业有天然优势来伴跑领域的研究者。过去十多年,赛业生物的工作主要是用基因编辑鼠模型和基因编辑细胞模型帮助科学家解读人类基因组这本天书,在这个过程中,我们积累了大量的生物信息及基因编辑方面的数据,在本领域持续的深耕也让我们在基因编辑技术方面一直走在行业前沿,结合赛业生物在人工智能领域的深度探索,相信我们可以给科学家们提供更高效的基因功能解析与基因治疗解决方案。
首先没有大数据,AI就很难有用武之地。随着二代测序技术的普及和数据的全球共享,生物医学研究早已进入大数据时代,但生信分析的手段还相对滞后,比如传统的GWAS在过去20年中虽然中规中举,但并没有给我们带来什么惊喜。相比之下,去年Alphafold2预测蛋白结构给生物界带来了巨大震动,我们已经看到AI全面进军生物界的前兆。
自然界很多东西的特征的所有可能性排列组合可以理解为一个超高维空间的集合,在这个几乎有无限可能性的混沌的超高维空间里,存在着极少数有逻辑的特征,比如在所有氨基酸序列排列组合的可能性中存在着可以折叠成蛋白质的序列,这些序列只有全部序列的10的20次方分之一,而生命需要的蛋白质又是这些可折叠的蛋白质中的极少数,要找到它们如同大海捞针。AI可以对海量但有限的数据进行学习,从而对这个超高维空间的特征形成一种理解,之后AI可以在这个理解的基础上做出预测,指导我们迅速找到我们想要的逻辑。
生命的一个重要特性是突变引入多样性并通过迭代不断适应新环境。基因和蛋白的多样性可以体现在它们在各自的超高维可能性空间中的大量可存活形式,Alphafold2就是在过去50年积累的海量蛋白结构的数据基础上用电脑神经网络建立了基因序列和蛋白结构在两个超高维空间的映射关系,它的应用将是颠覆性的。同样,我们也可以建立基因突变与疾病、蛋白结构与功能、人的基因与小鼠的基因等等之间的映射关系,让AI指导我们去做实验,这样不但可以大大提高效率,节省成本,甚至可以把我们带到以前去不到的远方,比如AI+合成生物学可能找到生物体中不存在但又对我们有用的抗体。
去年我们便组建了生物大数据AI加生信的复合背景团队,团队成员包括生物学家、AI算法工程师、生信工程师和IT人员,我们正在罕见病基因治疗领域建立数据集和算法模型,其中两个方面是我们关注的重点:一个是人类基因突变的致病风险预测以及相应的小鼠疾病模型的设计;另一个是目前作为基因治疗最好载体的AAV病毒衣壳蛋白的设计优化。这个团队将和我们现有的业务团队紧密配合为研究罕见病及开发下游基因治疗的客户提供从突变基因的致病风险评估到小鼠模型制作,到表型分析,到基因治疗方案,到AAV载体设计直至小鼠模型药效验证的全套服务,而AI的引入会大大提高这一进程的准确性和效率,这将是我们的核心竞争力。
我们的客户群中很大一部分是临床研究者,他们经常会接触到各种特殊的临床案例,尤其是家族基因病的案例,在采集病人样本做二代测序和生信分析后数据会给研究人员提示一系列有可能致病的突变,这些研究人员往往找我们做点突变小鼠模型,希望通过在小鼠上做相应的基因突变来模拟人的疾病表型。
由于难以在数百甚至上千个突变中确定哪些突变位点最终导致疾病的发生,在经过繁琐费时的生信分析以及湿实验验证后,研究人员仍需要做多个甚至几十个基因突变小鼠模型对前期预测的致病突变做验证,然后对这些小鼠进行表型分析,进一步确定哪些突变会导致小鼠出现人类基因突变后的症状。
由于现有的研究手段难以对大量突变位点做精准的分析,研究人员做的大量的点突变小鼠往往看不到表型,这造成了极大的资源浪费和时间浪费。所以对于这样的客户,我们都建议由我们来为他们做一个数据分析,对他们手里的一系列基因突变位点进行风险评估并根据风险程度高低排序,这样可以大幅度节省科研经费,缩短研究时长。
目前我们的方法主要是在现有数据基础上结合机器学习和深度学习训练各种模型,对基因突变做各个层面的分析。我们对疾病类型、受影响的蛋白结构、组织类型、突变位置等进行分类评估,充分考虑各种因素,并考虑之前可能被忽略的因素,这样可以大大提高命中率。要考虑突变影响的是结构性蛋白还是功能性蛋白,突变对蛋白质折叠的影响,对RNA剪接的影响等等。我们用先验性的知识对模型进行训练,并且不断改进和丰富模型,以达到业内最高水平。我们计划于今年年底以数据库形式开放给全球研究人员使用。
我们盘点了过往这些年做过的小鼠模型,其中数以百计的模型是和罕见病相关的。但现在我们会把工作做得更细致。我们调查了很多国内外的基因治疗研究,第一步无一例外的是获得合适的小鼠模型。首先我们要了解客户需求,客户要解决什么问题,有多少成分是做科研,有多少成分是做转化,我们会对症下药建议一个最佳的研究路径。比如dystrophin的突变会引起DMD或BMD,但已知的致病突变就有三千多个了,未知的可能更多。可以做一个简单的dystrophin敲除小鼠,也可以做模仿发病突变的点突变小鼠,模型的制作方法也可以多种多样,这些都可以根据治疗方案来确定。dystrophin这条基因太大了,但我们可以把一个小型化的micro-dystrophin用AAV带进体内,也可以用CRISPR或者单碱基编辑器去修正致病突变,或者用反义寡核苷酸来造成致病外显子的跳跃,不同的方案需要不同的模型。
设计包装AAV并在小鼠上做实验是我们一直在做的事情。最近我们开始做AAV的AI辅助定向进化。AAV的不同血清型及突变有不同特性,比如包装效率、组织特异性、免疫逃逸等等。我们通过合成突变库的方法去获得多样性的AAV,并进行体内和体外的实验以获得大量数据,再用这些数据去训练我们的机器学习或深度学习模型,并用这些模型去做我们需要的AAV衣壳蛋白的序列预测。这样的平台非常强大,能够使AAV优化的效率有数量级的提高,并找到传统理性设计和定向进化找不到的更优序列。我们认为制药业的一个大趋势就是AI+合成生物学,一场革命已经悄悄兴起了。
目前基因治疗体外主要用的是慢病毒,体内主要用的是AAV,做到临床阶段最多的还是用AAV把表达缺失或缺陷蛋白的基因带到体内。AAV+CRISPR或者单碱基编辑器还大多停留在动物实验阶段。我们还通过跟业内优秀的合作单位建立战略伙伴关系来利用最有效的基因编辑器来达到修复基因的目的,这项工作目前正在进行。
是的,我们的一些客户是希望能上临床的。如果在小鼠上的实验结果满意,下一步可以在大动物上做药效和安全性评价,这也是我们希望看到的。因为治病救人是我们和客户的最终目的。我们的合作伙伴中也有可以生产GMP级别AAV的公司,我们也欢迎我们的临床客户开展研究者发起的临床研究。
有人说人类改变自身的基因是动了上帝的奶酪。确实如此,人类已从改造自然发展到改造自我,我认为基因治疗只要不涉及生殖遗传,就没有什么可担忧的。目前的科学发展已经具备了基因治疗的各种要素。时不我待,对于罕见病患者、面对罕见病患者而束手无策的临床医生和从事罕见病研究的科学家来说,这扇大门打开得已经太迟了,但一旦打开,后面会一片光明。
参与有奖调查问卷,助力遗传疾病研究:https://www.wjx.cn/vm/rXnOdxR.aspx
同步采访已上传至腾讯视频,链接:https://v.qq.com/x/page/w3256hdbxmz.html
赛业生物科技董事长
清华珠三角研究院人工智能创新中心主任
国家重大人才工程入选者
韩蓝青先生本科毕业于清华大学,后获得加拿大麦吉尔大学工程硕士和加拿大女王大学工商管理硕士,并于麻省理工学院研修,曾任职三洋电器和阿尔卡特等公司。2006年韩蓝青回国创立了赛业生物科技并任董事长至今。公司专业从事基因工程模式动物、细胞生物学产品及服务等前沿技术的研究开发。在韩蓝青先生的带领下,赛业生物已成为知名的基于模式动物的国际化创新性CRO公司。
2017年韩蓝青先生受聘于清华珠三角研究院任人工智能创新中心主任,承担过多个国家和省市级科研项目,深入探究AI在生物医学领域的应用。韩蓝青带领的团队已经在专业顶级学术刊物发表数篇重要文献,获得大量发明专利。
赛业生物科技集团是一家基于模式动物药物研发的国际化创新性CRO平台。依托于品系丰富的基因编辑小鼠资源库、高效且智能化的模式动物定制平台、药物筛选评价小鼠模型平台、一站式小动物表型分析平台、一站式无菌鼠技术服务平台及先进的细胞技术服务平台,建立了多位一体的创新性CRO平台服务网络,以服务于肿瘤、免疫、代谢、内分泌、心血管、神经及传染病等方向的科学研究及药物研发筛选,并与全球100多个国家和地区的数万名科学家及企事业单位建立了广泛的合作,产品与技术已直接应用于包括CNS(Cell, Nature, Science)三大期刊在内的5200余篇学术论文。