作者:电子创新网张国斌
回顾人类的发展史,就是一部与疾病对抗的斗争史。
公元前430年,一场瘟疫席卷古希腊,夺走了1/4希腊城邦人的生命;公元165-180年,欧洲爆发安东尼瘟疫,死亡超过500万人,这场持续15年的瘟疫也终结了罗马帝国持续约两个世纪的顶峰时期;公元700~1050年间是日本史上的“瘟疫时代”;公元846年,在入侵法国的诺曼人中间爆发天花,诺曼人杀死了所有的病人和看护病人的人;公元1347~1351年,中世纪的西欧蔓延黑死病,许多地方1/3到1/2的人口都没有了;14世纪欧洲殖民主义者把传染病带到美洲,扫掉了美洲土著90%的人口,由此引起了大规模黑奴的贩卖;公元1555年,墨西哥天花大流行,200万人不治而亡。
在对抗疾病的战斗中,药物发挥了巨大的作用。
因此,每找到一方对症的新药人类就赢得了一次对疾病的斗争!
但是,新药的找寻和研究从来都是极其艰难和凶险的,中国古有神农氏尝百草寻药,但最后却被断肠草毒杀。
到了近代,随着对药物的研究深入到分子层级,加上计算机的辅助,新药研制加速,但是平均下来仍然需要15年左右的时间以及20亿美元的投入。但即便这样的投入也只有10%的新药研发成功。
另外,随着疾病日益复杂,新药的研发更加困难,就拿2020年的新冠疫情来说,全球各国医疗机构投入巨资研究至今仍然没有研发出特效药,导致新冠病毒不断变异,肆虐全球。
新药研发进入算力时代
不过,我们也看到,随着人工智能技术的普及以及数据处理能力的提升,加上分子动力学,蛋白质组学等新理论的普及,新药的研发进入算力时代,只要算力不断提升,从理论上说我们是可以完全战胜各种疾病的。
目前,在治疗重症疾病如癌症等,靶向治疗成为一个突破方向,发现治疗或预防疾病的最佳靶点是治愈的关键,靶点往往是患者体内与疾病有关的蛋白质或致病微生物中的蛋白质。
靶向治疗是一种新型的治疗方法,是在细胞分子的水平上,针对已经确定的致癌位点进行治疗的方式。这个致癌位点既可以是肿瘤细胞的蛋白分子,也可以是某个基因片段,也称为靶向药物靶点。靶向治疗通过设计相应的药物,药物进入人体后会特异地选择致癌位点来产生作用,使肿瘤细胞死亡,但是肿瘤细胞周围的正常细胞组织不会受到伤害。
“跟以前的放疗化疗相比,靶向治疗就类似于作战中的精准打击,以前是地毯式轰炸把好的细胞也给消灭了,现在的靶向治疗可以对病灶点进行精准治疗。“雪湖科技生命科学计算首席科学家盛楠指出,”我们在电影《我不是药神》中提到都治疗慢性白血病的格列宁,其实名字叫格列卫,其在慢性粒细胞性白血病治疗有效率超过 94%,急变期有效率也能达到31%,患者存活率从2001年的30%上升到了2018年的85%,长期跟踪结果显示,如果用药2年后检测不到癌细胞的话,患者往后8年的生存率为95.2%,死亡的4.8%多数与癌症无关,可以说已经完全治愈了这个病。”
他指出目前人类与疾病的斗争已经进入到算力的时代,需要更强算力与这些病毒进行抗争,从药物研发流程看,从整个药物发现和新药研发流程中,计算占的比重还是比较大的。特别是在中间:靶点发现,化合物发现,以及先导化合物优化方面。
“但是新药研发却并不是如此简单,走完整个流程就可以了。一款新药走到临床前,临床,最终到FDA,批准上市,研发的成功率其实是很低的,不到10%。那么怎么样去高效的提高药物发现成功率,就是我们前面药物发现阶段的关键。”他指出,“为什么药物发现的成功率如此之低?我们可以看到大部分是在临床的时候就失败了。另一篇文章统计了新药在临床失败的主要原因:主要是药效和安全问题。这边是临床二期的失败原因,我们可以看到,将近一半,48%的是药效问题。而排名第二,占25%的就是药效安全问题。这边是临床三期,新药研发临床失败的统计比例。超过一半,55%的是药效问题。排名第二的,仍然是药物的安全问题。”
他表示在发现一个有药效的化合物后,需要对化合物进行优化。例如下图上这个X,虽然药效不错,但溶解度、安全性、人体吸收、化学稳定性不合要求,就需要对化合物进行优化,达到药效 、安全、溶解度、化学稳定性都能兼顾的先导化合物。
“这些都要通过高性能计算,然而,分子动力学计算消耗算力巨大,例如对新冠病毒表面一个刺突蛋白的动态结构变化,需要对100万个原子之间的相互作用计算10亿次。要完成这一模拟,一台传统CPU服务器需耗时8年。因此往往需要大型超级计算机才能承担。”他指出。
如果没有对药物的药效跟安全问题做如此严苛的筛选?可能会导致严重的后果,一个真实的案例是在上世纪60年代发生过叫反应停事件--这是德国研制的一款药物,其实药物分子就是跟上图中中间显示的一样--中间显示的这个化学式,从化学式角度上来看,这两个分子几乎是完全一样的。但实际上却如同我们的左手跟右手一样,这两个分子被称为手性分子,当时的条件在在生产药物的过程中,无法将这两种分子区分开来。虽然两个手形状一样,元素一样,整个分子结构也一样,但是它毕竟是一个在空间立体结构中不一样的分子。左边的分子其实是药物原本想要产生药效的一个分子构型--能够缓解孕妇的妊娠反应,可以说是孕妇的一个福音。但右边的这个分子却具有一个强烈的致畸作用,导致产生了大量的畸形婴儿,有上万的婴儿受到了药物影响。所以,药效以及安全性必须严格筛选。
分子动力学显山露水
盛楠表示在新药研中,经常用的是分子动力学模拟,奥司他韦就是计算出来的靶向药,通过基于分子结构的药物设计,从研发到上市,仅用了7年时间!
分子动力学是一套分子模拟方法,该方法主要是依靠牛顿力学来模拟分子体系的运动,以在由分子体系的不同状态构成的系统中抽取样本,从而计算体系的构型积分,并以构型积分的结果为基础进一步计算体系的热力学量和其他宏观性质。
按照盛楠的说法,分子动力学让“死靶”变成了“活靶”,将将原理静止的结构动态化了,大幅度提高了研发成功率。
这是一个基于基于蛋白质运动行为差异研发的抗癌新药,从下图可以看出,如果看静态的分子结构,左边1号和右边2号是基本一样的,但是从动态来看,左边蛋白质分子运动频率要高于右边的,可以从它们的差异化之处找到和药物 结合的最佳方法。
这就是通过分子动力学模拟发现其中的结构变化细节的案例,与实验技术相比,模拟技术在预测生物体系行为现象以及深入研究现象背后所蕴含的机理方面更具优势。
不过分子动力学计算需要算力巨大,也只有超级计算机才能承担,美国DEShaw研制了分子动力学专用超算ANTON2,搭载了分子动力学专用计算架构的ASIC,也只能对百万原子体系每天能够计算9.5微秒的运动轨迹。这台机器服务于Relay医药,为Relay医药提供算力支持,基于蛋白动态行为研发抗癌新药。在新冠疫情爆发之后,这台机器快速反应,公开了大量新冠病毒的分子动力学计算数据。
盛楠表示由于FPGA在并行计算上有天然的优势,因此,雪湖科技基于赛灵思Alveo数据加速卡,设计开发了分子动力学专用计算架构。在一颗FPGA芯片上实现了完整分子动力学计算过程。
“我们的专用计算架构采用了可变精度和自适应等技术,并且我们是基于公式直接进行架构设计,针对FPGA专门优化算法。这个基于赛灵思Alveo数据加速卡的分子动力学解决方案,兼容目前常见的分子动力学软件,经过我们内部测试,我们通过FPGA计算出来的蛋白结构统计数据与软件计算出来的数据虽然不是一摸一样,但统计上几乎没有差别。”他强调。“雪湖科技基于赛灵思 Alveo 加速卡的分子动力学专用计算的性能优异,对于百万原子体系100纳秒的模拟,只需要8小时就可以完成。我们设计的分子动力学专用计算架构还可以部署在基于赛灵思Alveo加速卡的云计算服务器上,提供基于FPGA云的分子动力学专用计算服务。”
2021年年初,雪湖科技基于赛灵思 Alveo 加速卡的分子动力学专用计算解决方案获赛灵思自适应计算挑战赛Adaptive Computing Challenge 2020 全球第二名 。
他表示通过多张卡多节点组成集群,还可以进行超大规模分子动力学模拟,根据推算,一个赛灵思Alveo加速卡的机柜能够实现2天完成1亿原子计算100纳秒轨迹的性能。
赛灵思FPGA在医学领域大显身手
赛灵思大中华区数据中心业务销售总监钟屹(William Zhong)表示在今年5月10日的举行的首届中国生物计算大会暨数字医学创新峰会,围绕“如何定义生物计算”这一主题,分别从生物计算的行业需求、现状及挑战、发展驱动力等多个维度进行了深入探讨。 此次大会表明,生物计算作为跨界融合和与人类命运息息相关的技术产业,正在成为科技业的一个新热点。生物计算正日渐从研发中心走向行业应用,成为驱动整个产业链和人才梯队发展的新发展引擎。“生物计算 = 新数据 *新算法”成为大会公认的观点。
“赛灵思早在2018年就看到了大数据爆炸及人工智能普适对算力的强大需求,从2018年至今不断打造和扩展世界上最快的数据中心加速卡 Alveo 系列平台,使得其在整个医疗和生命科学研究工作中,成为了一个理想的创新平台。我们的很多合作伙伴,包括今天和我们共同参与分享的雪湖科技,人和未来,都是基于Alveo卡进行的研究和实现的行业突破。行业的需求,用户和合作伙伴所取得的成就,足以说明赛灵思在这个领域的投入,具有公认的技术前瞻性和有利的行业证明。”他指出,“由于数据大爆炸,特别是大量的非结构化数据的产生和各种不同应用,不同workload (工作负载)的加速需求,数据中心正在经历一次技术转型,我们看到从以往的以CPU为中心正转向定制的分布式计算,同时多种不同的应用、不同的workload及相应的算法更新迭代很快,远远超出芯片的发展速度,现有芯片架构无法满足上述更新迭代的速度与需求。
而赛灵思的Alveo加速卡可以适配各种不同的workload,可以满足各种不同且持续变化的工作负载。Alveo同时集成存储和网络的控制器,拥有强大的集成度,可以满足从云到端各种工作负载的各种性能需求。
基于不同的应用,赛灵思的自适应加速平台 —— Alveo卡可以在三个方面很好的满足数据中心不同应用的要求,第一个就是高性能,最大的吞吐量和超低延时,这个是基于我们通过优化的领域专用架构,即英文经常说的DSA ( Domain Specific Architecture) 来实现的。这个是很重要的,也是我们跟其他方案最大差异化的地方。
另外,我们看到数据中心有这么多种不同的应用,相应的我们的这种加速卡,由于其特有的自适应这种能力,可以满足不断变化的工作负载。这种自适应能力对于数据中心企业节省投资、面向未来具有非常重要的价值。
第三点我们Alveo卡集成存储和网络控制器,在加速方面,不仅仅能够加速计算,同时还能加速存储、网络,通过单卡满足客户多样化要求。
基于上述三大优势,我们在能耗比这一块,性能和功耗能耗比在运营和成本上,都能给客户带来前所未有的价值。也正因为此,Alveo卡在公有云、线上还有在线下都得到了广泛的应用和部署。
上图是性能对比,跟CPU的性能来比,赛灵思FPGA的方案将性能提高了90倍,换句话说,CPU这一块之前做基因测序要30个小时,而基于FPGA的解决方案则实现了基因测序只要20分钟。所以就是90倍的性能提升。
他举的第二个案例是Twitch,Twitch是亚马逊的一个子公司,专注在在线游戏(online gaming)和电竞 (e-sport)。以同时满足300万个用户在线做比较,相比CPU,FPGA性能可以提升30倍,成本降低25%。
他指出赛灵思在2018年”DC First (数据中心优先)”这个战略指引下,持续将公司从一个器件供应商向平台提供商转型。赛灵思作为一个平台提供商,和很多合作伙伴一起打造了一个高效的生态系统,以便为越来越多的用户提供快速上手且前沿的创新平台。如上图所示,赛灵思的合作伙伴很多,包括阿里巴巴、百度、腾讯、浪潮、联想、戴尔、惠普等。“我们可以联合我们的公有云客户,ISV及解决方案提供商,服务器OEM,共同为客户提供整体解决方案。”他指出。
赛灵思数据中心加速系统架构师傅垚则介绍了赛灵思FPGA及自适应计算加速平台Alveo在生物医疗领域四个方面的应用案例。
第一个是是基因组学分析,他指出赛灵思的Alveo加速平台最大的一个特点就是能够加速的计算类型理论上是不受限制的,不像GPU对于浮点的高密度的矩阵或者是矢量运算比较强,但其他的就会有限制,或者CPU通用性强但是限制也多。
“赛灵思的加速平台可以加速各种类型的运算,并且都能够达到比较好的加速性能和效率。在基因组分析的整个端到端的流程上就会有比较明显的一个体现。比如现在我们第二代基因测序的一个基本流程首先是实验室先去提取样本,样本会放到我们的测序仪里面进行短序列的测序,短序列的测序过程中他其实就是说在测序仪里面会对我短序列的反应过程会获取很多的图像,我们通过图像的处理来确认我们序列碱基的情况,生成短序列。这个过程中就会用到很多图象处理的算法,这个是我们跟测序仪厂商,都会有一些这样子的项目在我们的测序仪里面做图像的处理。”他举例说,“我们拿到短序列之后我们可以去做一些序列比对和拼接,这样子的话可以形成一个比较完整的序列,来做我们后面的一些分析。这个序列比对拼接主要是一些字符串模式的比对。这其实是很典型的,像其他的针对浮点数据运算,或者我们的数学运算设计的这些加速器,譬如像GPU很难做很高效的处理,但我们FPGA仍然可以针对这种字符串模式的处理做到很好的加速效果。这是是赛灵思独特的优势。”
他表示在变体识别之后有高密度计算需求。Alveo加速平台所搭载的赛灵思器件也可以满足需求。从端到端整个的分析流程来看,赛灵思的加速平台其实在每一个步骤,都会提供加速。
他表示如果做性能对比,用8张英伟达的V100加速卡可以完成32个样本的处理,但是同样的样本处理,只用单张Alveo加速卡就可以实现超过46个样本的处理!
第二个应用是图形数据库,图数据库的应用主要是用在病历分析场景。他解释说一般来说医院或者说医生诊断的时候,病人会有很多过去的相关数据,比如说病人之前的一些发病情况,包括病人之前的一些诊断,还有他的保险,包括他的一些相关病史,包括他之前的一些遗传学分析和各种数据,赛灵思都会把他放到图形数据库里面做相似度分析。
他举了一个和北美合作伙伴 TigerGraph一起将进行的UHG项目案例。UHG 利用其病人信息构建了一个很大的图形数据库,大概有100亿个顶点和500亿个边,大概1.2T的数据。“相当于把所有的,包括医疗提供商,包括病人的基本情况,包括就医处方在内的所有数据,都放在这个数据库里面。在这个数据库里面我们可以通过相似度的分析,找到类似病例,可以去指导医生的判断和诊断,在这个应用场景里能够极大降低成本,并且能够更好的保证医护的质量。”他解释说。
第三个应用是医疗影像分析,这是FPGA的传统优势项目,常见的如X光的分析,包括CT扫描、超声或者内窥镜等类似应用。近年来这一类型的医疗影像分析用到了很多人工智能的算法,这些应用有把赛灵思芯片和设备融合在一起的分析案例,不过一些传统设备可能不具备智能化分析能力,则可以把这些数据放到医院的数据中心里做处理,这样医院也不需要去升级他的智能化分析设备。
“去年新冠疫情爆发以后,我们通过公开的数据库里面采集到的一些肺炎数据,用一些公开的模型去做的一个新冠肺炎的分析模型,我们基于原来普通肺炎的分析模型,拿新冠肺炎的X光数据做了重新训练,能够达到一个比较可观的对新冠肺炎的诊断分析的效果和准确率。这个模型已经放到了赛灵思Vitis AI Model Zoo,这样研究人员就可以随时拿到我们的模型和我们的数据,再结合他们自己已有的数据去做更进一步的模型的部署和升级。”他举例说,“因为我们的Model Zoo基本上相当于参考设计或者参考模型的情况,如果像医院或者是研究人员需要做进一步的更加准确的模型的训练或者他们有自己的一些私有的数据集,或者对一些不同的病症进行分析的话,他们完全是可以通过我们的Model Zoo的模型做一个重新训练,可以达到一个更好的效果,并且可以非常轻松的部署到赛灵思的Alveo加速卡上去做实时推断的。”
在CT断层扫描方面,可以通过二维的CT的数据,通过赛灵思一些算法能生成3D立体的表达,还有对基于低剂量的CT影像数据,通过深度学习的方法能够获得一个更高质量的CT成像,这可以降低病患在CT辐射下面的暴露量。
在超声影像方面,可以侦测一些可能比较重要的病灶区域,他表示赛灵思也基于公开的数据集、公开的模型在Alveo平台上做了一个例子,合伙伙伴可以用自己的数据重新训练并优化。
第四个应用是智慧医院,案例是赛灵思跟南美的一个合作伙伴医院在ICU里面实现智能监控,如果病人在病房里面摔倒或者病人身体移出病床,或者病人挥手呼救,或者在护士请求帮助的时候,都能够得到一个及时响应。
“我们的应用场景就是通过病房里边的监控,通过实时的AI分析,能够及时地检测到需要注意或者需要及时响应的情况。特别是在去年新冠疫情比较严重的情况下,医疗人员人手出现了极大的不足,医院就会发现不是每个病床一直都会有医护人员看守的,此时此刻这样的需求就会比较明显。”他指出,“这个应用部署在了Alveo U50加速卡上,一台服务器需要三到五个U50加速卡,其中一个用来做视频解码分析,另外三张Alveo加速卡处理高密度的人工智能模型,是计算密度比较高的人工智能模型,包括姿态检测模型、像素分割、跌倒检测模型,在这些模型处理结果完成之后还会有一些应用的基本逻辑在里面完成,如姿态检测模型在结合人员追踪或者手势检测的模型后就可以检测出病人或者护士请求帮助的手势。而像素分割模型和姿态检测模型结合则可以检测到病人身体移出这个病床的情况。”
用FPGA加速寻找基因病变!
赛灵思在基因检测方面已经和国内公司合作,湖南人和未来生物科技(长沙)有限公司首席医学官王益民就介绍了人和未来和赛灵思的合作情况。
人和未来自 2014年成立以来分别布局了基因高通量测序技术以及相关大数据处理技术,涵盖了基因检测上下游中多个关键节点。其中作为核心技术的基因大数据处理技术,包括加速计算,高密度压缩存储以及基因数据专用的高速传输技术。以加速计算技术GTX.One 为例,能够大幅度提高现有的基础设备计算速度,将传统方法需要 60 个小时处理的人类全基因组 30X 测序数据大幅度提高到 30 分钟。据他介绍,截止 2020 年 12 月全球已经有上百家机构以及企业正在采用人和未来提供的基因大数据技术。
“目前高通量测序在临床以及科研上的应用是越来越广泛,数据增长速率非常快。尤其是围绕基因组学在临床上的应用,数据量非常非常大,而且随着测序成本下降,数据量的增长是非常惊人的。我们意识到不管是我们还是终端用户如医院、其他第三方机构、科研机构等都面临这样一个对速度的要求,也就是我们希望更快的把这些数据计算完成,更好的服务于临床,让病人更快拿到结果,让科研工作者能够更快更好的发文章展示研究成果,把结果跟同行进行分享。”他指出。“所以围绕加速这一需求我们一直在寻找一些可能的解决方案,经过很长时间的对比,我们最终选定了赛灵思高性能的FPGA作为我们硬件,因为这样的平台有很多非常现实的优势,除了性能,还有其特有的软硬件全部可重新编程的优势等。基于这个平台我们开发了围绕大数据基因组这样的存储传输计算,以及后续的解读大数据基因组相关的分析方案和平台,从而使得我们快速推出了业界领先的基因组分析平台,并已经在科研和临床等各个领域开始部署和应用。
他表示目前在临床上,最典型的应用是用全外显子组测序 (WES)和全基因组测序 (WGS)查找跟基因突变有关系的疾病,原来很难通过传统诊断方法找到致病位点及致病原因。而现在通过基因组分析,相对来说可以提供另外一种解决或者诊断方案,会找到他到底是不是由于基因突变导致的表现和变化,在这一点上来说,能够很快的把病人的基因组进行分析,得到相关的结果,找到跟疾病相关的突变位点是进行精确诊断的最首要、最先决的条件。而在之前其实是存在两个问题,一个问题是分析周期特别长,长到可能要花十几天、几十天的时间才能拿到一份辅助诊断。另外一个问题就在于很难很快找到临床相关性突变,一个是速度慢,再一个是找得不准。
”基于我们多年在临床上工作的经验以及我们做遗传解读和数据分析的经验,我们实现了一个方案,这个方案基于FPGA,同时把人工智能的一些核心算法加以应用,从临床表型入手,到基因突变造成的蛋白等其他分子功能构象变化结合起来进行人工智能分析,大数据分析,找到可能的临床相关性,这是我们一个普遍的流程,也是基于FPGA开发的这样一套流程。“他指出。
据介绍,这套平台主要的架构就是从基因型输入到基因注释,把相关所有突变位点进行注释,加上排序,跟遗传性的相关性,通过结果展示出来。
“ 经过FPGA的加速,我们把原先需要大概十几个小时的数据中心,以前需要30-40小时的分析时间压缩到了只需要短短的20分钟以内!另外在性能与准确性方面,FPGA跟其他平台解决方案相比,一个核心优点在于它对数据的保真度非常高,相对其他平台解决,我们要更准确一些。”他指出,“所以,在后续的结果报告中,包括病例的分析中,会提供更准确,更有价值的信息。”
医疗健康与每个人息息相关,赛灵思在这个领域的探索值得学习,我特别期待在赛灵思FPGA大算力的加持下,医疗机构能早日找到治疗新冠肺炎的特效药,你期待吗?(完)