关于ZAKER 融媒体解决方案 合作 加入

用数据分析为基因测序行业“提速”,「赛乐基因」获近千万元天使轮融资

36氪 2019-11-21

36 氪获悉,专注于向医疗、基因测序及科研机构提供生物信息解决方案的赛乐基因已在 2019 年 1 月完成近千万元天使轮融资,投资方包括梅花创投、新势能基金。目前,它正展开新一轮融资,用于新产品研发和市场销售。

近年来,随着高通量测序设备的广泛应用,及基因组序列测序成本大幅下降,整个行业得到迅速发展,吸引了大量资本和企业的进入。这带来了基因检测的日益普及,也带来了越来越大规模的数据产出。据 illumina 估算,NGS 测序数据产出量在 2016 年之前每 7 个月翻一倍,在 2016 年之后仍将远超摩尔定律。

针对如此大规模的数据,如何寻找高效的数据处理方案,如何提升数据解读速度,成为行业下一个重要议题。为此,赛乐基因基于 CPU+GPU 异构计算架构,历经数十次产品迭代升级,开发出了 BaseNumber NGS 数据分析平台,并搭载硬件推出了一体机。

BaseNumber 一体机

据公司联合创始人 &COO 张继翔介绍,该平台采用了 GPU 的技术路线,具体来说,它针对基因数据的特点,基于 CUDA 平台,原创开发了 GFrame 技术框架,并针对核心生物信息算法进行了重构。

张继翔告诉 36 氪,CPU 一般有几十个核,而 GPU 可以达到 4000 多个核,非常适合高效的并行性和高密度的计算,但 GPU 一般适用于简单逻辑的并行计算,而基因数据分析逻辑非常复杂,在 GPU 上实现基因数据分析是一个难题。不过,目前赛乐基因基于上述技术路线已解决了在 CPU+GPU 异构计算平台上对基因数据分析实现超高速分析的技术难题,在确保准确性前提下显著提高分析速度。

目前,赛乐基因已发布 BaseNumber Germline 胚系变异分析流程。张继翔介绍道,它在确保分析结果与业界最佳实践一致的前提下,BaseNumber 将一个 30X 的人类全基因组分析运行时间从传统的 "CPU 服务器 + 开源软件 " 方案所需的将近 24 小时缩短到 12 分钟,提速超过 100 倍。

而除了全基因组数据,BaseNumber 胚系变异分析产品同样可以分析全外显子(WES)和靶向 Panel 数据,可以被科研机构、基因测序公司与医院广泛应用于遗传病诊断与筛查、人群队列基因组研究、动植物基因组研究等领域。目前,除了胚系变异检测产品,赛乐基因还完成了超高速的体系变异检测产品,即将向市场发布,该流程可应用于肿瘤相关基因检测科学研究和应用。

张继翔表示,提高工作效率只是其一,分析速度显著提升后分析单节点的通量也会变大,这也能大幅节省客户在硬件资源和 IT 基础设施上的投入,从而帮助客户节省更多分析成本。

根据下游的需求,赛乐基因的目标客户主要有三:科研机构、基因测序企业(包括医疗级和消费级企业、基因科学服务公司),以及医院。目前,公司的盈利模式主要是销售 NGS 基因数据分析一体机和收取年费,明年还会推出云计算服务,按照分析数据量收费。

那反映到市场端,这会是一门好生意吗?据咨询机构 BCC 预测,全球基因市场规模在 2023 年达到 244 亿美元,年增速 18%;其中上游提供生物信息工具与分析的细分市场规模 31 亿美元,年增速 25.5%。张继翔表示,随着基因数据指数级地增长,基因数据分析的效率与成本必将成为一个深切的痛点,细分市场必将达到百亿美金级别的规模。

针对可预见的痛点,目前除了赛乐基因,也有头部公司伺机而动,投入巨资布局。譬如 illunima 就推出了生物信息计算一体机 DRAGEN ,华大智造也推出了 MegaBOLT 生信分析加速器,腾讯云自行开发 " 腾讯云双螺旋 PAAS 平台 ",华为云与 Falcon 展开合作,Intel 与凯杰生物合作搭建 Intel 高性能计算平台等,都意在加强自身数据分析能力。

最后介绍一下团队,赛乐基因由三名毕业于北京大学计算机系的同学华云波、张继翔和戴永继联合创办,组建了一支 "IT+ 生物信息 " 复合型团队。创始人华云波曾是奥数国家集训队成员,先后成功创办过包括互联网医疗公司和 NGS 基因测序公司等多家企业,并在上市公司担任高管;张继翔和戴永继则分别拥有近二十年的企业运营与软件开发经验。成员大多毕业于北京大学、中科院、中佛罗里达大学、西安交大等知名院校,曾在腾讯、诺禾致源等知名企业任职。

以上内容由"36氪"上传发布 查看原文
36氪

36氪

让创业更简单

订阅

觉得文章不错,微信扫描分享好友

扫码分享