关于ZAKER 融媒体解决方案 合作 加入

两毫升唾液中的祖源与家谱: 消费级基因检测突围百亿市场

参天之木,必有其根;怀山之水,必有其源。当李云泽获得自己的家谱,以及家族的迁徙路线图时,不免有些激动。

将装有两毫升唾液的试管寄给基因检测公司三周后,他不仅获得了与自己遗传有关的多种检测信息,同时也顺利匹配到了家谱与家族的信息。

根据 23 魔方 CEO 周坤的预计,其正在进行的家谱数据化工程,有望在 2020 年覆盖 80% 的用户家庭,帮助其寻找到失散的家谱。

将纸质家谱进行数据化的工作,已经出现多年,如目前上海图书馆已经存有 8000 部以上的数据化家谱,读者通过互联网即可以查阅相关信息。

但基因检测公司参与这项工程的关键,则是将基因中的 Y 染色体与家谱信息 " 配对 ",以实现用户更加便利寻亲认宗。

事实上,从 2013 年开始进入中国的消费级基因检测公司,已经度过了 2015 年的爆发期和 2017 年的洗牌期,现存的公司各有优势,但面对未来的不确定性,则要看能否抓住更多消费者的心理需求了。

显然,帮助用户寻找祖源与家谱,是一个好方式。

遗传因素 = 健康风险?

以服务对象检测的方式和用途不同,基因检测分为消费级基因检测和临床级基因检测,两者的最大区别在于,后者的诊断报告被医疗机构认可,可作为就诊的辅助材料。

消费级基因检测从 2013 年进入中国市场,彼时由于中国消费者不熟悉,因此消费级基因检测公司多以 " 噱头 " 引起关注,如 " 天才检测 "、" 情侣关系检测 " 等常见于广告中。

2015 年,随着消费级基因检测费用的降低,迎来了爆发式增长,大量公司开始出现。而到了 2017 年 -2018 年,随着头部企业的出现,行业出现洗牌,不少公司随之消失或裁员。

消费级基因检测包括 23 魔方、微基因、水母基因、360 基因、爱基因等。其中 23 魔方和微基因已经完成了 B 轮或以上的融资。

临床级基因检测,包括华大基因,达安基因、华因康基因、安诺优达等。

分析机构易观认为,2022 年预计参与消费级基因检测的人数,将由 2017 年的 30 万人,增长到 5000 万人,市场规模达到 249.5 亿元人民币,占整个基因检测行业市场的 37.83%。

如何争夺两百亿规模的市场?消费级基因检测公司进行的第一步,均为基因相关疾病的检测。

以国内消费级基因检测的头部企业—— 23 魔方和微基因比较,23 魔方为赛默飞世尔科技 ( Thermo Fisher Scientific ) 的 80 万 + 位点芯片进行基因分析。微基因使用的是 Illumina 基因芯片,可进行 120 万个位点分析。

无论是哪一种方式,其检测结果在经过几年的发展后都有趋同性。21 世纪经济报道记者注意到,两款产品的重点均可以检测某些遗传因素造成的健康风险。其中包括对肾结石、高血压、肥胖症、肺纤维化、痛风、类风湿性关节炎、阿尔兹海默症等进行检测。

需要注意的是,即使检测出了用户潜在的风险,并非意味着一定会在未来患病。

" 消费级基因检测公司,往往根据已有的研究文献或临床实证进行分析。" 从事医疗卫生研究的火石研究院高级行业分析师魏洪泽对 21 世纪经济报道记者表示。

以 23 魔方所检测的迟发性阿尔兹海默症为例,遗传风险的评估方式,是通过分析临床 1576 名平均发病年龄在 70 岁的患者,以及 1741 名同年龄段的健康人群的基因数据和表型数据,并修正性别、生活习惯等其他因素的影响后得到的。同时,其参考包含了 1997 年 -2014 年间的 6 份文献。

" 每个月我们都会有 6-7 个项目上线。" 周坤说,除对现有的医学数据进行基因点位的分析外,该公司也通过自建的研究所,推出与用户共同进行的基因检测,如 " 脂肪肝 " 项目,共有 3309 个用户作为测试集合,并根据相关算法构建预测模型进行评估。

魏洪泽表示,消费级基因检测单基因突变的位点,但仅有单基因突变而导致疾病相关的案例并不多,因此依靠此类方式进行疾病的检测,意义并不大。

" 我认为消费级基因检测公司的发展,还是以半娱乐化的方式为主。" 魏洪泽表示。

用历史和科技手段寻根

在遗传疾病检测趋同的情况下,贴近消费者现实需求,比如寻找祖源和家谱,成为了争夺市场的另一个关键。周坤认为,消费级基因的发展,应该遵循 " 轻健康 " 模式,帮助用户更加了解自己。包含健康和身世的信息,而非对复杂疾病的预测。

因此通过基因检测,帮助用户寻找祖源,是这些公司挖掘的另一个市场。

从遗传学角度来讲,人类有 23 对染色体,其中第 23 对染色体为性染色体,其中男性为 XY,女性为 XX。其中 Y 染色体来自父亲,且只能传给儿子。Y 染色体一共有 5900 万个基因点位。

其中有 1000 万个点位属于稳定区,在基因研究中,任意两个男性的 Y 染色体比对,只要找到哪一个点位的突变是相同的,就可以推算出两人在多少年前拥有同一个祖先。

周坤表示,稳定区的基因点位,其遗传突变约每 140 年发生一次。" 这是基因检测公司,进行研究祖源的前提条件 "。

周坤预计,当拥有 30 万样本的时候,可以帮助 5% 的用户,找到自己的三代以内的亲戚关系。当样本量 100 万的时候,25% 的用户将至少有一对三代表亲。达到 500 万的时候,所有丢失的孩子,都可以通过基因检测,迅速与自己有血缘关系的亲属进行匹配。据周坤的预测,到 2020 年 23 魔方就可以实现 500 万用户的规模。

就目前情况看,大量的用户可以匹配到 30 位以上的 " 五代关系 " 亲属,即在 150-300 年前的清朝中后期,其存在一位共同的祖先。

周坤表示,五代主要是用于寻踪,一旦五代关系的数据足够庞大,就可以描绘出自己祖辈的迁徙图谱。

另一方面,则是进行家谱数字化。

21 世纪经济报道记者了解到,上海图书馆 " 数据化 " 了 8565 种家谱,包括题名、版本、居地、作者、堂号,而该图书馆的阅览室可看到全文的家谱更是达到了 1.4 万余种。

23 魔方相关人士对 21 世纪经济报道记者表示,现在所做的家谱数据化,家谱来源一方面是民间搜集,包括搜寻现存的民间家谱,以及查询历史古籍记载;另一方面是和国内外的文化机构进行合作,包括各地图书馆,利用他们现存的家谱进行数据化。

21 世纪经济报道记者了解到,与目前的数据化家谱相比,23 魔方所做工作的区别在于,除了将家谱数据化之外,更重要的是把家谱和人类 Y 染色体的突变进行关联。

" 因为在中国的历史上,家谱、姓氏和 Y 染色体都是‘传男不传女’,做这样的关联之后可以帮助用户寻根寻亲,我们将历史与科技做了结合。" 上述人士称。

周坤表示,明朝以来的 20 万部家谱中,有 10 万部可以覆盖 90% 的家庭;而其中的 3 万部,则可覆盖 60% 的家庭。截止到 2019 年 5 月,23 魔方已完成 4650 个家谱的数据化,覆盖 8% 的中国人;预计到 2019 年底,23 魔方将完成 3.4 万个家谱的数据化。

" 人与人之间的关系,其实并不遥远。" 周坤表示。

10 万刘家人

事实上,并不遥远的不仅是人与人的关系,消费级基因检测的另一个突破,是通过大量的用户参与,对历史上某些特定家族 " 寻踪 "。

例如在刘邦家族的基因信息发现中,23 魔方借助了将 Y 染色体突变与历史信息结合的方式。

周坤表示,人类历史战乱和灾害不断,因此目前的所有人类,其祖上曾经有一代或几代,出现了出生人口的大爆发,因为如果只生一个孩子,从数学概率上来讲,很难在战乱和灾害年代繁衍后代,因此只有尽可能多的生孩子,才能使得自己的某个或某几个后代能够成功繁衍生息,使祖辈的 Y 染色体可以遗传下来,他们将这一现象称为 " 树状人口大爆发 ",即多个男性的 Y 染色体在同一时期或相近时期,拥有同一名父辈的遗传信息。

截至 2018 年,23 魔方拥有了 30 万用户的基因组数据。他们对这 30 万用户中,姓刘的用户基因数据进行分析后,发现了一个有趣的现象,就是刘姓用户中大约 10% 的人,其 Y 染色体的单倍群(用来标记数千年前的祖先来源)是 F155。

同时对染色体中带有 F155 的用户进行分析,发现其中有 24% 的用户姓刘。

尽管刘姓在中国是一个大姓,但根据第六次全国人口普查,其占中国总人口比例仅 5.38%,约 6460 万人。

这就意味着,无论是 Y 染色体中含有 F155 的人口,或是带有 F155 染色体的刘姓人口,其两者间有非常高的关联度。

" 同时我们又对 F155 所有的 Y 染色体做了研究和分析。" 周坤称," 我们发现 F155 这个单倍群,在距今 2300 年 -2000 年间,有连续三次的树状人口大爆发。进一步讲,这意味着在这 300 年间,曾经连续三代左右的人都生过很多的孩子。其中最集中的就是在距今 2300 年 -2150 年间,用 F155 在当时人口中所占比例乘以当时的新增人口,大概推算出来是 10 万人左右。另外也有家谱保存下来,可以通过历史文献推算校验。"

从逻辑上推断,一个家族能在 150 年间,相当于 6-7 代间生出 10 万的后代,意味着每一代每个男性都要生 5-7 个男性后代。因此产生的问题是:在距今 2300 年前,谁有能力繁衍这么多后代?

周坤称," 我们进一步将这些信息与历史记载相对比,发现这三次的人口大爆发刚好跟汉高祖刘邦、汉景帝刘启、光武帝刘秀在位的时间吻合。因此我们推测 F155 这个单倍群是刘邦或者是刘邦父亲的 DNA 标记。"

规模用户带来新机会

而对于消费级基因检测的未来,周坤认为,是从简单有趣,到越来越有用的过程。

如目前 23 魔方的 6 个用户,已经找到了亲生父母。" 通过基因检测,我们帮他们匹配到了远方的堂哥或表姐,从而间接地找到了亲生父母 "。

但周坤也坦言,目前 40 万人的用户规模,尚无法通过检测做出更多的疾病预测。以糖尿病为例,其病因非常复杂,目前无论是哪一类的基因检测,对其基因的破解是有限的,因此对于此类复杂的疾病,尚无介入检测的可能。

但他认为,应该畅想当用户规模在 500 万 -1000 万的时候,当有了更大规模的用户数据,届时消费级基因检测也能够承担更多的医学检测。

周坤认为,随着技术的发展,基因检测成本将越来越低,由于检测的底层技术趋同,消费级和临床级基因检测的边界会越来越模糊。

但他也提醒,目前的消费级基因检测,相当于对人体的 " 出厂配置 " 进行检测,而人体会受环境等多种后天因素的影响,因此对 " 出厂配置 " 的检测不代表最终的结果。

不过,需要注意的是,随着用户规模的不断增长,基因数据有望成为消费级基因公司的核心资产。

若将美国作为对比,2012 年末,全美有 30 万人拥有自己的基因组数据。2017 年末,这一数量已经陡然增长至 1200 万,人口渗透率在五年时间内从 0.1% 提升到 3.75%。

2017 年末,中国拥有基因组数据的人数为 30 万,如果以美国的增速为计算,到 2022 年有超过 5000 万中国人拥有基因数据。

在魏洪泽看来,消费级基因公司除了在疾病检测、祖源、家谱方面继续寻求突破外,用户数据的积累一旦突破了几百万到几千万,还将有更多的应用领域。

例如以基因检测作为精准诊断、精准医疗的前提,研发出更适合患者的用药。此外,以基因检测作为指导慢性病患者合理用药的依据,可以减少大量的不必要医疗消费,从而提高国家的医保经费的使用效率。

事实上,在这一方面已经有了先例—— 2015 年 6 月,北京朝阳医院开设了精准用药门诊,组建药师团队,在门诊为患者提供个性化精准用药方案,并建立基于中国人慢病用药的药物基因组学数据库。

根据 2018 年上半年精准用药门诊抽样数据显示,504 名患者诊后例均减少用药 0.5 种,精简药物最多者由原来的 23 种药物减少到 6 种,门诊精准用药服务平均每月为患者节省药费 367.3 元。

" 由于慢性病的部分用药纳入了国家医保,则可以节省大量的国家医保开支。" 魏洪泽说。

进一步讲,从疾病的检测方面来说,消费级基因的发展虽然有天花板,即单基因点位的检测,无法与全基因组测序相比,但 " 大量的用户数据 " 累积则是未来最大的不确定因素,这也是资本愿意持续介入的关键。

以上内容由"21世纪经济报道"上传发布 查看原文

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐