一口唾液能测出孩子天赋？不可信！科学性受限

中国青年报| 2017-06-20 10:03:04

科学性受限

不仅是天赋基因检测，对于所有与“预测”功能相关的科技手段，人们最关心的都是“科不科学”和“准不准”。

“TA不喜欢看恐怖片，也会很难享受在过山车上直冲云霄的感觉。感官的刺激难以带给TA快感，TA会更多体验到恐惧和危险。”北京各色科技有限公司(以下简称各色科技)提供给用户的检测报告中的部分语言，看起来颇像一些常常出现在星座运程中的表述。

对此，各色科技CEO郭婷婷回应说， “看起来像是星座算命，但其实每句话所对应的都有科学依据。”她们为检测者出具的10万字报告是导入数据后，由后台自动生成的。通过几百个标签分别将用户的结果标准化，“每个标签下的分析，一部分是根据研究文献得来，一部分是根据数据分析，最后该标签下可能出现的行为表现，也往往来自该特质的心理学表现研究和问卷”。

根据郭婷婷的解释，一个标签的解读，是结合这一人格特质所对应的权威研究文献，将研究结论运用算法，设置位点间的不同权重，最终自动生成的结果。

但对于文献的依赖，在一些研究者看来，恰恰表明了基因检测分析的局限性。业界和学界的共识是，在祖源、心理、运动等这些偏娱乐应用的消费级基因检测方面，中国与美国相比，差距非常大。这个差距在研究样本数量上体现得尤其明显。美国的基因检测样本量在数百万级，中国在这些领域的检测样本量加起来仅有几万个。据了解，截至目前，各色科技的用户量约近2000人，而WeGene的用户量为近3万人。

陈科指出，国内非临床基因检测样本数据的匮乏，导致目前在此基础上作出的结论，并没有那么准确。陈钢认为，基因检测科学性的高低取决于累积检测人群的规模、所依据研究中的人群是否与检测人群相一致、数据质量是否经过多次独立验证等。

美国的基因检测公司23andMe往往在解读报告中指出，在某几个基因位点上跟被测者相同的人，有百分之多少。“比如有80%的人身体质量指数BMI大于28等，这就比较科学，因为这个结果的背后，有庞大的用户数据作支撑。”陈钢说，“相比之下，国内厂商，包括WeGene，都只能告诉你，你的体重比一般人高，却给不出像23andMe一样精确的百分比数据。”

陈钢认为，理想状态下，所有的解读背后的关键因素都应该是数据——有多少中国人数据，和中国人的这些数据相对应的表型信息来支持解读。

他说，由于国内检测公司的数据积累不足，只能结合研究文献进行解读。但这其中有很多主观因素影响结果，因为论文的质量并无判断标准。哪些论文是最权威、最适合的?分析者往往是根据自身主观经验和眼光进行选择，主观因素在其中起到很大作用。同时，分析者在对论文结论进行整合时，也存在一定的主观判断，进而得出一个带有较多主观因素的解读结果。“相比于这种形式，23andMe依托大数据的分析方式显然更好、更精确”。

郭婷婷也表示， “现有的检测结果是根据国际上对这一问题研究的最新、最权威文献得出的。但科学的特点是变化，所以我们会去追踪这一领域的研究。如果变动的研究所涉及的基因位点影响到我们的检测结果，我们也会追踪更新。”

陈钢和郭婷婷都强调，WeGene和各色科技所作的基因解读报告都在不断更新。“我们不提供纸质报告，而是电子版报告”。

在WeGene提供给51岁的科技爱好者程明(化名)的第一版检测报告中，他被检测出运动能力表现突出，比如爆发力、耐力等指标，属于前10%的范围。但第二版检测报告更新后，他的运动能力变成了前20%的范围。

陈钢表示，WeGene正在不断减少那些科学性不够高、主观影响较多的检测项目，尤其是一些涉及健康风险的项目，尽可能为用户提供最有用、可靠的信息。

亟待规范的国内市场

事实上，对天赋基因检测的迷信与追捧，只是揭开了基因检测问题的冰山一角。目前这一领域还处于野蛮发展阶段，鱼龙混杂，乱象丛生。

据《中国青年报》去年8月曾刊出一篇报道《藏在基因里的野心与欺骗：基因不是“生命说明书”》，江苏一位老人投入毕生积攒的30多万元积蓄，换来的是6大本根本看不懂的基因检测报告，因此投河自尽。近300页全彩色印刷的报告，除了用他根本看不懂的表情符号标注各种癌症的易感性以外，唯一“说人话”的地方就是建议老人购买各种保健品。

在政策管理方面，国内目前仅有针对临床基因检测运用的政策约束。2014年，国家食品药品监督管理总局和国家卫计委联合发出禁令，要求任何医疗机构不得开展基因测序临床应用。但这种“一刀切”的做法引起较大争议，到了2015年上半年，国家卫计委又先后公布了基因测序临床应用的试点名单。

但在非临床领域，尤其是在天赋检测、健康风险等消费级基因检测领域，国内的监管始终处于缺位状态。

早在2013年11月，美国食品药品监督管理局就出于无法确定检测准确性的考虑，向23andMe发布禁令，该公司所有与健康相关的检测分析都被停止，仅提供祖源等分析和解读服务。

禁令持续两年后，逐渐放开。由于23andMe通过学术研究等方式证明了相应检测的准确性，美国食品药品监督管理局允许其进行部分遗传性疾病基因携带状况的分析和解读，但不允许告知具体的风险几率。如今，23andMe早已成为该领域的巨头。

陈钢认为，没有监管和规范的行业只会野蛮发展，鱼龙混杂。消费级基因检测行业要想长期健康的发展，真正对人们有用，就必须要有合适、明确的监管政策出台。他呼吁监管政策尽快出台，并指出，“如果时间拖太久，市场没有监管，很容易会出现劣币驱逐良币的情况”。

郭婷婷表示，针对消费级基因检测，消费者目前很难从一个产品的价格和包装来判断该检测是否可靠。“国内没有相关标准，也没有严格审核，所以只有业内人士才能真正判断出一个基因检测产品的可靠程度”。

而对如何甄别一项基因检测产品是否相对可靠和科学，郭婷婷给出了她的建议。“提供了基因原始数据的相对更靠谱，从算法的复杂程度也可以判断，如果一个复杂的问题只有一个基因位点，那显然可靠性较差，如果提供了多个位点，且每个位点都有相应的参考文献，从这些要素上，基本可以判断这个产品是否靠谱、有诚意。”

人类基因的“冰山一角”

如今，做一次人类全基因组测序的花费已经从2001年的1亿美元降低到1000美元。

据陈科介绍，包括WeGene和各色科技等公司在内，目前国内消费级基因检测公司所应用的基本都是基因检测芯片或检测范围更小的Panel，这些芯片最多可以检测出60万到90万个基因位点，检测成本远低于全基因组测序。

60万到90万个基因位点，是个什么概念?大象公会创始人黄章晋曾在2013年做过两次基因检测，其中一次基因检测利用芯片检测80万个位点，他所拿到的结果是一个多达14M的TXT文档，甚至由于文件过大，打开过程中造成电脑死机。该文档中只有一个个的位点序列号，整整80万行。为了知道各个位点所代表的性状和意义，黄章晋利用朋友所提供的200个有对应意义的位点序列号，依次检索了100多个位点。“太费劲了，而且一个性状往往是由好几个位点决定的，在算法中各个位点的权重还不一样，我自己看是看不出来的”。

然而在专业人士看来，60万到90万个基因位点的基因检测芯片得出的信息还相当有限。“基因组测序所得到的是你的基因全貌，而芯片测出的只是一部分。即便是90万个位点，也是远远不够的，因为我们人类基因组碱基数是3.2乘以10的9次方，而90万个是5次方，只占了非常小的一部分。”陈科表示，在生物医疗领域做研究，研究层次呈现为三个同心圆，最外层的是疾病的描述，即何时发病、发病的状态等;第二圈是关联性，不是因果关系;第三圈才是研究真正的核心，即机制研究，搞清楚病因。他指出，目前很多基因检测分析都还处于关联的层面，很多公式或推断只是一种关联，却把这种关联性当成了因果关系来宣传，夸大了效果。

而人类基因组计划自1990年开始，至今仍未完成。2000年时，参与这项工作计划的6国科学家将“人类基因组草图”的绘制工作全部完成，而“人类基因组精图”的绘制工作仍在进行中。

因此，比起单纯的提供基因检测服务，郭婷婷表示，各色科技更希望通过提供有质量的数据解读内容，对用户进行市场教育，让更多的人正确认识到“基因检测是怎么回事”，“如何看待自己的基因数据”，最关键的，是积累更多中国人的数据，挖掘更大的数据科研价值。而这也正是陈钢所提出的WeGene的最终目标——建立起一个属于中国人自己的高质量基因数据库，为基因研究提供更多数据支撑。

陈科也指出，建立起国内这样的基因数据库很有必要，但需要打破各机构、各公司各自为战的局面，共享基因数据，让数据发挥更大的价值。(记者何林璘)原标题：天赋基因检测忽悠了谁