央广网昆明12月2日消息(记者李健飞)近日,中国科学院昆明动物研究所马占山团队发布了两项生物信息技术(算法和软件),这两项技术可用于精准诊断菌群相关疾病指标的研发,也可用于其它环境微生物群系监测的研究。其技术报告以The P/N (Positive-to-Negative Links) ratio in complex networks—a promising in silico biomarker for detecting changes occurring in the human microbiome和Trios—promising in silico biomarkers for differentiating the effect of disease on the human microbiome network为题,分别发表在Microbial Ecology和Scientific Reports上。两项技术的国家发明专利已进入实质审核阶段。
现今,仍有一类疾病(例如乳腺炎、BV、IBD、肥胖、牙周炎等),由于对其发病机制缺乏完整了解,使临床诊断存在诸多障碍。它们具有一些共同特征:用一通俗说法,就是与人体“菌群失调(Dysbiosis)”密切关联,类似于自然生态系统(例如森林、湖泊)失衡可能会引发生态灾害。“人体菌群”更准确的应称作“人体微生物群系(Microbiome)” 是指分布在人体体内(肠道、生殖道、呼吸道、口腔)和体表(皮肤)的大量微生物(包括细菌、病毒、噬菌体、质粒等)。如果单指细菌,则“菌群”这一传统使用名词可以继续使用。如果包括病毒、噬菌体、质粒等,则“微生物群系”应该是更加恰当的名词。另目前中文翻译中大量使用“微生物组”一词,但如果考虑,与传统上类似的“(动植物)区系(Biomes)”一词使用,以及与“微生物宏基因组(Metagenomics)”区别;中文其它生物“组”学也都对应英文“Omics”;Omics通常也指对生物大分子(基因、宏基因,蛋白质等)“组”的研究。则“微生物群系(Microbiome)”或许更恰当。
人类自进入工业化时代以来,现代化的生活方式(特别是饮食习惯的改变)或为人类微生物群系带来深刻变化,这些改变很大程度上不利于健康。肥胖、糖尿病、痛风、IBD等免疫代谢相关疾病的高发构成一张可能仍在不断加长的疾病清单。科学家将这类疾病称之为菌群相关疾病(Microbiome Associated Diseases:MAD)。 然而,针对MAD的大规模、深入研究仅是过去10年间的事。由于受到菌群检测技术的限制,对此类疾病病因的研究迷失了方向;其中一些疾病的病因至今仍然未知。例如,有些疾病被认为是感染性疾病(例如乳腺炎、BV、牙周炎),但医学界却找不出确切的病原菌。又如,有些疾病被笼统归之为代谢性疾病(例如肥胖、IBD),但确切的发病机制并不清楚。美国“人体微生物群系研究计划”(HMP)以及欧盟“人体肠道微生物群系研究计划”(MetaHIT)等所采用的宏基因组学研究技术,将MAD疾病的研究推向医学前沿。但对寻找MAD疾病“病原”和诊断标准的研究仍然鲜有重大突破。与传统感染性疾病不同,通常不存在单一的“敌人”(病原菌)。即使存在“敌人”,敌人非常“狡猾”,他们可能形成机会性的邪恶联盟。马占山团队2015年首次揭示的乳腺炎发病机制就是其实例之一。这些机会性邪恶联盟“潜伏”在健康人体菌群内,一旦机体发生有利于他们扩张的环境,则迅速“兴风作浪”。
人类微生物群系计划伊始,科学家已认识到MAD疾病乃至微生物群系研究本质上是生态学问题,并从以研究动植物为对象的宏观生态学汲取了大量理论、方法和技术。人体微生物群系生态学被认为进入了黄金时代;但这些进展并没有解决MAD疾病的诊断和病因研究中的根本性挑战。几乎所有人体菌群研究均进行多样性分析、多样性指数计算。现实中,这些多样性指数对疾病诊断的意义有限。
鉴于生态学分析技术的局限性,科学家对应用复杂网络科学研究菌群生态网络展开了大量研究。网络科学在过去10多年间被认为是自然科学和社会科学领域最重要的技术之一,然而在MAD疾病诊断领域却进展甚微。由于先前所定义的复杂网络特征忽略了菌群网络中特殊节点的作用,以及其相互作用方式;这些特征或是在疾病和健康样本之间无显著差别,或是“七上八下”。马占山团队制定了如下策略寻找全新的网络特征,包括(1)“承认”代表特殊微生物种类的网络节点(例如,最高丰度物种、最高优势度物种、网络枢纽节点等)可能具备的特殊作用;(2)区分种间相互作用的模式(相生、相克或阴、阳关系);(3)选取尽可能简单的特征。
以上策略有效地揭示了人体微生物群系网络内部相互作用的三条基本原理:其一、物种生来并不平等,特殊物种可能具有特殊的诊断价值;其二、相生相克或阴阳平衡程度应具有重要诊断价值;其三、奥卡姆剃刀原理(以简御繁)。正是基于此三项原理,马占山团队定义了两类生物信息标记(指标)算法。一类是菌群网络中12种三角(基序)关系(trios),另一类是菌群网络中正负比例。三角关系虽然简单,但往往是决定系统格局和稳定性的重要因素。马占山团队定义的12种三角关系足以描述影响复杂网络系统格局和稳定性的要素;而正负比例指标显然受到了传统中医阴阳平衡思想的启示。马占山团队通过分析公共数据库中已发表的菌群相关疾病的研究数据,示范了两项生物信息诊断技术的有效性。当然,新诊断技术的适用性和有效性并非限于所检验过的这些疾病。马占山团队建立的原理、算法和软件为用户研发其它菌群(微生物群系)相关疾病的个性化精准诊断提供了全套分析和计算技术。目前,尚无其它类似能够用于研发可靠、特异的菌群相关疾病诊断指标的通用技术(算法和软件)。因此,新技术的发布为菌群相关疾病的精准诊断和其他环境微生物群系监测的研究提供了一项前景良好的核心使能技术。