Biotech行业一直有句俗话,“只有政策下的行业,没有行业下的政策”。在这个资本市场的寒冬,利好政策的推出像冬天里的一团火苗,重新给予行业一些温暖和信心。 国家发展改革委印发《“十四五”生物经济发展规划》[1](以下简称《规划》),这是我国首部生物经济五年规划,明确提出了生物经济发展的阶段性目标和重点发展领域。《规划》指出要 “强化企业创新主体地位,发展壮大新型创新力量,要通过“助力疾病早期预防,提升疾病诊断能力,提高临床医疗水平”来“推动医疗健康产业发展”。“加快发展高通量基因测序技术,以高通量基因测序技术为主,重点开展肿瘤早期筛查”被首次提高到了“十四五”规划的高度。配合癌症筛查和早诊早治被列入《健康中国行动2022年工作要点》[2],肿瘤早筛似乎成为了乌云笼罩下的一道金边,蕴含了生物科技行业的光热与希望。 表1. USPSTF推荐的癌症筛查方式和PPV 由于传统肿瘤筛查手段中存在的多种局限性,临床迫切需要一些敏感性/特异性更高且更便于操作的早筛技术。液体活检技术作为一种非侵入性的新型检测技术,在肿瘤早筛方面具有巨大的应用潜力。 液体活检通过血液、唾液、尿液等体液样本对肿瘤信号进行检测分析,与传统组织活检相比,具有无创、实时动态监测、克服肿瘤异质性等优势[6],曾被MIT《科技评论》杂志评选为“2015年十大突破技术之一”,还被世界经济论坛与《科学美国人》杂志联合评选为“2017年度全球十大创新技术之首”。 这种快速、简便、无创的检测技术在当时被认为是未来极具潜力的肿瘤早筛早诊工具。现在,未来已至,随着国内外多家Biotech公司积极布局肿瘤早筛赛道,液体活检在肿瘤早筛中的应用研究正在如火如荼地开展当中。 图1. 乳腺癌中不同分期下血液cfDNA中肿瘤来源ctDNA含量[7] 液体活检的肿瘤标志物主要包括基因组、表观遗传学、转录组、微生物组、蛋白组和代谢组等层面。肿瘤标志物在ctDNA层面的特征主要包括点突变、片段化、拷贝数变异、甲基化等维度。 1 突变特征 2 甲基化特征 3 片段组学特征 拷贝数变异一般指长度为1kb以上的基因组大片段的拷贝数增加或减少,包括拷贝数变化(染色体臂的增加和丢失)以及由易位、扩增或缺失引起的重排。基因组拷贝数的异常通常会导至基因表达的改变,影响基因的正常功能,如拷贝数增加会引起ERBB2、MET等原癌基因的过表达,拷贝数缺失会导至TP53、RB1、BRCA1等抑癌基因的失活,进而导至细胞癌变[14]。近年来,人们发现血浆DNA断裂并不是一个随机的过程。血浆cfDNA通常有一个显著的167bp的峰值分布,这主要与cfDNA形成机制有关:基因组DNA大约每147bp盘绕一个核小体,另外20bpDNA作为2个核小体之间的连接,在细胞凋亡的时候,DNA以每167bp进行剪切并被释放到血液中。有研究发现,癌症患者的血浆中cfDNA峰值分布更短,且与患者分期有一定联系,尤其对于高ctDNA水平的癌种:包括乳腺癌、黑色素瘤、卵巢癌、肺癌等患者的cfDNA片段显著更短[16]。由于血液中cfDNA的主要形式是受单个核小体保护的DNA,所以与甲基化模式类似,核小体定位变化也伴随着基因表达模式的转变,其在转录调控、DNA复制和修复等多种细胞过程及肿瘤发生发展中起着重要作用。因此肿瘤具有特有的核小体印记评分。核小体定位因细胞类型而异,因此也包含着cfDNA组织起源信息[13]。末端基序(Motif)被定义为血浆DNA末端的几个核苷酸,癌与非癌具有不同偏好的末端切割模式[15]。 综上所述,片段组学依托于WGS(Whole Genome Sequencing, 全基因组测序),靶点覆盖于全基因组学层面。 表2. 国内外各公司早筛技术路径 1 甲基化路径 DNA甲基化是肿瘤早筛中运用最成熟的特征之一,多家公司都采用了甲基化的技术路线,包括国内的燃石医学、泛生子、鹍远生物、基准医疗等公司,也包括泛癌种早筛技术的龙头老大:美国癌症早筛公司Grail。 Grail为了在自然人群中实现早筛,斥巨资启动了大型临床试验“循环游离基因组图谱研究”(Circulating Cell-free Genome Atlas,CCGA)。CCGA前瞻性多中心研究计划纳入超过15000例受试者(70%癌症患者,30%非癌症患者)并追踪5年,分析受试者cfDNA中的突变、拷贝数变异(CNV)、甲基化等基因组特征。2020年3月,Grail公布的数据表明,cfDNA靶向甲基化液体活检分析方法可区分多阶段的50多种癌症,包括缺乏筛查指南的高死亡率癌症和早期癌症,特异性>99%,单一假阳性率<1%。该检测对I–III期癌症的敏感性为43.9%,I–IV期敏感性为54.9%。在检测到癌症信号时,该检测还能以93%的准确度定位癌症的组织起源[17]。CCGA-3最新数据显示,在总体人群中,基于靶向甲基化技术的肿瘤早筛模型检测特异性高达99.5%,灵敏度为51.5%,肿瘤信号定位准确率为88.7%[11]。对于51.5%的灵敏度,一个问题是:在确保特异性的同时,如何进一步提升早期癌症的灵敏度? 2 多组学路径 “多组学”是肿瘤早筛,甚至肿瘤检测行业最热门的技术词汇之一。恶性肿瘤的发生涉及基因、表观遗传、转录组、微生物、蛋白和代谢等多个不同层次和不同维度的病理过程。如果只对单一组学的特征进行分析,会给靶点的筛选带来较大的局限性。而多组学特征整合分析一方面能够相互印证,增强检测结果的说服力;另一方面也能够多维度、全方位地捕捉癌症早期信号,提高灵敏度。 在多组学泛癌种方面,2018年Thrive Earlier Detection公司在Science上发表了CancerSEEK的研究结果。研究人员利用血浆ctDNA中的18个基因进行检测,同时通过质谱分析8种血浆蛋白markers,建立cfDNA+蛋白的双重预测模型。该预测模型入组了812例健康人,1005例癌症患者,覆盖8个癌种(肺癌、肝癌、胃癌、结直肠癌、胰腺癌、食管癌、乳腺癌、卵巢癌)。其灵敏度可达70%,其中I期、II期、III期的灵敏度分别为43%、73%和78%。肿瘤患者器官溯源预测的平均准确性为83%[20]。CancerSEEK研究与CCGA系列研究面临同样的问题:较低的I期肿瘤检测灵敏度应该如何解决?Thrive Earlier Detection于2020年被Exact Science收购,自此Exact Science也开始进军泛癌种早筛这个“明珠”领域。 3 NGS片段组学路径 提高肿瘤早筛灵敏度的方向之一,即可以加入多种其他组学维度的信息,也可以利用全基因组学测序(WGS),在基因组层面本身寻找更多的信号。DNA片段组学技术异军突起,在多项研究数据中均表现出优异的预测效能,为多癌种的早筛提供了新的研究方向。 如果采用已知突变作为区分肺癌的特征,特征数量大约在102左右,测序深度需要达到30,000x;如果采用已知的甲基化作为区分特征,特征数量大约在103左右,测序深度需要达到130-1000x[8],这些已知固定化的特征Panel都只能代表肿瘤特征的拼图一角,无法阐明早期肿瘤的特征全貌。如果只聚焦基因组层面的某个特定区域或特征,对测序深度、样本量、样本多样性要求可能较高。基于全基因组测序的片段组学能够充分利用106数量级的肿瘤特征,信号更为丰富[16]。值得注意的是,一向采取甲基化技术路线的鹍远生物,在今年AACR poster的结果中展示了采用片段模式与突变检测联合的方式预测肺癌,其模型的AUC为0.87[22]。 4 技术路径的选择 技术上的不断突破是产业生态蓬勃发展的标志。对于场内玩家来说,“不管黑猫白猫,抓到老鼠的就是好猫”。但是在市场驱动下的技术研发,早筛产品最终能否被市场长期接受,不仅在于检测性能,更与成本控制和技术能否自我迭代息息相关。 图2.不同癌种血液中ctDNA的检出率 表3. 国内外大型研究主要发表情况 5 前瞻性研究 “实践是检验真理的唯一标准”,对于早筛技术来说,已有肿瘤早筛的相关研究显示,早筛技术的成熟落地均需经过真实世界的数据验证,需要大规模的前瞻性队列研究来验证该技术在预期筛查人群中的真实性、准确性和可靠性。因此大规模前瞻性队列研究是早筛技术进入广泛市场推广的前置条件,这对企业的资金储备水平、资源调配、临床管理能力都是不小的挑战。 表4. 国内外公司早筛前瞻性研究 |