通过机器学习,联合言语数字标志物和体液标志物可预测认知障碍
Speech digital biomarker combined with fluid biomarkers predict cognitive impairment through machine learning
【亮点】:
由王刚教授团队在《Alzheimers Research & Therapy》(IF=7.6)上发表语音数字生物标志物与血液生物标志物预测认知损伤与大脑病理变化的研究,并成功构建了高效、低成本的机器学习诊断模型。
1、基于宇测超灵敏单分子免疫检测技术;
2、首次在大规模人群中验证了语音沉默时间占比(PSD)与阿尔茨海默病核心血液生物标志物(GFAP、NfL、p-Tau217)及脑内Aβ沉积具有相关性;
3、认知损伤诊断模型:结合年龄、性别、教育年限、APOE基因型、PSD和血清GFAP,模型诊断认知损伤的AUC达0.928;
4、Aβ状态预测模型:结合PSD、APOE、P-tau217和人口学信息,模型预测PET Aβ 阳性状态的AUC达0.845
5、提出“语音+血液生物标志物”的整合筛查策略,兼顾可及性、成本效益与准确性,有望推动AD早期筛查在基层医疗中的应用。
【摘要】:
背景:
目前阿尔茨海默病(Alzheimer’s disease,AD)早期检测的方法受限于高成本、侵入性强以及可及性不足,这凸显了迫切需要一种可获得、可负担且对患者友好的替代途径。既往研究表明,语音分析是认知障碍(cognitive impairment,CI)早期诊断的有前景工具。然而,语音测试与潜在病理变化之间的相关性仍未确定,甚至尚不清晰,其临床应用价值也缺乏病理学验证。因此,需要通过大样本分析进一步探讨二者之间的关系,并建立能够诊断认知障碍的模型。
方法:
本研究共纳入1223名受试者,包括可能的AD或AD患者(n=238)、遗忘型轻度认知障碍(amnestic mild cognitive impairment,aMCI)患者(n=461)以及认知正常者(cognitively unimpaired,CU)(n=524)。所有参与者均接受了神经心理学测试、“偷饼干”任务的语音录制、血清生物标志物定量检测和APOE基因分型,其中部分受试者还接受了Aβ PET成像。采用偏相关分析(Partial Correlation Analysis)和局部加权回归(LOWESS)探讨语音数字生物标志物与其他核心AD生物标志物之间的相关性。最后,利用机器学习方法(如XGBoost和逻辑回归)构建了认知障碍及Aβ状态的高性价比预测模型,并通过SHAP值进行特征重要性筛选。
结果:
不同组别之间的AD生物标志物存在显著差异。值得注意的是,语音数字生物标志物中的静默持续时间百分比(percentage of silence duration,PSD)与认知水平、血清胶质纤维酸性蛋白(glial fibrillary acidic protein,GFAP)、神经丝轻链蛋白(neurofilament light chain,NFL)、磷酸化Tau蛋白217位点(p-Tau217)以及特定脑区的淀粉样蛋白沉积呈相关关系。此外,研究发现随着Aβ沉积不同阶段的进展,PSD、p-Tau217和GFAP表现出双阶段变化模式。基于上述结果,构建了一个包含PSD、APOE、GFAP及人口学信息的认知障碍机器学习诊断模型(AUC=0.928,95% CI 0.897–0.960)。同时,还建立了一个结合PSD、APOE、p-Tau217及人口学数据的Aβ状态分类模型(AUC=0.845,95% CI 0.783–0.907)。
结论:
将语音数字标志物与血清及其他生物标志物相结合,有助于识别认知障碍,代表了AD检测领域的一个有前景的进展。本研究为语音数字生物标志物在AD诊断中的应用提供了初步且令人鼓舞的证据。