引言

公共数据库联合机器学习组合,真的是全面的发文思路!选对数据库,更是能让我们的研究更进一步。而今天分享的这篇文章,学者就选择国产数据库CHARLS,拿下一区Top(IF 8.5)。

快来一起看下去吧!

心血管-肾脏-代谢(CKM)综合征通过代谢异常、慢性肾病与心血管疾病(CVD)的复杂交互作用,显著加剧了多器官功能障碍及不良CVD事件风险。

最新研究发现,基于腰围、血压和糖化血红蛋白的胰岛素抵抗(IR)指标——估算葡萄糖处置率(eGDR),在预测CKM患者心血管事件中表现卓越,甚至超越传统指标。

2025年4月16日,安徽医科大学学者用CHARLS数据库,在期刊Cardiovascular Diabetology(医学一区Top,IF=8.5)发表了一篇题为:“Estimated glucose disposal rate outperforms other insulin resistance surrogates in predicting incident cardiovascular diseases in cardiovascular-kidney-metabolic syndrome stages 0-3 and the development of a machine learning prediction model: a nationwide prospective cohort study”的研究论文。

该研究通过全国性前瞻性队列数据,比较eGDR与其他六种IR指标(TyG、TyG-WC、TyG-BMI、TyG-WHR、TG/HDL-C、METS-IR)对CKM综合征患者CVD事件的预测能力。同时,通过七种机器学习模型(如KNN、XGBoost、随机森林等)评估eGDR对预测性能的提升作用。

本公号回复“ 原文”即可获得文献PDF等资料,如需CHARLS等老年健康数据库挖掘请联系郑老师团队,微信号:aq566665

研究团队使用了中国健康与退休纵向研究(CHARLS)数据库2011~2012年的数据,经过纳排,最终纳入了4,950名年龄≥45岁符合条件的参与者,平均年龄为73.46岁,50.4%为女性。

  • 在2011~2018年的随访期间,697名参与者发生CVD事件,其中486名患有心脏病,263名患有中风。

figure 1

图1 研究流程

研究结果显示,eGDR在预测CKM综合征0-3期患者发生CVD事件方面优于其他6个IR指数,其与CVD事件发生风险均呈线性负相关。

具体而言,eGDR水平每增加1个单位,CVD、心脏病和中风的风险分别降低 14%、14% 和 19%。

图2 7项IR替代指标对CKM综合征0-3期患者CVD事件的预测价值

表1 多因素Logistic回归分析

√机器学习模型预测CVD事件

研究团队将数据集按照7:3的比例随机分为训练集和测试集,用于模型开发和验证。

同时使用LASSO算法进行特征选择,筛选出高血压和糖尿病等6个关键变量,构建了七个机器学习模型(AdaBoost、KNN等)。

其中,KNN的预测性能最佳。

图3 基于LASSO算法的特征筛选

研究团队进一步将eGDR纳入该模型中,结果显示,结合eGDR的KNN模型在测试集中AUC=0.931。

这意味着,将eGDR纳入预测模型能够显著提高对CKM综合征0-3期患者发生CVD事件的预测性能。

图4 结合eGDR的KNN模型的ROC曲线

综上所述,在CKM综合征0-3期患者中,eGDR展现出对CVD事件的优越预测价值,其与风险呈线性负相关,且通过机器学习模型可显著提升风险分层能力。研究支持将eGDR纳入临床风险评估工具,以早期识别高危个体并指导干预。

广告time

相对NHANES等火爆的公共数据库,CHARLS目前的研究空间还很大。联合机器学习就是一个挺新颖的发文组合,各位可以尝试一下。

如果你对CHARLS数据库数据挖掘以及选题等处于探索迷茫阶段,郑老师团队推出的一对一指导课程,专业统计师在线指导,这些难题统统解决!

感兴趣的朋友可扫描下方二维码咨询!

记得点个小小的关注👇

我们将为您分享更多公共数据库的高分发文思路和统计小技巧!

Logo

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区,共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐