导师:少见,GBD也能联合机器学习了?看看人家暨南大学是怎么发文一区top的...
引言发文可别卷错方向了,看看GBD数据库+机器学习这条崭新的发文赛道!今天分享的这篇文章,中国学者基于GBD数据,构建了XGBoost模型,用其预测碘缺乏症到2050年的疾病负担,并使用SHAP法对该模型进行解释,拿下IF=8.0!接下来让我们一起来看看今天这篇文章。碘缺乏症(ID)是指从胚胎发育至成人期由于碘摄入量不足而引起的一系列病症,可能导致甲状腺肿大、认知障碍等严重后果。准确预测未来趋势.
引言
发文可别卷错方向了,看看GBD数据库+机器学习这条崭新的发文赛道!今天分享的这篇文章,中国学者基于GBD数据,构建了XGBoost模型,用其预测碘缺乏症到2050年的疾病负担,并使用SHAP法对该模型进行解释,拿下IF=8.0!
接下来让我们一起来看看今天这篇文章。
碘缺乏症(ID) 是指从胚胎发育至成人期由于碘摄入量不足而引起的一系列病症,可能导致甲状腺肿大、认知障碍等严重后果。
准确预测未来趋势对制定干预策略至关重要,但传统模型难以捕捉动态变化。因此,本研究引入机器学习方法,探索ID的长期演变规律。
2025年2月4日,暨南大学学者用GBD 2021数据库,在期刊《Advances in Nutrition》(医学top一区,IF=8.0)发表题为:“Global Burden of Iodine Deficiency: Insights and Projections to 2050 Using XGBoost and SHAP”的研究论文。
在本研究中,研究团队分析了1990年至2021年,碘缺乏症(ID)全球和区域负担的趋势,并使用XGBoost模型预测了到2050年的疾病负担。此外,还进一步采用SHAP法确定影响ID发病的关键因素。

本公号回复“ 原文”即可获得文献PDF等资料
研究团队基于GBD 2021数据库的数据,获得了1990年至2021年204个国家和地区碘缺乏症(ID)的发病率、患病率和伤残调整生命年(DALYs),用于评估碘缺乏症的全球负担。
结果显示,在过去三十年里,虽然ID负担总体下降,但由于社会经济条件差和教育有限等原因,撒哈拉以南非洲中部、东部以及南亚等低SDI地区的ID负担仍然很高。

图1 1990年和2021年,ID的全球负担
同时,由于碘的摄入与甲状腺激素的分泌密切相关,而女性的甲状腺激素需求更高,ID负担也就更重!尤其在10-30岁的年轻女性群体中,发病率比男性高出近一倍。

图2 不同年龄、时期和出生队列对ID全球负担的影响
以性别、年龄、年份和人口规模为预测因子,研究团队构建了原始的XGBoost模型,预测ID的发病率、患病率和DALY率,其结果与GBD 2021数据库的结果一致,表明了模型的准确性。
原始的XGBoost模型预计到2050年,撒哈拉以南非洲中部、东部以及南亚的ID负担仍最高,同时女性的ID负担也显著高于男性。
SHAP法对该模型的分析揭示,性别、年龄是ID负担的关键危险因素,其中女性和年轻人群是ID的高危人群。

图3 原始的XGBoost模型中特征的SHAP法分析
同时,为了探究碘盐覆盖率对ID负担的影响,研究团队以性别、年龄、碘盐覆盖率和人口规模为预测因子,进一步了构建基于碘盐覆盖率的XGBoost模型,数据来源于世界卫生组织(WHO)中66个国家的碘盐覆盖率数据。
进一步的SHAP法分析揭示,足够的碘盐覆盖率是降低ID负担的核心因素,不过阈值因地区而异(如刚果民主共和国需覆盖77%,而埃塞俄比亚只需覆盖50%即可)。

图4 1990年、2021年碘盐覆盖率与ID年龄标准化发病率、 年龄标准化患病率的关联

图5 刚果、刚果民主共和国和埃塞俄比亚的碘盐覆盖率与ID发病率的SHAP依赖图
综上所述,研究团队确定了年龄、性别和碘盐覆盖率是碘缺乏症的关键危险因素,其中年轻女性是高危人群。并且未来几十年内,碘缺乏症将继续对发展水平较低的国家构成威胁,比如撒哈拉以南非洲中部、东部以及南亚地区。
机器学习联合公共数据是目前发文的热门方向,但机器学习联合GBD数据的文章,确实少见!想要发文的小伙伴可要抓紧了!
如果你想要解锁更多GBD的优秀选题,郑老师团队的一对一GBD统计服务绝对是不二之选!此外,想了解更多机器学习内容的朋友,郑老师也提供相应的机器学习课程!
欢迎关注“公共数据库与孟德尔随机化”公众号,我们将持续分享GBD数据库的优秀文章,并解读前沿思路!
关于郑老师团队及公众号
大型医学统计服务公众号平台,专注于医学生、医护工作者学术研究统计支持,我们是你们统计助理
我们开展对临床预测模型、轨迹增长模型、医学免费数据库NHANES、GBD数据库、孟德尔随机化方法1对1R语言指导(一年内不限时间,周末、晚上均统计师一对一指导)。
①指导学习R语言基本技巧
②全程指导课程学习
③课程R语言代码运行bug修复
④支持学员一篇SCI论文的数据分析
详情联系助教小董咨询(微信号aq566665)

更多推荐


所有评论(0)