精炼人工晶状体屈光力计算:使用跨层注意力和有效通道注意力的多模态框架
为人工晶状体 (IOL) 选择合适的度数对于白内障手术的成功至关重要。传统上,眼科医生依靠手动设计的公式(如“Barrett”和“Hoffer Q”)来计算 IOL 屈光力。然而,这些方法的准确性有限,因为它们主要关注眼轴长度和角膜曲率等生物识别数据,而忽略了揭示眼睛内部解剖结构的术前图像中的丰富细节。提出了一种新的深度学习模型,该模型利用多模态信息进行准确的 IOL 功率计算。
文章目录
Refining Intraocular Lens Power Calculation: A Multi-modal Framework Using Cross-Layer Attention and Effective Channel Attention
摘要
背景: 为人工晶状体 (IOL) 选择合适的度数对于白内障手术的成功至关重要。传统上,眼科医生依靠手动设计的公式(如“Barrett”和“Hoffer Q”)来计算 IOL 屈光力。然而,这些方法的准确性有限,因为它们主要关注眼轴长度和角膜曲率等生物识别数据,而忽略了揭示眼睛内部解剖结构的术前图像中的丰富细节。
目的: 提出了一种新的深度学习模型,该模型利用多模态信息进行准确的 IOL 功率计算。
方法: 为了解决光学相干断层扫描 (OCT) 图像中的低信息密度(即大多数区域的像素值为零)的问题,引入了一个跨层注意力模块,以充分利用分层上下文信息来提取全面的解剖特征。此外,传统公式给出的 IOL 幂被视为先验知识,有利于模型训练。
结果: 所提出的方法在由 174 个样本组成的自我收集的数据集中进行评估,并与其他方法进行了比较。实验结果表明,提出的方法明显优于竞争对手的方法,平均绝对误差仅为 0.367 屈光度 (D)。令人印象深刻的是,预测误差在 ± 0.5 D 以内的眼睛百分比达到 84.1%。此外,还进行了广泛的消融研究,以验证每个组件的贡献并确定与准确计算 IOL 屈光力最相关的生物识别参数。
代码地址
方法

图 1.不包含有效信息的哑窗口图示。红色和蓝色框是具有不同内核大小的滑动窗口,绿色区域是信息区域
图 2. 编码器中的两个分支分别处理生物识别数据和图像。圆圈中的“C”表示通道级特征连接。生物识别编码器的预测头将被删除,在推理过程中仅保留最终预测。
- 由于背景区域太多:用了大的卷积核,内核大小从 3 × 3 增加到 31 × 31
- 跨层注意力 (CLA) 模块来抑制不必要的特征
- 生物识别编码器:MLP
实验结果



更多推荐



所有评论(0)