【论文推荐|滑坡检测·空间预测·时间预测· 数据驱动的分析】机器学习在滑坡研究中的最新进展与应用(2022)(十)
【论文推荐|滑坡检测·空间预测·时间预测· 数据驱动的分析】机器学习在滑坡研究中的最新进展与应用(2022)(十)
【论文推荐|滑坡检测·空间预测·时间预测· 数据驱动的分析】机器学习在滑坡研究中的最新进展与应用(2022)(十)
【论文推荐|滑坡检测·空间预测·时间预测· 数据驱动的分析】机器学习在滑坡研究中的最新进展与应用(2022)(十)
文章目录
欢迎铁子们点赞、关注、收藏!
祝大家逢考必过!逢投必中!上岸上岸上岸!upupup
大多数高校硕博生毕业要求需要参加学术会议,发表EI或者SCI检索的学术论文会议论文。详细信息可关注VX “
学术会议小灵通”或参考学术信息专栏:https://blog.csdn.net/2401_89898861/article/details/145551342
论文地址:https://doi.org/10.1007/s11069-022-05423-7
6 讨论
6.1 使用机器学习(ML)进行滑坡研究的目标
- 机器学习(ML)算法的主要目标是进行准确预测,而解释性通常是次要目标。因此,滑坡研究中的ML方法应用应集中在预测需求大于解释和理解的领域。
例如,滑坡预警系统需要基于监测数据流在有限时间内做出决策;而滑坡检测则可能涉及需要大量时间和人力收集详细实地数据的场景(Mondini等,2011)。当滑坡研究的目标是深入理解过程时,ML的直接应用可能不太有用,但在这些情况下,ML所检测到的特征(例如滑坡空间预测中影响因素的重要性)也有助于理解滑坡过程。未来,ML方法在插值为主要目的时更为有用,即机器已从大量数据中学习,新场景位于现有数据空间内(具有相似统计分布)。若新场景超出现有数据空间,即为外推问题,ML方法可能表现不佳。
6.2 机器学习(ML)与深度学习(DL)算法
- 在滑坡研究中,并没有共识认为某一种“最佳”的ML/DL算法,即使在最新的滑坡检测或时空预测比较研究中也是如此。文献中越来越多地提出对同一研究区域系统性使用算法集成的方法,不仅包括传统的集成ML算法(如随机森林),还涉及多种不同的ML算法,并选择表现最好的算法。
Ghorbanzadeh等(2019b)和Prakash等(2020)在滑坡检测研究中指出,传统ML算法与DL方法的比较表明,算法选择面临所谓的“无免费午餐定理”,即没有单一的“最佳”算法,因为所有算法的平均表现基本相同(Wolpert,1996)。
- 选择使用传统ML算法还是DL算法主要取决于数据的类型和数量。一般而言,如果训练数据量不大,DL算法不太可能优于传统ML算法。
例如,在滑坡空间预测研究中,已知滑坡位置的历史信息通常相较于滑坡易感性研究区的范围较少。特征数量、属性以及特征工程的偏好也会影响这一选择。我们建议,对于结构化数据,应优先选择传统ML算法,而对于非结构化数据(如文本、视频、图像等),由于特征工程的复杂性,DL算法可能更为合适。
6.3 机器学习/深度学习库的可用性
- 对于哪些方法可以被正确称为机器学习(ML)算法尚无共识,一些经典的推断统计方法(如各种类型的逻辑回归或判别分析)通常也被视为ML算法。在滑坡领域及其他应用科学和工程中,普遍倾向于使用现成的、已在开源库中实现的算法。
Python库,如Scikit-learn用于传统ML,TensorFlow、Keras和PyTorch用于DL算法,都是常用的选择。
- 一个可能的弊端是,长期依赖这些现成算法可能导致滑坡领域的ML素养不足,因为研究人员没有深入实现和理解这些算法,容易导致误用或盲目试错。
例如,在许多滑坡研究中,研究者通常使用ML算法的默认超参数或通过试错法选择它们。此外,许多基于DL的滑坡研究中,DL框架的架构未被充分解释,也缺乏对为何某些架构优于其他架构的深入理解。
- 另一个弊端是,研究人员可能需要等待相当长时间才能出现适合滑坡研究的新算法。
6.4 数据可用性
- 数据驱动方法,如ML算法,在缺乏必要数据的情况下无效。
- 在滑坡检测和易感性制图等领域,由于有公开的卫星图像可用,数据可用性问题较小。
- 然而,在进行时间预测时(例如基于地面传感器或InSAR数据的预测),高质量的数据通常不可自由获取,这无疑限制了ML算法的应用。
- 然而,随着遥感数据的不断增加和遥感领域竞争的加剧,预计这种限制在不久的将来将得到克服。
- 专门用于ML滑坡研究的数据集可能会显著改变当前的滑坡位移预测方法。
可在https://www.paperswithcode.com/datasets找到已存在的ML领域数据集。
6.5 代码可用性
本研究回顾的大多数研究未公开使用的计算机脚本。在快速发展的ML社区中(见https://paperswithcode.com/),脚本和数据的可用性是评估研究可信度的重要标准。可以认为,滑坡ML文献中的这种知识不透明性将妨碍这些研究的实用性,因为即使研究人员能访问原始数据,在大多数情况下也无法复现这些研究。
下节请参考:【论文推荐|滑坡检测·空间预测·时间预测· 数据驱动的分析】机器学习在滑坡研究中的最新进展与应用(2022)(十一)
更多推荐



所有评论(0)