🌞欢迎来到AI环境的世界 
🌈博客主页:卿云阁

💌欢迎关注🎉点赞👍收藏⭐️留言📝

🌟本文由卿云阁原创!

🌠本阶段属于练气阶段,希望各位仙友顺利完成突破

📆首发时间:🌹2025年3月23日🌹

✉️希望可以和大家一起完成进阶之路!

🙏作者水平很有限,如果发现错误,请留言轰炸哦!万分感谢!


目录

数据采集与融合

模型构建与预测

污染源追踪与评估

智能决策与预警

持续优化与绿色AI

综述

数据采集与融合

       传统空气质量监测主要依赖固定监测站,而AI技术可以整合来自地面传感器、卫星遥感、气象

站、交通数据等多源信息,构建一个更全面、实时的数据网络。通过数据融合,AI能“看得更远”,

捕捉到区域内甚至城市间的细微污染变化​。


模型构建与预测

        利用机器学习、深度学习、甚至最新的Transformer模型,AI能够从大量历史数据中学习污染

物浓度与气象、地理、交通等因素之间的复杂非线性关系。这些模型可以实现短期或中长期空气质

量预测,帮助预警雾霾、PM2.5、NOx等污染物浓度的异常变化​。

通过多模态 AI 和卫星图像预测空气质量

文章:链接

https://doi.org/10.1016/j.rse.2023.113609

     研究者已经利用神经网络和集成学习方法,实现了高精度的空气质量预报,预测误差大幅降

低,且计算效率大大提升。

文章:链接


污染源追踪与评估

      AI不仅用于预测,还能通过反演算法更新污染源排放清单。利用集合卡尔曼滤波、集合最优插

值等方法,实时“逆推”污染源数据,找出主要污染排放点和异常来源,从而为污染治理提供精准

依 据。这种方法能大幅降低计算量,实现实时更新,提升空气质量模拟与预报精度​。


智能决策与预警

      基于AI预测结果,政府和环保部门可以及时发出预警、调整交通管控、优化工业排放措施,甚

至指导公众合理安排户外活动。此外,结合移动应用,公众也能实时查询空气质量指数(AQI)、

主要污染物浓度等信息,提升整体环境应急响应能力​。

持续优化与绿色AI

      随着硬件能效提升和数据中心绿色转型,AI技术将更加环保。算法的不断迭代(如模型剪枝、

知识蒸馏等)也会使预测模型既高效又节能,为可持续环境管理提供长期支持。


综述

文章:链接

         深度学习作为机器学习的一个子领域, 是一种功能强大且更适合大数据的机器学习方法. 深度

学习模型通过模仿人脑的机制对图像、声音、文本等数据进行处理, 并展现出巨大潜力. 同样, 空气

质量预测作为领域内的研究热点, 深度学习也已经取得不俗的成果. 目前有关空气质量预测的深度模

型主要有两种: 以RNN、LSTM (long short term memory)[46]等时间深度网络为主要组成部分对

时间信息建模的空气质量预测和通过DNN、CNN等网络加入空间信息的考虑时空信息的空气质量

预测. 除此之外, 以注意力机制为首的新兴深度学习方法也在逐渐应用于此领域, 具体表述如下.

考虑时间信息的空气质量预测

      考虑时间信息的空气质量预测往往把空气污染数据看成一维时间序列或一维时间信号, 通过一

定的预处理方式如离散傅里叶变换(discrete Fourier transform, DFT)[47]、小波变换(wavelet

transform, WT)[48]等将数据分解或平稳化, 最后将处理好的数据通过深度学习模型提取时间特征并

输出预测结果. 最常用于该过程的深度模型主要包括RNN、LSTM、GRU (gated recurrent neural

network)[49]及1D CNN等.

 Zhang等[50]提出一种结合变分模态分解(variational mode decomposition, VMD)[51]与双向长短期

记忆网络(BiLSTM)[52]的一种混合深度学习模型VMDBiLSTM, 用于实现基于时间数据对北京站点

的PM2.5预测. 所研究的时间序列通过VMD方法将原始的PM2.5数据自适应地分解为几个子信号分

量, 降低了原有数据的波动性与非线性从而实现了数据的平稳化. 该模型采用BiLSTM分别对各分量

进行预测, 显著提高了预测精度. 实验结果表明, BiLSTM可以有效地从时间序列数据中提取特征, 对

于非线性且非平稳的PM2.5数据, 考虑使用VMD等信号处理方法, 可以大大提升预测性能.

      丁子昂等[53]提出一种基于互补集合经验模态分解方法-皮尔逊相关分析(complementary

ensemble empirical mode decomposition, CEEMD)[54]及LSTM的一种PM2.5预测方法, 使用

CEEMD方法对时序数据分解并筛选, 最后输入到深度网络进行训练并输出预测结果, 该模型在真实

数据集中获得了90%以上的预测精度, 结果表明CEEMD方法可以挖掘历史数据的隐藏特征, 增强数

据的时序性, 可以使LSTM网络获得最佳训练效果, 有效地进行PM2.5预测.

     Jin等[55]研究提出一种结合多嵌套长短期记忆网络(multiple nested long short term memory

networks, MTMC-NLSTM)的新型深度学习框架, 采用小波变换将原始数据分解为去噪低频分量和

高频分量, 分别提取出数据的总体模式特征与短期特征, 将处理后的数据输入到NLSTM[56]中输出

北京12个站点的AQI值预测结果, 结果表明该框架在多元空气质量时间预测中具有显著的优势, 且由

于训练时间较短, 几乎可以实时跟进实际的AQI值.

     Tao等[57]结合1D CNN与双向门控循环单元网络(BiGRU)提出一种基于深度学习的PM2.5预测方

法(CBGRU), 该模型结合卷积神经网络和循环神经网络的时间预测能力, 通过CNN对数据下采样减

少数据的复杂性, 并使用BiGRU挖掘时间信息特征输出预测结果. 孙蒙等[58]基于DBN和差分进化算

法对北京地区气象与AQI数据建立预测模型(DE-DBN), 使用基于BP神经网络和统计的网络模型的预

测结果作为对比. 结果表明深度网络模型比起传统的统计模型, 机器学习方法具有更好地预测水平,

寻优算法可以有效优化深度学习模型. Retta等[59]比较了LSTM、GRU、Conv-LSTM[60]等网络对

PM2.5时间序列的序列学习和预测能力, 实验结果发现时间卷积网络(temporal convolutional

networks, TCN)[61]在单变量时间序列处理中也具有和LSTM、GRU相似的性能.

考虑时空信息的空气质量预测

     由于空气污染数据的时空特性, 在深度模型中加入空间信息往往可以提高预测的精准度[62], 因

而现在大部分的空气质量预测深度学习模型都会同时对数据的空间和时间依赖性进行建模. 对空间

模型建模的深度网络主要有DNN、CNN等, 图神经网络(graph neural networks, GNN)[63]以及引入

卷积操作的GNN图卷积神经网络(graph convolutional network, GCN)[64]也是近年较为流行的空间

信息建模的深度学习模型. 现有的考虑时空信息的模型主要有CNN-LSTM、CNN-GRU、GCN-LSTM等.

    Wu等[65]提出一种名为多尺度空间时间网络(multi-scale spatial temporal network, MSSTN)的新

的深度卷积神经网络模型, 该网络分为3个子网, 扩张卷积网络来提取时间尺度的特征, 图卷积网络

用来提取空间特征, 融合网络用于特征融合输出预测结果, 通过3个网络的分工可以更好地发现多尺

度时空模式特征及区域间的相互作用. 实验结果表明对空间关系以及站间关系的建模可以大大提升

预测的精准度.

Han等[66]提出了多对抗时空递归图神经网络(multi-adversarial spatiotemporal recurrent graph neural networks, MasterGNN)用于联合空气质量和天气预测. 他们提出一种模拟空气质量与监测站之间时空自相关关系的递归图神经网络, 通过对抗图学习框架来对抗时空建模引入的噪声. 为了更好地训练网络, 他们将多对抗学习作为一个多任务学习问题, 自适应的训练. 实验结果表明, 图神经网络与对抗学习的结合可以有效提升预测精度, 该网络在空气质量与天气预测的任务上优于其他先进的方法.

     Huang等[67]提出一种名为空间注意力嵌入式循环神经网络(spatio-attention embedded

recurrent neural network, SpAttRNN)的AQI预测模型, 对于每个空气监测站分别输入时间特征和空

间特征, 通过综合利用监测站之间的动态时空相关性进行预测. 该方法引入归一化邻接矩阵, 矩阵包

含目标站与其他站点的地理距离及几何关系, 通过注意力矩阵表示观测站之间的重要相关性, 完成对

空间相关性的建模. LSTM用来对来自目标站点的原始时间特征进行编码. 注意力矩阵与LSTM连接

输出预测结果, 完成预测任务. Yeo等[68]使用5层CNN架构和3层GRU模型来生成首尔地区25个站点

的PM2.5实时预测, 通过多层模型提高深度学习模型的计算效率. 同时, 本研究还提出一种地理模型,

可以确定提高目标站点预测准确性所需相邻站点的最佳数量.

      Ge等[69]提出一种多尺度时空图卷积网络(multi-scale spatiotemporal graph convolution

network , MST-GCN), 该网络由一个多尺度模块以及几个时空模块组成, 最后用一个融合模块融合

多个组. 为了对空间以及长时间依赖性进行建模, 其中的时空模块包含一个图卷积层和一个时间卷积

层. Lin等[70]通过基于地理上下文的扩散卷积递归神经网络(geo-context based diffusion

convolutional recurrent neural network, GC-DCRNN)对短期PM2.5进行预测, 该网络通过地理环境

相似性的图形来描述空间关系, 其中相似性根据每个位置对空气质量影响的重要性计算, 该实验在两

个真实空气质量数据集中证明了有效性.

 基于注意力机制的空气质量预测

        近年来, RNN、LSTM等循环结构网络模型已经在序列预测、自然语言处理等应用中获得了不

俗的效果, 但由于RNN固有的顺序框架使得训练样本无法并行化, 所以在长时间序列的批量处理中

往往会受到内存的限制, 注意力机制(attention model)[71]源于人类视觉注意力, 注意力模型可以应

用于任何类型的输入而不管其形状如何, 可以解决RNN等网络常常出现的计算资源分配不均问题,

因而逐渐成为深度学习领域最热门的模型之一. Transformer[72]是基于自注意力机制(self-attention)

的全新神经网络架构, 比起常规的RNN等网络, Transformer拥有更高的预测质量却仅需要较少的算

力, 作为一个纯注意力机制模型, 结合了多头注意力机制(multi-head attention)与残差模块, 并加入了

位置编码(position embedding, PE)来表示序列中元素的相对或绝对位置关系, 完全依赖于自注意力

机制对全局关系建模, 可以更好地学习远程依赖性, 更重要的是, 可以并行计算从而充分利用GPU资

源. Transformer在自然语言处理和计算机视觉领域已经大放异彩, 在处理时间序列数据时, 同样可以

取得不错的成果[73]. Informer[74]是基于Transformer, 专为长时间序列预测设计的模型, 有效解决了

Transformer在内存使用量, 时间复杂度的一定局限性, 打破了编解码器结构的固有限制, 模型具有较

强的解决长距离依赖问题的能力, 可以很好地解决空气质量预测在时间跨度较长时无法获得满意的

结果的问题.

       Wang等[75]将北京与天津各空气预测站点之间的空间邻接关系、时间模式相似性以及功能相

似性编码到图中, 提出了一种注意时间图卷积网络(attentive temporal graph convolutional network,

ATGCN), 该网络通过并行编码块将图卷积操作合并于GRU中, 利用注意力单元最终在解码模块输出

所有站点的多步预测. 结果表明, 图卷积网络可以聚合站点间的特征, 达到更好的预测效果. Padhi等[

76]基于Transformer提出一种层次表BERT (bidirectional encoder representations from

Transformers)[77]来学习表格时间序列, 通过学习到的编码层来预测空气污染浓度, 并在真实数据集

中证明了有效性.

      Wang等[78]提出一种加入注意力机制的混合序列到序列空气质量预测模型, 用于预测区域地面

臭氧浓度. 该模型通过序列到序列注意力模型(attention-based Seq2Seq)[79]提取输入的原始数据

以及辅助数据的时间依赖, 同时使用深度网络提取网络中的空间信息, 最后通过DNN将时间与空间

模型结合输出预测结果. 实验说明考虑预测模型的时空相关性对于区域臭氧的预测具有显著的优势.

      近年来, 使用深度学习进行空气质量预测的技术已经越来越成熟, 但仍存在着大量的挑战阻碍了

研究的进展, 笔者总结了空气质量预测面临的挑战以及如何应对将挑战转换为未来的发展方向, 内容

主要如下.

(1)数据集的片面性与稀疏性. 数据集的综合性与全面性一直是深度学习研究的一个重要影响因素,

虽然各地区逐渐建立起大量的空气质量监测站, 但如今尚未有一个包含空气污染数据与气象数据、

交通情况、海拔高度等全面的大型数据集, 而且由于空气质量预测的研究往往需要足够的历史数据

集, 而因为时间的久远, 数据中往往有大量的缺失值, 数据较为稀疏, 必须在数据预处理阶段对数据

进行填充, 难免会影响到预测结果, 因此需要探索一种能够克服或减轻新建站点数据短缺问题的预测

模型. 迁移学习(transfer learning)[8182]的主要思想是将相关领域的标注数据或知识结构迁移来改

进目标任务的学习效果, 在深度学习中往往表现为冻结预训练模型的部分网络层, 只训练自己的全连

接层. 迁移学习可以很好地解决空气质量预测训练成本较高, 数据集较小的问题. Ma等[83]提出了一

个基于迁移学习的堆叠双向长短期记忆网络(transfer learning based stacked bidirectional long

short term memory, TLS-BLSTM), 通过将在已有站点对BLSTM层进行预训练并冻结, 然后使用新

站点的数据对剩下的网络层进行微调, 经过在安徽所有新的空气质量监测站的测试表明, 迁移学习可

以大大提升新站点的预测性能.

(2)训练成本问题. 现有的经典深度学习网络结构往往存在训练参数过多, 开销较大的问题, 而空气质

量预测由于其时效性, 快速而准确地预测十分重要, 如何在不影响网络性能的同时, 尽可能地减少训

练成本, 提高训练效率, 是目前亟待解决的关键问题. 动态神经网络(dynamic neural networks)[84]可

以根据输入数据动态自适应地调整自身的结构与参数, 可以有效地减少计算成本, 增加模型的通用性

和可解释性. 时间自适用动态网络(temporal-wise dynamic networks)[85]被设计用来对不同时间位

置的数据进行自适应计算, 可以从多方面减少冗余计算, 空气污染数据作为典型的时序数据可以与动

态神经网络有效结合从而减少计算量, 增加计算效率.

(3)如何挖掘空气质量监测站之间的深层关系. 现有的基于深度学习的空气质量预测模型通常旨在优

化特定预测任务的目标函数, 这些方法往往忽略了空气质量监测站之间潜在的非线性空间相关性, 如

何对相邻区域具有高相似性的监测站的特征信息进行信息共享是解决问题的关键. 多任务学习

(multi-task learning, MTL)[86]是一种将多个相关任务放在一起学习的一种机器学习方法, 显著提高

了学习的泛化效果. 优点是可以通过其相互作用帮助逃离单任务学习可能陷入的局部最小值, 且多个

相关的辅助任务可以提高主任务的预测性能[87]. 在空气污染预测中, 数据往往来源于具有很多相关

性的密集监测站点, 通过多任务学习可以实现任务间的信息共享以及特定信息的融合, 可以更好地准

确地预测空气污染物之间复杂的相互作用.

(4)增加不同特征输入. 空气污染数据往往受到多方面的影响, 例如, 高风速会降低PM2.5的浓度, 高

湿度通常会加重空气污染, 高大气压通常会导致良好的空气质量, 上述天气数据特征对空气质量预测

具有重要意义, 同样, 地理地形信息, 交通信息也会影响空气质量预测的结果, 未来可以探索结合卫

星、遥感图像或加入地形、POI信息等数据对空气质量预测的影响.

Logo

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区,共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐