几种深度学习模型所蕴含的信号处理思想
几种深度学习模型所蕴含的信号处理思想
(1)残差网络ResNet的设计有类似信号处理的“残差思想”。它的核心是让网络直接学习输入和输出的差异(残差),而不是直接拟合整个输出,就像信号处理中关注“变化部分”而非整体信号。通过跳跃连接传递原始信息(类似信号直通),避免信息在深层网络中衰减或失真,这种“保留原始信号+调整残差”的思路和滤波、噪声消除等信号处理技术有异曲同工之妙。
(2)分形网络是一种基于分形理论设计的网络结构,其核心思想是通过“自相似性”和“迭代生成”的特性,让网络的局部与整体在形态或功能上高度相似,从而高效处理复杂数据。例如,分形神经网络通过分层镜像结构(类似树的分支)同时捕捉不同尺度的信息,既能关注细节又能把握全局。
在信号处理中,分形思想主要体现在以下方面:
多尺度分析:分形网络可处理不同分辨率的信号,例如在图像压缩中利用自相似性减少冗余
噪声处理:通过分形维数区分信号与噪声,如SAR图像去噪时利用多重分形特征分离斑点噪声
特征提取:通过分形的递归特性增强对复杂信号(如语音、脑电波)的非线性建模能力
(3)Transformer的设计隐含了信号处理的逻辑,主要体现在以下三点:
自注意力机制 ≈ 动态滤波
每个位置的信号(如词或像素)通过计算与其他位置的“相关性权重”,类似信号处理中自适应滤波器,自动聚焦关键信息并抑制噪声(如过滤无关词)。
多头注意力 → 多频带分解
多个注意力头并行处理数据,类似将信号拆分成不同“频段”(如高频细节/低频轮廓),各自提取特征后再融合,增强多尺度分析能力。
位置编码 + 残差连接 ≈ 保留信号结构
位置编码为序列注入时序信息(类似信号的时间戳),残差连接直接传递原始信号(类似低通滤波保真),避免特征在深层网络中失真。
(4)Mamba是一种基于选择性状态空间模型的序列建模架构,被设计为Transformer的高效替代方案。其核心思想是通过动态调整模型参数,选择性关注或忽略输入中的关键信息,从而以线性时间复杂度处理长序列,解决了Transformer因二次方注意力计算导致的效率瓶颈。
Mamba是架构的三大核心思想:
选择性处理信息
曼巴的参数(如B、C、Δ)会根据输入内容动态变化,类似信号处理中的自适应滤波器,自动聚焦关键信号(如重要词汇)并过滤噪声(如无关词)。
硬件感知的高效计算
通过并行扫描算法和内存优化(如SRAM加速),曼巴在GPU上实现了接近线性的计算速度,类似信号处理中利用FFT(快速傅里叶变换)优化运算效率的思路。
递归与卷积的融合
曼巴既能像RNN一样递归处理序列(保留历史状态),也能像CNN一样并行训练,这种灵活性类似于信号处理中时域与频域的双重视角转换。
与信号处理的关联:
动态滤波:选择性机制让曼巴像滤波器一样,根据输入动态调整参数,保留有用信息(如语音中的关键音节)。
状态压缩:通过固定大小的隐藏状态压缩长序列上下文,类似信号压缩中的降维思想(如JPEG去除冗余)。
多模态处理:曼巴在音频、基因组数据上的高效建模,借鉴了信号处理中多尺度分析的方法(如小波变换)。
(5)生成对抗网络GAN的设计隐含信号处理的对抗性优化思想
生成器 ≈ 信号合成器
生成器通过输入噪声生成逼真数据(如图像或音频),类似信号处理中合成特定波形(如语音合成或图像重建),目标是让输出信号接近真实分布。
判别器 ≈ 动态滤波器
判别器判断输入是真实数据还是生成数据,类似信号处理中的自适应滤波器,通过不断调整参数区分噪声与有效信号(如去除图像伪影或音频杂音)。
对抗训练 ≈ 频谱博弈
生成器和判别器的对抗过程,类似信号处理中时域与频域的平衡优化——生成器试图在频域模仿真实信号的能量分布,判别器则在时域检测细节异常,最终通过博弈提升信号保真度。
(6)深度信念网络DBN的设计隐含了信号处理的分层思想。
逐层分解 ≈ 信号多尺度分析
每一层像“滤波器组”,从原始信号(如图像/声音)中逐步剥离不同抽象层级的特征——底层抓细节(如边缘/高频),高层抓全局(如形状/低频),类似小波变换的多级分解。
生成重构 ≈ 信号合成
通过多层反向生成数据,类似信号处理中从频域分量重建时域信号,但DBN用概率模型“拼装”出符合数据分布的合理结果(如去噪补全)。
无监督预训练 ≈ 特征提纯
逐层训练RBM(受限玻尔兹曼机)的过程,类似信号处理中对原始数据进行逐级滤波和降维,保留关键信息并过滤冗余噪声。
(7)深层自编码器的核心逻辑与信号处理中的压缩-重建思想高度契合:
编码器 ≈ 信号压缩器
通过多层网络将输入数据(如图像/声音)压缩成低维“精华编码”,类似JPEG或MP3压缩,去除冗余并保留关键特征(如轮廓/主旋律)。
解码器 ≈ 智能解压器
从压缩编码中重建原始信号,类似从频域恢复时域波形,但更注重语义保真(如补全图像缺失像素或修复语音断点)。
瓶颈层 → 降噪滤波器
强制网络在低维空间表达数据本质,类似信号处理中通过低通滤波抑制高频噪声,迫使模型聚焦主要模式而非细节干扰。
(8)深层玻尔兹曼机DBM的设计隐含了信号处理的概率建模思想:
逐层特征提取 ≈ 多尺度滤波组
每一层像“概率滤波器”,从原始信号中逐步剥离不同抽象层级的特征——底层捕捉细节(如纹理/高频噪声),高层整合全局模式(如物体轮廓/低频结构),类似信号的多分辨率分析。
能量函数 → 噪声与信号的博弈
通过能量函数评估数据的合理性,类似信号处理中马尔可夫随机场建模噪声分布,将噪声视为“高能量干扰”,学习过程中不断压低噪声能量、保留信号本质。
协同优化 ≈ 迭代式信号重建
各层神经元双向连接,上下层反复传递信息优化结果,类似信号处理中迭代去噪算法(如BM3D),通过多轮猜测与修正逼近真实信号。
(9)Deep Q-Networks(DQN)的设计隐含了信号处理的动态优化思想:
状态特征提取 ≈ 信号滤波
深度网络将环境状态(如游戏画面)逐层抽象为关键特征,类似信号处理中多级滤波器,剥离冗余细节(如背景噪声),聚焦核心信息(如敌人位置)。
经验回放 → 信号缓冲与降相关
存储历史交互数据并随机抽取学习,类似信号处理中时延对齐或噪声平滑,打破数据的时间关联性(如去除信号中的突发干扰)。
目标网络 ≈ 低通滤波稳参
通过独立的目标网络缓慢更新Q值目标,类似信号处理中的移动平均滤波,避免参数突变导致的估计震荡(如高频噪声抑制)。
知乎学术咨询(哥廷根数学学派):

担任《Mechanical System and Signal Processing》《中国电机工程学报》等期刊审稿专家,擅长领域:信号滤波/降噪,机器学习/深度学习,时间序列预分析/预测,设备故障诊断/缺陷检测/异常检测。
更多推荐


所有评论(0)