几种深度学习模型所蕴含的信号处理思想

哥廷根数学学派2023

1012人浏览 · 2025-05-24 19:40:01

哥廷根数学学派2023 · 2025-05-24 19:40:01 发布

（1）残差网络ResNet的设计有类似信号处理的“残差思想”。它的核心是让网络直接学习输入和输出的差异（残差），而不是直接拟合整个输出，就像信号处理中关注“变化部分”而非整体信号。通过跳跃连接传递原始信息（类似信号直通），避免信息在深层网络中衰减或失真，这种“保留原始信号+调整残差”的思路和滤波、噪声消除等信号处理技术有异曲同工之妙。

（2）分形网络是一种基于分形理论设计的网络结构，其核心思想是通过“自相似性”和“迭代生成”的特性，让网络的局部与整体在形态或功能上高度相似，从而高效处理复杂数据。例如，分形神经网络通过分层镜像结构（类似树的分支）同时捕捉不同尺度的信息，既能关注细节又能把握全局。

在信号处理中，分形思想主要体现在以下方面：

多尺度分析：分形网络可处理不同分辨率的信号，例如在图像压缩中利用自相似性减少冗余

噪声处理：通过分形维数区分信号与噪声，如SAR图像去噪时利用多重分形特征分离斑点噪声

特征提取：通过分形的递归特性增强对复杂信号（如语音、脑电波）的非线性建模能力

（3）Transformer的设计隐含了信号处理的逻辑，主要体现在以下三点：

自注意力机制 ≈ 动态滤波

每个位置的信号（如词或像素）通过计算与其他位置的“相关性权重”，类似信号处理中自适应滤波器，自动聚焦关键信息并抑制噪声（如过滤无关词）。

多头注意力 → 多频带分解

多个注意力头并行处理数据，类似将信号拆分成不同“频段”（如高频细节/低频轮廓），各自提取特征后再融合，增强多尺度分析能力。

位置编码 + 残差连接 ≈ 保留信号结构

位置编码为序列注入时序信息（类似信号的时间戳），残差连接直接传递原始信号（类似低通滤波保真），避免特征在深层网络中失真。

（4）Mamba是一种基于选择性状态空间模型的序列建模架构，被设计为Transformer的高效替代方案。其核心思想是通过动态调整模型参数，选择性关注或忽略输入中的关键信息，从而以线性时间复杂度处理长序列，解决了Transformer因二次方注意力计算导致的效率瓶颈。

Mamba是架构的三大核心思想：

选择性处理信息

曼巴的参数（如B、C、Δ）会根据输入内容动态变化，类似信号处理中的自适应滤波器，自动聚焦关键信号（如重要词汇）并过滤噪声（如无关词）。

硬件感知的高效计算

通过并行扫描算法和内存优化（如SRAM加速），曼巴在GPU上实现了接近线性的计算速度，类似信号处理中利用FFT（快速傅里叶变换）优化运算效率的思路。

递归与卷积的融合

曼巴既能像RNN一样递归处理序列（保留历史状态），也能像CNN一样并行训练，这种灵活性类似于信号处理中时域与频域的双重视角转换。

与信号处理的关联：

动态滤波：选择性机制让曼巴像滤波器一样，根据输入动态调整参数，保留有用信息（如语音中的关键音节）。

状态压缩：通过固定大小的隐藏状态压缩长序列上下文，类似信号压缩中的降维思想（如JPEG去除冗余）。

多模态处理：曼巴在音频、基因组数据上的高效建模，借鉴了信号处理中多尺度分析的方法（如小波变换）。

（5）生成对抗网络GAN的设计隐含信号处理的对抗性优化思想

生成器 ≈ 信号合成器

生成器通过输入噪声生成逼真数据（如图像或音频），类似信号处理中合成特定波形（如语音合成或图像重建），目标是让输出信号接近真实分布。

判别器 ≈ 动态滤波器

判别器判断输入是真实数据还是生成数据，类似信号处理中的自适应滤波器，通过不断调整参数区分噪声与有效信号（如去除图像伪影或音频杂音）。

对抗训练 ≈ 频谱博弈

生成器和判别器的对抗过程，类似信号处理中时域与频域的平衡优化——生成器试图在频域模仿真实信号的能量分布，判别器则在时域检测细节异常，最终通过博弈提升信号保真度。

（6）深度信念网络DBN的设计隐含了信号处理的分层思想。

逐层分解 ≈ 信号多尺度分析

每一层像“滤波器组”，从原始信号（如图像/声音）中逐步剥离不同抽象层级的特征——底层抓细节（如边缘/高频），高层抓全局（如形状/低频），类似小波变换的多级分解。

生成重构 ≈ 信号合成

通过多层反向生成数据，类似信号处理中从频域分量重建时域信号，但DBN用概率模型“拼装”出符合数据分布的合理结果（如去噪补全）。

无监督预训练 ≈ 特征提纯

逐层训练RBM（受限玻尔兹曼机）的过程，类似信号处理中对原始数据进行逐级滤波和降维，保留关键信息并过滤冗余噪声。

（7）深层自编码器的核心逻辑与信号处理中的压缩-重建思想高度契合：

编码器 ≈ 信号压缩器

通过多层网络将输入数据（如图像/声音）压缩成低维“精华编码”，类似JPEG或MP3压缩，去除冗余并保留关键特征（如轮廓/主旋律）。

解码器 ≈ 智能解压器

从压缩编码中重建原始信号，类似从频域恢复时域波形，但更注重语义保真（如补全图像缺失像素或修复语音断点）。

瓶颈层 → 降噪滤波器

强制网络在低维空间表达数据本质，类似信号处理中通过低通滤波抑制高频噪声，迫使模型聚焦主要模式而非细节干扰。

（8）深层玻尔兹曼机DBM的设计隐含了信号处理的概率建模思想：

逐层特征提取 ≈ 多尺度滤波组

每一层像“概率滤波器”，从原始信号中逐步剥离不同抽象层级的特征——底层捕捉细节（如纹理/高频噪声），高层整合全局模式（如物体轮廓/低频结构），类似信号的多分辨率分析。

能量函数 → 噪声与信号的博弈

通过能量函数评估数据的合理性，类似信号处理中马尔可夫随机场建模噪声分布，将噪声视为“高能量干扰”，学习过程中不断压低噪声能量、保留信号本质。

协同优化 ≈ 迭代式信号重建

各层神经元双向连接，上下层反复传递信息优化结果，类似信号处理中迭代去噪算法（如BM3D），通过多轮猜测与修正逼近真实信号。

（9）Deep Q-Networks（DQN）的设计隐含了信号处理的动态优化思想：

状态特征提取 ≈ 信号滤波

深度网络将环境状态（如游戏画面）逐层抽象为关键特征，类似信号处理中多级滤波器，剥离冗余细节（如背景噪声），聚焦核心信息（如敌人位置）。

经验回放 → 信号缓冲与降相关

存储历史交互数据并随机抽取学习，类似信号处理中时延对齐或噪声平滑，打破数据的时间关联性（如去除信号中的突发干扰）。

目标网络 ≈ 低通滤波稳参

通过独立的目标网络缓慢更新Q值目标，类似信号处理中的移动平均滤波，避免参数突变导致的估计震荡（如高频噪声抑制）。

知乎学术咨询（哥廷根数学学派）：

担任《Mechanical System and Signal Processing》《中国电机工程学报》等期刊审稿专家，擅长领域：信号滤波/降噪，机器学习/深度学习，时间序列预分析/预测，设备故障诊断/缺陷检测/异常检测。

脑启社区

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区，共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐

快讯｜复旦发布全球首篇WAM系统性综述366篇论文绘制技术版图，飞捷科思自研可微分物理引擎Fysics指标超8B模型，维泛智能类脑芯片BiGPU融合ANN与SNN，Sim2Real实证：空间特征泛化远

脑启社区

突破 Transformer 极限：一文看懂类脑架构 MT-LNN 最新的“超神”评测结果！

脑启社区

人工智能导论：模型与算法（未来发展与趋势）

人工智能作为引领新一轮科技革命和产业变革的战略性技术，正在深刻改变人类社会。本章从类脑计算、自动化机器学习、神经网络压缩、人工智能芯片、量子机器学习、人工智能伦理与治理、人工智能算法开发框架等方面，简要总结人工智能的未来发展方向和趋势。

脑启社区

所有评论(0)

查看更多评论

哥廷根数学学派2023

@2301_78829506

已为社区贡献3条内容

几种深度学习模型所蕴含的信号处理思想

哥廷根数学学派2023

所有评论(0)

温馨提示：您尚未绑定手机号

哥廷根数学学派2023