Unsup3D源代码解读：从Model类到Trainer工作流

Unsup3D是一个基于深度学习的无监督3D重建项目，能够从单张图片中学习对称可变形3D物体。本文将深入解析其核心代码结构，从Model类的设计到Trainer工作流的实现，帮助开发者快速理解项目架构和运行机制。## 项目核心架构概览Unsup3D项目采用模块化设计，主要包含模型定义、训练流程、数据加载和渲染器四大组件。核心代码集中在`unsup3d/`目录下，其中`model.py`和`

郑悦莲

908人浏览 · 2026-03-12 03:15:59

郑悦莲 · 2026-03-12 03:15:59 发布

Unsup3D源代码解读：从Model类到Trainer工作流

【免费下载链接】unsup3d (CVPR'20 Oral) Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild 项目地址: https://gitcode.com/gh_mirrors/un/unsup3d

Unsup3D是一个基于深度学习的无监督3D重建项目，能够从单张图片中学习对称可变形3D物体。本文将深入解析其核心代码结构，从Model类的设计到Trainer工作流的实现，帮助开发者快速理解项目架构和运行机制。

项目核心架构概览

Unsup3D项目采用模块化设计，主要包含模型定义、训练流程、数据加载和渲染器四大组件。核心代码集中在unsup3d/目录下，其中model.py和trainer.py构成了整个系统的核心骨架。

图：Unsup3D的训练与测试流程展示，左半部分为训练阶段输入，右半部分为测试阶段的3D重建和重新光照结果

Model类深度解析：3D重建的核心逻辑

unsup3d/model.py中的Unsup3D类实现了整个3D重建的核心算法，主要包含网络初始化、前向传播和损失计算等关键功能。

网络组件初始化

在__init__方法中，模型初始化了多个子网络：

深度估计网络(netD)：从输入图像预测深度图
反照率估计网络(netA)：预测物体表面颜色
光照估计网络(netL)：预测场景光照参数
视角估计网络(netV)：预测相机视角参数

这些网络通过networks.py中定义的基础模块构建，形成了一个多任务学习系统。

前向传播流程

forward方法实现了模型的核心计算流程：

深度估计：通过netD预测深度图并进行归一化处理

self.canon_depth_raw = self.netD(self.input_im).squeeze(1)  # BxHxW
self.canon_depth = self.canon_depth_raw - self.canon_depth_raw.view(b,-1).mean(1).view(b,1,1)
self.canon_depth = self.canon_depth.tanh()
self.canon_depth = self.depth_rescaler(self.canon_depth)

对称处理：通过水平翻转扩充训练数据，增强模型对对称性的学习

self.canon_depth = torch.cat([self.canon_depth, self.canon_depth.flip(2)], 0)  # flip

光照与视角预测：估计场景光照参数和相机视角变换

canon_light = self.netL(self.input_im).repeat(2,1)  # Bx4
self.view = self.netV(self.input_im).repeat(2,1)

渲染与重建：使用渲染器将3D信息投影回2D图像

self.renderer.set_transform_matrices(self.view)
self.recon_depth = self.renderer.warp_canon_depth(self.canon_depth)
self.recon_im = nn.functional.grid_sample(self.canon_im, grid_2d_from_canon, mode='bilinear')

损失计算：综合多种损失函数优化模型

self.loss_total = self.loss_l1_im + lam_flip*self.loss_l1_im_flip + self.lam_perc*(self.loss_perc_im + lam_flip*self.loss_perc_im_flip) + self.lam_depth_sm*self.loss_depth_sm

可视化与结果保存

visualize和save_results方法实现了训练过程中的可视化和测试结果的保存功能，通过TensorBoard记录训练日志，并将重建结果保存为图像和视频文件。

Trainer类工作流：从数据到模型的完整闭环

unsup3d/trainer.py中的Trainer类负责协调数据加载、模型训练和评估的整个流程。

初始化与配置

__init__方法读取配置参数，初始化模型和数据加载器：

self.model = model(cfgs)
self.model.trainer = self
self.train_loader, self.val_loader, self.test_loader = get_data_loaders(cfgs)

训练流程控制

train方法实现了完整的训练循环：

检查点管理：支持从已保存的检查点恢复训练

if self.resume:
    start_epoch = self.load_checkpoint(optim=True)

多轮训练：迭代多个epoch，交替进行训练和验证

for epoch in range(start_epoch, self.num_epochs):
    self.current_epoch = epoch
    metrics = self.run_epoch(self.train_loader, epoch)
    self.metrics_trace.append("train", metrics)

    with torch.no_grad():
        metrics = self.run_epoch(self.val_loader, epoch, is_validation=True)
        self.metrics_trace.append("val", metrics)

模型保存：定期保存模型检查点和训练指标

if (epoch+1) % self.save_checkpoint_freq == 0:
    self.save_checkpoint(epoch+1, optim=True)

单轮训练实现

run_epoch方法实现了单轮训练的完整流程：

def run_epoch(self, loader, epoch=0, is_validation=False, is_test=False):
    is_train = not is_validation and not is_test
    metrics = self.make_metrics()
    
    if is_train:
        self.model.set_train()
    else:
        self.model.set_eval()
        
    for iter, input in enumerate(loader):
        m = self.model.forward(input)
        if is_train:
            self.model.backward()
        elif is_test:
            self.model.save_results(self.test_result_dir)
            
        metrics.update(m, self.batch_size)
    return metrics

关键模块交互关系

Unsup3D各模块之间通过清晰的接口实现交互：

数据流向：dataloaders.py → trainer.py → model.py → renderer/
依赖关系：
- Model类依赖Renderer进行3D渲染
- Trainer类依赖Model进行前向计算和反向传播
- 所有网络定义在networks.py中，供Model类调用