PyTorch-OpCounter终极指南：3步获取深度学习模型计算量，轻松搞定论文写作

在深度学习模型开发中，准确计算模型的MACs（乘法累加操作）和FLOPs（浮点运算次数）对于模型优化、性能评估和论文写作至关重要。PyTorch-OpCounter（THOP）是一个强大的Python工具包，专门为PyTorch模型提供精确的计算量统计功能，帮助研究人员和工程师快速评估模型复杂度。本文将为您提供完整的PyTorch-OpCounter使用指南，让您轻松掌握这一深度学习模型计算量分析

水菲琪

919人浏览 · 2026-04-08 12:45:40

水菲琪 · 2026-04-08 12:45:40 发布

PyTorch-OpCounter终极指南：3步获取深度学习模型计算量，轻松搞定论文写作

【免费下载链接】pytorch-OpCounter Count the MACs / FLOPs of your PyTorch model. 项目地址: https://gitcode.com/gh_mirrors/py/pytorch-OpCounter

🔥 为什么需要PyTorch-OpCounter？

在深度学习领域，模型的复杂度直接影响推理速度、内存占用和部署成本。PyTorch-OpCounter能够精确计算模型的MACs和参数数量，帮助您：

模型优化：识别计算瓶颈，进行有针对性的优化
论文写作：为学术论文提供准确的模型复杂度数据
部署规划：评估模型在不同硬件上的运行效率
模型对比：公平比较不同架构的计算效率

📦 快速安装PyTorch-OpCounter

安装PyTorch-OpCounter非常简单，只需一行命令：

pip install thop

或者直接从源代码安装最新版本：

pip install --upgrade git+https://gitcode.com/gh_mirrors/py/pytorch-OpCounter.git

🚀 3步掌握PyTorch-OpCounter核心用法

第一步：基础使用 - 计算ResNet50的计算量

PyTorch-OpCounter的核心功能通过thop.profile函数实现。以下是一个完整的示例：

import torch
import torchvision.models as models
from thop import profile, clever_format

# 加载预训练模型
model = models.resnet50()
input = torch.randn(1, 3, 224, 224)

# 计算MACs和参数数量
macs, params = profile(model, inputs=(input, ))

# 格式化输出
macs, params = clever_format([macs, params], "%.3f")
print(f"MACs: {macs}, Params: {params}")

第二步：自定义模块计算规则

对于自定义的PyTorch模块，您可以定义特定的计算规则：

import torch.nn as nn
from thop import profile

class CustomModule(nn.Module):
    def __init__(self):
        super().__init__()
        # 您的模块定义
        
def count_custom_module(model, x, y):
    # 自定义计算规则
    custom_macs = x[0].size(1) * y.size(1) * 100
    custom_params = sum(p.numel() for p in model.parameters())
    return custom_macs, custom_params

model = CustomModule()
input = torch.randn(1, 3, 224, 224)
macs, params = profile(model, inputs=(input, ),
                       custom_ops={CustomModule: count_custom_module})

第三步：批量评估常用模型

项目提供了benchmark/evaluate_famous_models.py脚本，可以批量评估TorchVision中的所有模型：

# 运行评估脚本
python benchmark/evaluate_famous_models.py

📊 主流模型计算量参考表

以下是PyTorch-OpCounter计算的部分主流模型复杂度数据：

模型	参数量(M)	MACs(G)
ResNet50	25.56	4.14
VGG16	138.36	15.61
MobileNetV2	3.50	0.33
EfficientNet-B0	5.29	0.39
DenseNet121	7.98	2.90

🛠️ 高级功能与自定义扩展

1. 支持的操作类型

PyTorch-OpCounter内置支持多种PyTorch操作，包括：

卷积层（Conv1d/2d/3d）
全连接层（Linear）
批归一化（BatchNorm）
池化层（MaxPool/AvgPool）
激活函数（ReLU, LeakyReLU, Sigmoid等）

详细支持的操作列表可在thop/profile.py中查看。

2. RNN模型支持

项目通过thop/rnn_hooks.py提供了对RNN、LSTM、GRU等循环神经网络的支持。

3. ONNX模型分析

使用thop/onnx_profile.py可以分析ONNX格式的模型：

from thop import onnx_profile
macs, params = onnx_profile("model.onnx", (1, 3, 224, 224))

💡 最佳实践与技巧

技巧1：使用clever_format提高可读性

from thop import clever_format
macs, params = clever_format([macs, params], "%.3f")
# 输出：MACs: 4.14G, Params: 25.56M

技巧2：处理自定义操作

如果遇到未支持的操作，可以通过custom_ops参数提供自定义计算函数：

def count_your_layer(model, x, y):
    # 计算您的自定义层
    return custom_macs, custom_params

macs, params = profile(model, inputs=(input,),
                       custom_ops={YourLayer: count_your_layer})

技巧3：验证计算准确性

项目提供了完整的测试套件，您可以通过运行测试来验证计算的准确性：

# 运行测试
python -m pytest tests/

🔍 实际应用场景

场景1：论文实验部分

在学术论文中，使用PyTorch-OpCounter可以准确报告模型复杂度：

# 在实验设置中
model = YourModel()
input_size = (1, 3, 224, 224)
dummy_input = torch.randn(input_size)
macs, params = profile(model, inputs=(dummy_input,))
print(f"Model: {model.__class__.__name__}")
print(f"MACs: {macs/1e9:.2f}G, Params: {params/1e6:.2f}M")

场景2：模型选择与优化

比较不同模型的效率：

models_to_test = ['resnet18', 'resnet50', 'mobilenet_v2']
results = {}

for model_name in models_to_test:
    model = getattr(models, model_name)()
    macs, params = profile(model, inputs=(dummy_input,))
    results[model_name] = {'MACs': macs, 'Params': params}

🚨 常见问题与解决方案

问题1：遇到未支持的操作类型

解决方案：检查thop/vision/basic_hooks.py中是否已支持该操作，或提交Issue到项目仓库。

问题2：计算结果不准确

解决方案：

确保输入尺寸正确
检查是否有自定义操作未注册
使用测试用例验证基础操作的计算

问题3：内存占用过大

解决方案：使用verbose=False参数减少内存使用：

macs, params = profile(model, inputs=(input,), verbose=False)

📈 性能优化建议

批量处理：对于大型模型，考虑使用较小的批量大小进行测试
GPU支持：PyTorch-OpCounter完全支持GPU计算
缓存结果：对于固定模型，缓存计算结果避免重复计算

🎯 总结

PyTorch-OpCounter是PyTorch生态中不可或缺的工具，它为深度学习研究人员和工程师提供了简单而强大的模型复杂度分析能力。通过本文介绍的3步快速入门方法，您可以立即开始使用这个工具来优化模型、撰写论文和进行性能评估。

无论您是学术研究者还是工业界开发者，掌握PyTorch-OpCounter都将显著提升您的工作效率。现在就开始使用这个强大的工具，让模型复杂度分析变得简单而准确！

核心模块路径参考：

主计算模块：thop/profile.py
视觉模型支持：thop/vision/
RNN支持：thop/rnn_hooks.py
工具函数：thop/utils.py
基准测试：benchmark/

【免费下载链接】pytorch-OpCounter Count the MACs / FLOPs of your PyTorch model. 项目地址: https://gitcode.com/gh_mirrors/py/pytorch-OpCounter

脑启社区

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区，共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐

EM-Core自动驾驶类脑世界模型——全域客观认知底座（V1.0 正式版）

本文档为 EM-Core 自动驾驶认知系统的核心认知底座规范，是 ECC 认知大脑开展推理、预判、决策的**唯一客观依据**。本模型与 MLNF-Mem 记忆中枢完全物理解耦，作为漏斗外侧独立挂载的外置模块（ad-44）运行，仅通过 `WM_QUERY` 标准消息向 ECC-01 情境解析模块和 ECC-03 因果推理模块提供风险向量与属性查询服务，不参与记忆晋升、遗忘或行为决策。适用于全场景自动

脑启社区

Python实现生物启发的脉冲神经元模型

在类脑计算与神经形态工程实践中，与的平衡始终是核心挑战。主流深度学习框架（如 PyTorch/TensorFlow）虽能高效模拟人工神经网络，但对等关键生物机制支持薄弱。本文不走“黑盒拟合”路线，而是基于与，构建一个轻量、可调试、符合皮层微环路结构特征的脉冲神经元模块，并完整实现带空间约束的 STDP 学习规则。