deepfloat：深度学习浮点数的优化方案

deepfloat：深度学习浮点数的优化方案项目介绍deepfloat 是一个开源项目，它包含了SystemVerilog RTL、C++、HLS以及Python代码，用于重现论文《Rethinking floating point for deep learning》中的数值结果。该项目致力于为深度学习提出一种更为高效和节能的浮点数表示方法，以改进传统IEEE 754标准的浮点数计算。项目...

孙泽忱

1094人浏览 · 2025-04-30 18:00:40

孙泽忱 · 2025-04-30 18:00:40 发布

deepfloat：深度学习浮点数的优化方案

项目介绍

deepfloat 是一个开源项目，它包含了SystemVerilog RTL、C++、HLS以及Python代码，用于重现论文《Rethinking floating point for deep learning》中的数值结果。该项目致力于为深度学习提出一种更为高效和节能的浮点数表示方法，以改进传统IEEE 754标准的浮点数计算。

项目技术分析

deepfloat 项目实现两种类型的浮点数：

N-bit (N, l, alpha, beta, gamma) log：这是一种带有ELMA的日志浮点数格式。
N-bit (N, s) posit：这是一种正数浮点数格式。

项目还部分实现了IEEE风格的(e, s)浮点数（可能存在一些错误）和非正数的截断对数。

值得注意的是，8-bit (8, 1, 5, 5, 7) log格式在论文中被证明在28纳米工艺下，比int8/32整数乘加更节能，并且可以作为IEEE 754单精度浮点数的有效替代，用于ResNet-50在ImageNet上的卷积神经网络(CNN)推理。

项目及技术应用场景

deepfloat 的设计理念适用于深度学习中的计算密集型任务，特别是在对计算精度和能效要求较高的场合。以下是该项目的主要应用场景：

神经网络推理：用于加速神经网络模型的推理过程，特别是在移动和嵌入式设备上。
能效优化：通过使用优化后的浮点数格式，降低功耗，提高能效。
算法研究：为算法研究者提供一种新的浮点数表示方法，以探索深度学习计算的新途径。

项目特点

deepfloat 项目具有以下显著特点：

创新性浮点数格式：提供了日志浮点数和正数浮点数两种格式，为深度学习优化计算提供了新的可能性。
高效的能效比：8-bit log格式在特定条件下比传统整数格式更为节能。
可复现的研究结果：提供了完整的代码和文档，使研究者能够复现论文中的结果，验证算法的有效性。
易于集成的模块化设计：项目的模块化设计使得可以轻松集成到现有的深度学习框架中。

在具体实现上，deepfloat 的代码库结构清晰：

rtl：包含设计所需的SystemVerilog模块。
bitstream：包含封装RTL模块的OpenCL代码。
cpp：包含与FPGA OpenCL设计交互的CPU侧代码。
py：包含编译CPU代码和运行网络的高层功能。

项目使用流程简洁明了，用户可以按照readme中的指导步骤，通过几个shell脚本和Python脚本，构建和验证FPGA上的设计。

总之，deepfloat 项目的出现，为深度学习领域提供了一种新的浮点数计算方式，有望推动该领域在计算效率和环境友好性方面的进步。对于科研人员、算法工程师以及深度学习爱好者来说，这是一个值得尝试和研究的开源项目。

脑启社区

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区，共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐

快讯｜复旦发布全球首篇WAM系统性综述366篇论文绘制技术版图，飞捷科思自研可微分物理引擎Fysics指标超8B模型，维泛智能类脑芯片BiGPU融合ANN与SNN，Sim2Real实证：空间特征泛化远

脑启社区

EM-Core自动驾驶类脑世界模型——全域客观认知底座（V1.0 正式版）

本文档为 EM-Core 自动驾驶认知系统的核心认知底座规范，是 ECC 认知大脑开展推理、预判、决策的**唯一客观依据**。本模型与 MLNF-Mem 记忆中枢完全物理解耦，作为漏斗外侧独立挂载的外置模块（ad-44）运行，仅通过 `WM_QUERY` 标准消息向 ECC-01 情境解析模块和 ECC-03 因果推理模块提供风险向量与属性查询服务，不参与记忆晋升、遗忘或行为决策。适用于全场景自动