神经网络层数、神经元数、梯度下降学习率和训练次数都会影响神经网络的效果

最近用神经网络拟合一个401*4005（401是样本数 4005是特征数）的样本集，得到一定的感触，现来分享一下：神经网络层数会影响神经网络的accuracy。某本书（忘了哪本）说过，两层隐层可以拟合出任何函数（线性非线性都可以）。所以就1个hidden layer的accuracy不高:从图上可以看出，1层、3层和4层hidden unit效果都很一般，所以不仅仅是1层，层数多效果不一定好。很多

Love, Day After Tomorrow

7349人浏览 · 2021-07-26 09:11:32

Love, Day After Tomorrow · 2021-07-26 09:11:32 发布

最近用神经网络拟合一个401*4005（401是样本数 4005是特征数）的样本集，得到一定的感触，现来分享一下：

神经网络层数和神经元数会影响神经网络的accuracy。《神经网络与深度学习》一书说过，只在输⼊层和输出层之间存在⼀个中间层的情况下，不论我们想要计算什么样的函数，我们都确信存在⼀个神经⽹络可以计算它。但是不同层数和神经元数的神经网络的工作正确率并不一样。一般来说，在调参合理的情况下，层数和神经元数越多，正确率越高，不过相应地，容易出现过拟合（需要正则化处理或者采用权值衰减/Dropout法则处理正则化）

学习率和训练次数同样也会影响正确率。学习率太高，代价函数不容易降低到最低点（会不断越过最低点）。这跟梯度下降的缺点：在最低点处不容易收敛，收敛效果差有关系。所以需要适当调整学习率来提高正确率。训练次数也是同理，训练次数如果太多了，那么梯度下降可能会越过最低点，反而降低了训练正确率。而简单地观察代价函数的变化趋势很可能只找到局部最优点而不是全局最优点。例如这张图，有多个局部最低点，但是全局最低点就一个。

所以最好的做法是代价函数和正确率可视化，观察代价函数和正确率随训练次数的的变化曲线，从而调整训练次数找到全局最优点。

脑启社区

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区，共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐

类脑解耦大模型最简 MVP 落地｜从根源解决 LLM 臃肿、黑箱、失忆、幻觉四大问题（大模型的思考：四）

本次最简 MVP 的成功跑通，是模块化类脑大模型架构的里程碑式验证。证明了下一代 AI 的发展方向，不再是无休止的参数堆叠，而是智能的解耦、分工、重构。从最初类脑思想实验，到自我纠偏完善理论，再到低成本工程落地，整套体系逻辑自洽、拓展性极强。丰富颜色、形状、材质多类型特征子模块；接入数学运算独立子模块，解决大模型计算错误问题；迭代存储层，从 JSON 平滑升级轻量化数据库；完善联想、想象拓展模块，

脑启社区

一个大专生的自白：我为什么用「类脑架构」重写了分布式系统

BNOS 负责宏观的节点编排与协作，AAA 负责微观的模型自适应推理，两者在设计上是互补的。在查阅了大量现有的分布式框架和智能体（Agent）协作方案后，我发现它们要么过于厚重，要么在节点通信上引入了极高的复杂度。于是，我决定跳出传统的微服务或消息队列思维，尝试从生物大脑中汲取灵感，设计了一套基于仿生神经网络的通用模块化执行引擎——BNOS（Bionic Neural Network Operat

脑启社区

认知神经科学研究报告【20260014】

本文提出并实现了一种全新的类脑计算架构——物理处理器系统。该系统摒弃了传统人工神经网络中显式的权重矩阵和激活函数，转而利用热传导、相变、粒子迁移、相位耦合等基础物理过程直接实现记忆、推理、情感模拟、意识涌现等高级认知功能。系统由多个 200×200 物理网格处理器构成，包括智能处理器、数学处理器、推理处理器、索引处理器、情感处理器、直觉推理器及全局工作记忆等，并通过全局协调器实现深度互联。我们定义