TensorFlow简单的回归、分类任务实现

回归任务是预测一个连续的数值。例如，我们可以预测房价、股票价格、气温等。回归问题的目标是最小化预测值与真实值之间的差异，通常使用均方误差（MSE）作为损失函数。回归任务主要关注连续数值的预测。损失函数：我们选择了均方误差（MSE）作为损失函数，用来衡量预测值与真实值之间的差异。优化器：使用 Adam 优化器，能够自动调整学习率，加速训练过程。分类任务的目标是将输入数据分配到一个或多个类别。例如，图

一碗黄焖鸡三碗米饭

1300人浏览 · 2025-03-20 09:21:41

一碗黄焖鸡三碗米饭 · 2025-03-20 09:21:41 发布

TensorFlow 入门之简单的回归、分类任务实现

随着深度学习的广泛应用，TensorFlow 已成为最流行的开源机器学习框架之一。作为一个新手，学习如何在 TensorFlow 中实现基础的回归与分类任务是迈向深度学习的第一步。在本文中，我们将深入介绍如何使用 TensorFlow 和 tf.keras 实现回归和分类任务，通过清晰的代码示例、详细的解释以及对比，帮助你理解回归与分类的不同特点，并掌握其在实际项目中的应用。

一、回归任务实现

1.1 回归问题简介

回归任务是预测一个连续的数值。例如，我们可以预测房价、股票价格、气温等。回归问题的目标是最小化预测值与真实值之间的差异，通常使用均方误差（MSE）作为损失函数。

1.2 创建回归数据集

为了演示回归任务，我们使用一个简单的人工数据集。我们将生成一组包含单一特征（X）的数据，并通过某个线性方程生成目标值（Y）。

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

# 生成数据
np.random.seed(42)
X = np.random.rand(100, 1)  # 生成 100 个随机数
Y = 2 * X + 1 + 0.1 * np.random.randn(100, 1)  # Y = 2 * X + 1 + 噪声

# 可视化数据
plt.scatter(X, Y, color='blue')
plt.xlabel('X')
plt.ylabel('Y')
plt.title('Generated Data for Regression')
plt.show()

1.3 构建回归模型

回归模型通常由一个输入层和一个输出层组成。在我们的例子中，输入层只有一个神经元，输出层也只有一个神经元。

# 创建回归模型
model = tf.keras.Sequential([
    tf.keras.layers.Dense(1, input_shape=(1,), activation=None)  # 单个神经元，没有激活函数
])

# 编译模型
model.compile(optimizer='adam', loss='mse')  # 使用 Adam 优化器和均方误差损失函数

# 查看模型结构
model.summary()

输出的模型结构：

层类型	输出形状	参数数量
Dense	(None, 1)	2

1.4 训练回归模型

训练模型时，我们使用之前生成的 X 和 Y 数据集，进行回归任务的训练。

# 训练模型
model.fit(X, Y, epochs=100, verbose=0)

# 可视化拟合效果
plt.scatter(X, Y, color='blue', label='真实数据')
plt.plot(X, model.predict(X), color='red', label='预测结果')
plt.xlabel('X')
plt.ylabel('Y')
plt.title('Regression Model Fitting')
plt.legend()
plt.show()

1.5 评估回归模型

评估回归模型的效果，我们可以使用 均方误差（MSE） 和 均方根误差（RMSE） 等指标：

# 评估模型
test_loss = model.evaluate(X, Y)
print(f'测试集损失（MSE）：{test_loss}')

1.6 回归模型总结

回归任务主要关注连续数值的预测。
损失函数：我们选择了均方误差（MSE）作为损失函数，用来衡量预测值与真实值之间的差异。
优化器：使用 Adam 优化器，能够自动调整学习率，加速训练过程。

二、分类任务实现

2.1 分类问题简介

分类任务的目标是将输入数据分配到一个或多个类别。例如，图像分类、文本分类等任务。分类问题的输出通常是离散的类别，输出层的神经元个数对应于类别数量。

2.2 创建分类数据集

我们使用 TensorFlow 内置的 iris（鸢尾花）数据集 来进行分类任务。这个数据集包含四个特征和三个类别。

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from tensorflow.keras.utils import to_categorical

# 加载鸢尾花数据集
iris = datasets.load_iris()
X = iris.data  # 特征
Y = iris.target  # 标签

# 标签编码
Y = to_categorical(Y, num_classes=3)

# 划分训练集和测试集
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.2, random_state=42)

# 查看数据形状
print(f'训练数据形状：{X_train.shape}, 测试数据形状：{X_test.shape}')

2.3 构建分类模型

分类模型通常会有多个输出节点，每个节点对应一个类别。在这个例子中，我们使用 3 个输出节点（对应 3 类鸢尾花）。

# 创建分类模型
model = tf.keras.Sequential([
    tf.keras.layers.Dense(64, input_shape=(4,), activation='relu'),  # 隐藏层，64 个神经元
    tf.keras.layers.Dense(3, activation='softmax')  # 输出层，3 个神经元，softmax 激活函数
])

# 编译模型
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# 查看模型结构
model.summary()

模型结构：

层类型	输出形状	参数数量
Dense	(None, 64)	320
Dense	(None, 3)	195
总计		515

2.4 训练分类模型

# 训练模型
model.fit(X_train, Y_train, epochs=100, batch_size=16, verbose=1)

# 可视化训练过程
history = model.history
plt.plot(history.history['accuracy'], label='训练准确率')
plt.plot(history.history['val_accuracy'], label='验证准确率')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')
plt.legend()
plt.show()

2.5 评估分类模型

# 评估模型
test_loss, test_acc = model.evaluate(X_test, Y_test)
print(f'测试集损失：{test_loss}, 测试集准确率：{test_acc}')

2.6 分类模型总结

分类任务主要关注离散标签的预测。
损失函数：我们使用 交叉熵损失函数（categorical crossentropy） 来衡量多类别问题中的预测与真实标签之间的差异。
激活函数：输出层使用 softmax 激活函数，确保输出是一个有效的概率分布。

三、回归与分类任务对比

特点	回归任务	分类任务
任务目标	预测一个连续值	预测属于某个类别（离散值）
损失函数	均方误差（MSE）	交叉熵损失函数（Categorical Crossentropy）
输出层神经元个数	1 个神经元	类别数个神经元
激活函数	无激活函数（线性激活）	Softmax（多分类）
常见应用	房价预测、股票价格预测、气温预测等	图像分类、文本分类、情感分析等