【服装鞋帽箱包识别】11 组深度学习数据集分享(附加载预处理代码)
服装鞋帽箱包的智能识别与分析是计算机视觉在电商商品检索、智能穿搭推荐、服装智能制造、配饰分类等领域的核心应用方向。高质量的标注数据集是训练高精度服饰类 AI 模型的关键支撑,本次整理并分享 11 组覆盖服装分类、鞋类识别、箱包区分、配饰分析、服装尺寸推荐的服饰相关数据集,覆盖图像分类、多标签识别、数据挖掘等多种任务类型,同时附上可直接运行的 Python 加载与预处理代码,方便科研学习与项目落地。
服装鞋帽箱包的智能识别与分析是计算机视觉在电商商品检索、智能穿搭推荐、服装智能制造、配饰分类等领域的核心应用方向。高质量的标注数据集是训练高精度服饰类 AI 模型的关键支撑,本次整理并分享 11 组覆盖服装分类、鞋类识别、箱包区分、配饰分析、服装尺寸推荐的服饰相关数据集,覆盖图像分类、多标签识别、数据挖掘等多种任务类型,同时附上可直接运行的 Python 加载与预处理代码,方便科研学习与项目落地。
一、 服装分类类数据集
这类数据集聚焦服装本身的样式、设计、颜色、图案等特征划分类别,样本覆盖多维度服饰特征,适合训练服装多属性分类、智能商品检索模型,适用于电商平台、服装设计平台等场景。
- 服装类被设计分类数据集数据说明:包含 2779 幅服装图像,按设计风格划分为 6 个类别,图像覆盖不同款式的服装设计特征,样本针对性强。适用场景:服装设计风格分类、服装设计元素提取研究。

- 服装样式数据集数据说明:共 11385 张图片,划分 26 类服装样式,按样式分 26 个独立文件夹存储,每类平均约 400 张图片,样本覆盖日常各类服装样式。适用场景:大规模服装样式分类、电商服装样式智能检索。

- 8 种不同颜色的服装类别图片数据集数据说明:专为多标签分类任务打造,聚焦服装的颜色特征,包含 8 种不同色系的服装图像,适配服装颜色属性的智能识别。适用场景:服装颜色多标签分类、电商服装颜色筛选功能开发。

- 4320 张服装图片数据集(10 种类型)数据说明:共 4320 张图像,按服装图案划分为 10 种类型,涵盖动物纹、圆圈纹、纯色、菱形纹等常见图案,图案特征鲜明。适用场景:服装图案识别、服装印花智能分类、个性化穿搭图案推荐。

二、 鞋类识别类数据集
这类数据集按鞋的品类、品牌进行划分,样本覆盖不同款式、不同品牌的鞋类特征,适合训练鞋类品类识别、品牌溯源模型,适用于电商鞋类检索、品牌打假等场景。
- 鞋子、凉鞋和靴子的图片数据集数据说明:共 15000 张图片,按品类分为鞋子、凉鞋、靴子三类,每类 5000 张,图像统一为 136×102 像素的 RGB 颜色模型,规格统一。适用场景:鞋类基础品类识别、线下鞋店智能盘点系统开发。

- Nike, Adidas 和 Convers 鞋的分类数据集数据说明:聚焦三大运动品牌鞋类识别,划分训练集与测试集,训练集 711 张图像、测试集 114 张图像,品牌特征标注清晰。适用场景:鞋类品牌智能识别、电商品牌溯源、假冒鞋类检测研究。

三、 箱包分类类数据集
这类数据集针对箱包品类进行精细化划分,样本特征清晰、类别均衡,适合训练箱包品类识别模型,适用于电商箱包检索、出行用品智能分类等场景。
- 手提包分类数据集数据说明:包含 5 种不同类型的手提包,分为背包迷你、带包、大包、肩包、大手提袋五类,每类 550 张图片,所有类别样本数量均等,无类别不平衡问题。适用场景:手提包品类精细化识别、电商箱包品类智能推荐。

四、 配饰与装饰相关数据集
这类数据集聚焦服饰配饰及传统装饰元素,涵盖帽子、太阳镜、装饰图案等,样本兼具实用性与文化性,适合训练配饰识别、传统装饰图案分析模型,适用于配饰分类、非遗装饰元素挖掘等场景。
- 非洲传统帽子数据集数据说明:包含 196 张非洲传统帽子图片,所有图像均在展柜拍摄,背景统一,帽子的传统工艺与造型特征清晰。适用场景:传统服饰配饰识别、非洲非遗装饰元素研究、文创产品设计数据支撑。

- 戴太阳镜与没戴太阳镜分类数据集数据说明:二分类数据集,未戴太阳镜图像 1776 张、佩戴太阳镜图像 1475 张,按 80:20 比例划分训练集与验证集,按类别分文件夹存储。适用场景:人像配饰识别、智能安防人像特征分析、穿搭配饰检测。

- 传统装饰图案数据集数据说明:包含 485 张 150×150×3 的彩色传统装饰图案 PNG 图像,配套 decor.csv 标签文件与预处理后的 H5 张量文件,标签为整数格式,数据预处理完善。适用场景:传统装饰图案分类、服装印花图案智能匹配、非遗装饰元素数字化研究。

五、 服装尺寸推荐数据集
这类数据集区别于图像类数据集,聚焦服装购买的实际场景数据,包含多维度用户反馈与产品信息,适合训练服装尺寸推荐算法模型,适用于电商智能尺码推荐、服装定制化服务等场景。
- 服装尺寸推荐数据集数据说明:包含服装购买数据、尺码适合度反馈、评论与评级信息,核心字段涵盖评级评论、适合度反馈(小 / 适合 / 大)、客户产品测量数据、类别信息,为尺码推荐提供多维度特征支撑。适用场景:电商服装智能尺码推荐、服装定制化尺寸匹配、服装产品版型优化数据挖掘。

六、 服饰类数据集使用实操小技巧
服饰类图像具有纹理丰富、细节特征关键、颜色 / 图案属性突出的特点,针对这类数据的处理与模型训练,有以下实操技巧:
- 图像预处理重点
- 统一规格:分类任务将图像统一调整为 224×224 或 256×256 分辨率,针对纹理细节(如服装图案、鞋标),可保留 2 倍分辨率后裁剪;
- 特征增强:使用直方图均衡化、CLAHE 算法提升服装纹理对比度,针对颜色分类任务,进行色域校准(转换为 HSV 空间)减少光照影响;
- 背景处理:电商类场景可使用抠图算法去除复杂背景,保留服饰主体,提升模型特征提取效率。
- 模型选型建议
- 基础分类任务(服装样式、鞋类品类):优先使用ResNet50、EfficientNet-B0,兼顾精度与效率,电商移动端部署可选用MobileNetV3、Swin-Tiny轻量模型;
- 多标签分类任务(服装颜色 / 图案):采用CNN+MLP组合模型,CNN 提取图像特征,MLP 实现多标签分类输出;
- 品牌 / 细节识别(鞋类品牌、装饰图案):加入注意力机制(CBAM/SE),强化品牌 logo、图案细节等关键特征的提取;
- 尺寸推荐任务:使用XGBoost/LightGBM树模型,或DNN 深度神经网络,挖掘用户测量数据、购买反馈的关联特征。
- 过拟合解决方法
- 小样本数据集(如非洲传统帽子)采用迁移学习,基于 ImageNet 预训练的 CNN 模型微调;
- 针对服饰纹理特点,添加随机裁剪、纹理扭曲、颜色抖动等数据增强手段,扩充样本多样性;
- 类别不平衡数据集采用Focal Loss损失函数,或进行过采样 / 欠采样处理,平衡类别权重;
- 深度模型中加入Dropout 层(概率 0.2-0.4)、L2 正则化,抑制模型过拟合。
七、 技术实操:服饰类数据集加载与预处理(附 Python 代码)
以下代码实现了服饰图像分类、鞋类品牌分类、配饰二分类、服装尺寸推荐数据挖掘四大核心任务的数据集加载与预处理功能,所有数据集的.查看地址分散嵌入对应函数的不同位置注释中。
第一步:环境准备
执行以下命令安装依赖库,覆盖图像处理、分类模型、数据挖掘全流程:
pip install opencv-python pillow torch torchvision numpy pandas xgboost lightgbm scikit-learn
第二步:完整加载 + 预处理代码
# ===================== 核心功能1:通用服饰图像分类数据集加载 =====================
import os
import numpy as np
from PIL import Image
from torch.utils.data import Dataset, DataLoader
from torchvision import transforms
class ClothClassifyDataset(Dataset):
"""
加载服装样式/图案/颜色分类数据集,适配按类别分文件夹的图像数据
"""
def __init__(self, data_root, transform=None):
# 服装样式数据集查看地址
# https://www.dilitanxianjia.com/1274/
# 服装图案数据集(10种类型)查看地址
# https://www.dilitanxianjia.com/393/
self.data_root = data_root
self.transform = transform
self.classes = sorted(os.listdir(data_root))
self.class_to_idx = {cls: idx for idx, cls in enumerate(self.classes)}
self.image_paths = []
self.labels = []
# 遍历文件夹获取图像路径和标签
for cls in self.classes:
cls_dir = os.path.join(data_root, cls)
for img_name in os.listdir(cls_dir):
if img_name.endswith((".jpg", ".png", ".jpeg")):
self.image_paths.append(os.path.join(cls_dir, img_name))
self.labels.append(self.class_to_idx[cls])
# 服装设计分类数据集查看地址
# https://www.dilitanxianjia.com/1293/
def __len__(self):
# 服装颜色多标签分类数据集查看地址
# https://www.dilitanxianjia.com/1262/
return len(self.image_paths)
def __getitem__(self, idx):
img_path = self.image_paths[idx]
label = self.labels[idx]
img = Image.open(img_path).convert("RGB")
if self.transform:
img = self.transform(img)
return img, label
# 服饰图像专用预处理变换(强化纹理与颜色特征)
transform = transforms.Compose([
transforms.Resize((224, 224)),
transforms.RandomHorizontalFlip(p=0.5),
transforms.RandomCrop(200, padding=10),
transforms.ColorJitter(brightness=0.2, contrast=0.2, saturation=0.2),
transforms.ToTensor(),
transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])
# 示例调用(替换为你的本地数据集路径)
# train_dataset = ClothClassifyDataset(
# data_root="./cloth_classify_dataset/train",
# transform=transform
# )
# train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
# print(f"服饰分类数据集加载完成,共{len(train_dataset)}张图像,{len(train_dataset.classes)}个类别")
# ===================== 核心功能2:鞋类品牌/品类分类数据集加载 =====================
class ShoeDataset(Dataset):
"""
加载鞋类品类/品牌分类数据集,适配鞋类专属任务
"""
def __init__(self, data_root, transform=None):
# 鞋/凉鞋/靴子数据集查看地址
# https://www.dilitanxianjia.com/1299/
# Nike/Adidas/Convers鞋数据集查看地址
# https://www.dilitanxianjia.com/1265/
self.data_root = data_root
self.transform = transform
self.classes = sorted(os.listdir(data_root))
self.class_to_idx = {cls: idx for idx, cls in enumerate(self.classes)}
self.image_paths = []
self.labels = []
for cls in self.classes:
cls_dir = os.path.join(data_root, cls)
for img_name in os.listdir(cls_dir):
if img_name.endswith((".jpg", ".png")):
self.image_paths.append(os.path.join(cls_dir, img_name))
self.labels.append(self.class_to_idx[cls])
def __len__(self):
return len(self.image_paths)
def __getitem__(self, idx):
img_path = self.image_paths[idx]
label = self.labels[idx]
img = Image.open(img_path).convert("RGB")
if self.transform:
img = self.transform(img)
return img, label
# ===================== 核心功能3:配饰二分类数据集加载(太阳镜/帽子等) =====================
class AccessoryBinaryDataset(Dataset):
"""
加载配饰二分类数据集,适配戴/没戴太阳镜、特定配饰识别等任务
"""
def __init__(self, data_root, transform=None):
# 戴/没戴太阳镜数据集查看地址
# https://www.dilitanxianjia.com/1271/
# 非洲传统帽子数据集查看地址
# https://www.dilitanxianjia.com/1277/
self.data_root = data_root
self.transform = transform
self.classes = sorted(os.listdir(data_root))
self.class_to_idx = {cls: 0 for cls in self.classes} if len(self.classes)==1 else {self.classes[0]:0, self.classes[1]:1}
self.image_paths = []
self.labels = []
for cls in self.classes:
cls_dir = os.path.join(data_root, cls)
for img_name in os.listdir(cls_dir):
if img_name.endswith((".jpg", ".png")):
self.image_paths.append(os.path.join(cls_dir, img_name))
self.labels.append(self.class_to_idx[cls])
def __len__(self):
return len(self.image_paths)
def __getitem__(self, idx):
img_path = self.image_paths[idx]
label = self.labels[idx]
img = Image.open(img_path).convert("RGB")
if self.transform:
img = self.transform(img)
return img, label
# ===================== 核心功能4:服装尺寸推荐数据集加载(数据挖掘专用) =====================
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder, StandardScaler
def load_size_recommend_data(csv_path):
"""
加载服装尺寸推荐数据集,完成数据清洗、特征编码与归一化
服装尺寸推荐数据集查看地址:https://www.dilitanxianjia.com/1704/
"""
# 加载数据
df = pd.read_csv(csv_path)
# 标签编码:将适合度反馈(小/适合/大)转为数字
le = LabelEncoder()
df["fit_label"] = le.fit_transform(df["适合反馈"])
# 提取特征与目标值
X = df[["客户身高", "客户体重", "产品胸围", "产品腰围", "产品衣长"]] # 核心数值特征
y = df["fit_label"]
# 特征归一化
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
# 划分训练集与测试集
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)
return X_train, X_test, y_train, y_test, le, scaler
# ===================== 核心功能5:传统装饰图案数据集加载(含H5文件) =====================
import h5py
def load_decor_pattern_data(h5_path):
"""
加载传统装饰图案H5预处理数据集,直接获取图像张量与标签
传统装饰图案数据集查看地址:https://www.dilitanxianjia.com/1268/
"""
with h5py.File(h5_path, "r") as f:
images = f["images"][:] # 图像张量
labels = f["targets"][:] # 标签
# 划分训练集与测试集
X_train, X_test, y_train, y_test = train_test_split(images, labels, test_size=0.2, random_state=42)
return X_train, X_test, y_train, y_test
代码使用说明
- 通用服饰分类数据集:适配服装样式、图案、颜色、设计分类等所有按类别分文件夹的图像数据,替换
data_root即可直接使用; - 鞋类数据集:专为鞋类品类 / 品牌识别设计,适配不同鞋类的特征提取,可直接用于训练鞋类专属分类模型;
- 配饰二分类数据集:支持戴 / 没戴太阳镜、单一配饰识别等二分类任务,自动适配单 / 双类别文件夹结构;
- 尺寸推荐数据:针对非图像的结构化数据,实现了标签编码、特征归一化、数据集划分,直接输出可用于模型训练的特征与标签;
- 装饰图案数据集:支持直接加载 H5 预处理文件,无需额外图像处理,快速获取张量数据与标签;
- 所有数据集查看地址分散嵌入代码注释中。
八、 后续分享计划
本次分享的 11 组数据集覆盖服装、鞋类、箱包、配饰、尺寸推荐等服饰领域全场景,如果在使用数据集或代码过程中遇到问题,欢迎私信交流。
更多推荐


所有评论(0)