【服装鞋帽箱包识别】11 组深度学习数据集分享（附加载预处理代码）

服装鞋帽箱包的智能识别与分析是计算机视觉在电商商品检索、智能穿搭推荐、服装智能制造、配饰分类等领域的核心应用方向。高质量的标注数据集是训练高精度服饰类 AI 模型的关键支撑，本次整理并分享 11 组覆盖服装分类、鞋类识别、箱包区分、配饰分析、服装尺寸推荐的服饰相关数据集，覆盖图像分类、多标签识别、数据挖掘等多种任务类型，同时附上可直接运行的 Python 加载与预处理代码，方便科研学习与项目落地。

地理探险家

787人浏览 · 2026-02-07 20:17:21

地理探险家 · 2026-02-07 20:17:21 发布

服装鞋帽箱包的智能识别与分析是计算机视觉在电商商品检索、智能穿搭推荐、服装智能制造、配饰分类等领域的核心应用方向。高质量的标注数据集是训练高精度服饰类 AI 模型的关键支撑，本次整理并分享 11 组覆盖服装分类、鞋类识别、箱包区分、配饰分析、服装尺寸推荐的服饰相关数据集，覆盖图像分类、多标签识别、数据挖掘等多种任务类型，同时附上可直接运行的 Python 加载与预处理代码，方便科研学习与项目落地。

一、服装分类类数据集

这类数据集聚焦服装本身的样式、设计、颜色、图案等特征划分类别，样本覆盖多维度服饰特征，适合训练服装多属性分类、智能商品检索模型，适用于电商平台、服装设计平台等场景。

服装类被设计分类数据集数据说明：包含 2779 幅服装图像，按设计风格划分为 6 个类别，图像覆盖不同款式的服装设计特征，样本针对性强。适用场景：服装设计风格分类、服装设计元素提取研究。
服装样式数据集数据说明：共 11385 张图片，划分 26 类服装样式，按样式分 26 个独立文件夹存储，每类平均约 400 张图片，样本覆盖日常各类服装样式。适用场景：大规模服装样式分类、电商服装样式智能检索。
8 种不同颜色的服装类别图片数据集数据说明：专为多标签分类任务打造，聚焦服装的颜色特征，包含 8 种不同色系的服装图像，适配服装颜色属性的智能识别。适用场景：服装颜色多标签分类、电商服装颜色筛选功能开发。
4320 张服装图片数据集（10 种类型）数据说明：共 4320 张图像，按服装图案划分为 10 种类型，涵盖动物纹、圆圈纹、纯色、菱形纹等常见图案，图案特征鲜明。适用场景：服装图案识别、服装印花智能分类、个性化穿搭图案推荐。

二、鞋类识别类数据集

这类数据集按鞋的品类、品牌进行划分，样本覆盖不同款式、不同品牌的鞋类特征，适合训练鞋类品类识别、品牌溯源模型，适用于电商鞋类检索、品牌打假等场景。

鞋子、凉鞋和靴子的图片数据集数据说明：共 15000 张图片，按品类分为鞋子、凉鞋、靴子三类，每类 5000 张，图像统一为 136×102 像素的 RGB 颜色模型，规格统一。适用场景：鞋类基础品类识别、线下鞋店智能盘点系统开发。
Nike, Adidas 和 Convers 鞋的分类数据集数据说明：聚焦三大运动品牌鞋类识别，划分训练集与测试集，训练集 711 张图像、测试集 114 张图像，品牌特征标注清晰。适用场景：鞋类品牌智能识别、电商品牌溯源、假冒鞋类检测研究。

三、箱包分类类数据集

这类数据集针对箱包品类进行精细化划分，样本特征清晰、类别均衡，适合训练箱包品类识别模型，适用于电商箱包检索、出行用品智能分类等场景。

手提包分类数据集数据说明：包含 5 种不同类型的手提包，分为背包迷你、带包、大包、肩包、大手提袋五类，每类 550 张图片，所有类别样本数量均等，无类别不平衡问题。适用场景：手提包品类精细化识别、电商箱包品类智能推荐。

四、配饰与装饰相关数据集

这类数据集聚焦服饰配饰及传统装饰元素，涵盖帽子、太阳镜、装饰图案等，样本兼具实用性与文化性，适合训练配饰识别、传统装饰图案分析模型，适用于配饰分类、非遗装饰元素挖掘等场景。

非洲传统帽子数据集数据说明：包含 196 张非洲传统帽子图片，所有图像均在展柜拍摄，背景统一，帽子的传统工艺与造型特征清晰。适用场景：传统服饰配饰识别、非洲非遗装饰元素研究、文创产品设计数据支撑。
戴太阳镜与没戴太阳镜分类数据集数据说明：二分类数据集，未戴太阳镜图像 1776 张、佩戴太阳镜图像 1475 张，按 80:20 比例划分训练集与验证集，按类别分文件夹存储。适用场景：人像配饰识别、智能安防人像特征分析、穿搭配饰检测。
传统装饰图案数据集数据说明：包含 485 张 150×150×3 的彩色传统装饰图案 PNG 图像，配套 decor.csv 标签文件与预处理后的 H5 张量文件，标签为整数格式，数据预处理完善。适用场景：传统装饰图案分类、服装印花图案智能匹配、非遗装饰元素数字化研究。

五、服装尺寸推荐数据集

这类数据集区别于图像类数据集，聚焦服装购买的实际场景数据，包含多维度用户反馈与产品信息，适合训练服装尺寸推荐算法模型，适用于电商智能尺码推荐、服装定制化服务等场景。

服装尺寸推荐数据集数据说明：包含服装购买数据、尺码适合度反馈、评论与评级信息，核心字段涵盖评级评论、适合度反馈（小 / 适合 / 大）、客户产品测量数据、类别信息，为尺码推荐提供多维度特征支撑。适用场景：电商服装智能尺码推荐、服装定制化尺寸匹配、服装产品版型优化数据挖掘。

六、服饰类数据集使用实操小技巧

服饰类图像具有纹理丰富、细节特征关键、颜色 / 图案属性突出的特点，针对这类数据的处理与模型训练，有以下实操技巧：

图像预处理重点
- 统一规格：分类任务将图像统一调整为 224×224 或 256×256 分辨率，针对纹理细节（如服装图案、鞋标），可保留 2 倍分辨率后裁剪；
- 特征增强：使用直方图均衡化、CLAHE 算法提升服装纹理对比度，针对颜色分类任务，进行色域校准（转换为 HSV 空间）减少光照影响；
- 背景处理：电商类场景可使用抠图算法去除复杂背景，保留服饰主体，提升模型特征提取效率。
模型选型建议
- 基础分类任务（服装样式、鞋类品类）：优先使用ResNet50、EfficientNet-B0，兼顾精度与效率，电商移动端部署可选用MobileNetV3、Swin-Tiny轻量模型；
- 多标签分类任务（服装颜色 / 图案）：采用CNN+MLP组合模型，CNN 提取图像特征，MLP 实现多标签分类输出；
- 品牌 / 细节识别（鞋类品牌、装饰图案）：加入注意力机制（CBAM/SE），强化品牌 logo、图案细节等关键特征的提取；
- 尺寸推荐任务：使用XGBoost/LightGBM树模型，或DNN 深度神经网络，挖掘用户测量数据、购买反馈的关联特征。
过拟合解决方法
- 小样本数据集（如非洲传统帽子）采用迁移学习，基于 ImageNet 预训练的 CNN 模型微调；
- 针对服饰纹理特点，添加随机裁剪、纹理扭曲、颜色抖动等数据增强手段，扩充样本多样性；
- 类别不平衡数据集采用Focal Loss损失函数，或进行过采样 / 欠采样处理，平衡类别权重；
- 深度模型中加入Dropout 层（概率 0.2-0.4）、L2 正则化，抑制模型过拟合。

七、技术实操：服饰类数据集加载与预处理（附 Python 代码）

以下代码实现了服饰图像分类、鞋类品牌分类、配饰二分类、服装尺寸推荐数据挖掘四大核心任务的数据集加载与预处理功能，所有数据集的.查看地址分散嵌入对应函数的不同位置注释中。

第一步：环境准备

执行以下命令安装依赖库，覆盖图像处理、分类模型、数据挖掘全流程：

pip install opencv-python pillow torch torchvision numpy pandas xgboost lightgbm scikit-learn

第二步：完整加载 + 预处理代码

# ===================== 核心功能1：通用服饰图像分类数据集加载 =====================
import os
import numpy as np
from PIL import Image
from torch.utils.data import Dataset, DataLoader
from torchvision import transforms

class ClothClassifyDataset(Dataset):
    """
    加载服装样式/图案/颜色分类数据集，适配按类别分文件夹的图像数据
    """
    def __init__(self, data_root, transform=None):
        # 服装样式数据集查看地址
        # https://www.dilitanxianjia.com/1274/
        # 服装图案数据集（10种类型）查看地址
        # https://www.dilitanxianjia.com/393/
        self.data_root = data_root
        self.transform = transform
        self.classes = sorted(os.listdir(data_root))
        self.class_to_idx = {cls: idx for idx, cls in enumerate(self.classes)}
        self.image_paths = []
        self.labels = []

        # 遍历文件夹获取图像路径和标签
        for cls in self.classes:
            cls_dir = os.path.join(data_root, cls)
            for img_name in os.listdir(cls_dir):
                if img_name.endswith((".jpg", ".png", ".jpeg")):
                    self.image_paths.append(os.path.join(cls_dir, img_name))
                    self.labels.append(self.class_to_idx[cls])

        # 服装设计分类数据集查看地址
        # https://www.dilitanxianjia.com/1293/

    def __len__(self):
        # 服装颜色多标签分类数据集查看地址
        # https://www.dilitanxianjia.com/1262/
        return len(self.image_paths)

    def __getitem__(self, idx):
        img_path = self.image_paths[idx]
        label = self.labels[idx]
        img = Image.open(img_path).convert("RGB")
        
        if self.transform:
            img = self.transform(img)
        
        return img, label

# 服饰图像专用预处理变换（强化纹理与颜色特征）
transform = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.RandomHorizontalFlip(p=0.5),
    transforms.RandomCrop(200, padding=10),
    transforms.ColorJitter(brightness=0.2, contrast=0.2, saturation=0.2),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])

# 示例调用（替换为你的本地数据集路径）
# train_dataset = ClothClassifyDataset(
#     data_root="./cloth_classify_dataset/train",
#     transform=transform
# )
# train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
# print(f"服饰分类数据集加载完成，共{len(train_dataset)}张图像，{len(train_dataset.classes)}个类别")

# ===================== 核心功能2：鞋类品牌/品类分类数据集加载 =====================
class ShoeDataset(Dataset):
    """
    加载鞋类品类/品牌分类数据集，适配鞋类专属任务
    """
    def __init__(self, data_root, transform=None):
        # 鞋/凉鞋/靴子数据集查看地址
        # https://www.dilitanxianjia.com/1299/
        # Nike/Adidas/Convers鞋数据集查看地址
        # https://www.dilitanxianjia.com/1265/
        self.data_root = data_root
        self.transform = transform
        self.classes = sorted(os.listdir(data_root))
        self.class_to_idx = {cls: idx for idx, cls in enumerate(self.classes)}
        self.image_paths = []
        self.labels = []

        for cls in self.classes:
            cls_dir = os.path.join(data_root, cls)
            for img_name in os.listdir(cls_dir):
                if img_name.endswith((".jpg", ".png")):
                    self.image_paths.append(os.path.join(cls_dir, img_name))
                    self.labels.append(self.class_to_idx[cls])

    def __len__(self):
        return len(self.image_paths)

    def __getitem__(self, idx):
        img_path = self.image_paths[idx]
        label = self.labels[idx]
        img = Image.open(img_path).convert("RGB")
        if self.transform:
            img = self.transform(img)
        return img, label

# ===================== 核心功能3：配饰二分类数据集加载（太阳镜/帽子等） =====================
class AccessoryBinaryDataset(Dataset):
    """
    加载配饰二分类数据集，适配戴/没戴太阳镜、特定配饰识别等任务
    """
    def __init__(self, data_root, transform=None):
        # 戴/没戴太阳镜数据集查看地址
        # https://www.dilitanxianjia.com/1271/
        # 非洲传统帽子数据集查看地址
        # https://www.dilitanxianjia.com/1277/
        self.data_root = data_root
        self.transform = transform
        self.classes = sorted(os.listdir(data_root))
        self.class_to_idx = {cls: 0 for cls in self.classes} if len(self.classes)==1 else {self.classes[0]:0, self.classes[1]:1}
        self.image_paths = []
        self.labels = []

        for cls in self.classes:
            cls_dir = os.path.join(data_root, cls)
            for img_name in os.listdir(cls_dir):
                if img_name.endswith((".jpg", ".png")):
                    self.image_paths.append(os.path.join(cls_dir, img_name))
                    self.labels.append(self.class_to_idx[cls])

    def __len__(self):
        return len(self.image_paths)

    def __getitem__(self, idx):
        img_path = self.image_paths[idx]
        label = self.labels[idx]
        img = Image.open(img_path).convert("RGB")
        if self.transform:
            img = self.transform(img)
        return img, label

# ===================== 核心功能4：服装尺寸推荐数据集加载（数据挖掘专用） =====================
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder, StandardScaler

def load_size_recommend_data(csv_path):
    """
    加载服装尺寸推荐数据集，完成数据清洗、特征编码与归一化
    服装尺寸推荐数据集查看地址：https://www.dilitanxianjia.com/1704/
    """
    # 加载数据
    df = pd.read_csv(csv_path)
    # 标签编码：将适合度反馈（小/适合/大）转为数字
    le = LabelEncoder()
    df["fit_label"] = le.fit_transform(df["适合反馈"])
    # 提取特征与目标值
    X = df[["客户身高", "客户体重", "产品胸围", "产品腰围", "产品衣长"]] # 核心数值特征
    y = df["fit_label"]
    # 特征归一化
    scaler = StandardScaler()
    X_scaled = scaler.fit_transform(X)
    # 划分训练集与测试集
    X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)
    return X_train, X_test, y_train, y_test, le, scaler

# ===================== 核心功能5：传统装饰图案数据集加载（含H5文件） =====================
import h5py

def load_decor_pattern_data(h5_path):
    """
    加载传统装饰图案H5预处理数据集，直接获取图像张量与标签
    传统装饰图案数据集查看地址：https://www.dilitanxianjia.com/1268/
    """
    with h5py.File(h5_path, "r") as f:
        images = f["images"][:] # 图像张量
        labels = f["targets"][:] # 标签
    # 划分训练集与测试集
    X_train, X_test, y_train, y_test = train_test_split(images, labels, test_size=0.2, random_state=42)
    return X_train, X_test, y_train, y_test

代码使用说明

通用服饰分类数据集：适配服装样式、图案、颜色、设计分类等所有按类别分文件夹的图像数据，替换data_root即可直接使用；
鞋类数据集：专为鞋类品类 / 品牌识别设计，适配不同鞋类的特征提取，可直接用于训练鞋类专属分类模型；
配饰二分类数据集：支持戴 / 没戴太阳镜、单一配饰识别等二分类任务，自动适配单 / 双类别文件夹结构；
尺寸推荐数据：针对非图像的结构化数据，实现了标签编码、特征归一化、数据集划分，直接输出可用于模型训练的特征与标签；
装饰图案数据集：支持直接加载 H5 预处理文件，无需额外图像处理，快速获取张量数据与标签；
所有数据集查看地址分散嵌入代码注释中。

八、后续分享计划

本次分享的 11 组数据集覆盖服装、鞋类、箱包、配饰、尺寸推荐等服饰领域全场景，如果在使用数据集或代码过程中遇到问题，欢迎私信交流。

脑启社区

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区，共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐

YOLOv11【第四章：巅峰前沿与融合篇·第13节】生物计算与神经形态硬件：Spike 脉冲神经网络替换 YOLOv11！

脑启社区

EM-Core 创造者叙事：从牛角尖，到通用智能架构

脑启社区

加密货币开发者的终极天堂：探索ideas-for-projects-people-would-use中的$400奖金项目 [特殊字符]

你是否正在寻找创新的加密货币开发项目？ideas-for-projects-people-would-use项目为你提供了完美的解决方案！这个独特的开源项目汇集了众多实用的软件创意，其中加密货币领域的$400奖金项目更是开发者们的宝藏。本文将为你详细介绍这个项目的核心价值，帮助你快速找到适合自己的开发机会。## 🔍 项目概览与核心功能ideas-for-projects-people-w