Oxford-IIIT Pet Dataset(牛津-伊利特宠物数据集)是一个常用的图像分割数据集,广泛应用于计算机视觉和深度学习的训练和评估。该数据集由牛津大学视觉几何组(Visual Geometry Group)和印度信息技术学院联合创建,包括多种宠物犬和猫的图像。

一、数据集概述

        类别:数据集中包含 37 种不同的宠物品种(包括猫和狗),每种宠物都有多个图像样本。
        图像数量:总共有 7,349 张图像。
        标注信息:
                每张图像都有对应的分割掩码,掩码标识了宠物的不同部分(如身体、头部等)。
                每张图像还包含品种标签,指示该图像中宠物的类别。
                数据分布:数据集中包含 25 种狗的品种和 12 种猫的品种。

二、数据集下载

您可以通过以下链接下载 Oxford-IIIT Pet Dataset:

        Oxford Pets Dataset 页面:http://www.robots.ox.ac.uk/~vgg/data/pets/

数据集通常以压缩文件形式提供,解压后您将获得图像和掩码文件。

三、数据集结构

下载和解压后的数据集结构一般如下:
Oxford Pets Dataset/

├── images/
│   ├── cat.1.jpg
│   ├── dog.1.jpg
│   └── ...

├── annotations/
│   ├── trimaps/
│   │   ├── cat.1.png
│   │   ├── dog.1.png
│   │   └── ...
│   │ 
│   └── groundtruth/
│       ├── cat.1.png
│       ├── dog.1.png
│       └── ...

└── labels.txt

images:存放原始图像。
annotations/:存放图像分割掩码和其他注释信息。
trimaps:分割掩码,包括背景、宠物及其其他部分的分类。
groundtruth:每张图像的真实标签。
labels.txt:每种宠物的详细信息和标签索引。

四、数据集应用

Oxford-IIIT Pet Dataset 被广泛用于以下应用:

1.实例分割和图像分割:可用于训练和评估图像分割模型。
2. 分类任务:可以应用于宠物品种的分类任务。
3. 计算机视觉研究:作为基准数据集进行相关研究,例如迁移学习、深度学习模型优化等。

五、使用示例

以下是一个使用 PyTorch 加载并显示 Oxford-IIIT Pet Dataset 中图像和相应掩码的简单示例:

import os  
import matplotlib.pyplot as plt  
from PIL import Image  

def load_pet_data(image_path, mask_path):  
    image = Image.open(image_path)  
    mask = Image.open(mask_path)  
    return image, mask  

# 示例路径  
image_dir = './Oxford Pets Dataset/images'  
mask_dir = './Oxford Pets Dataset/annotations/trimaps'  

# 加载一张图片和对应的掩码  
image_file = 'cat.1.jpg'  
mask_file = 'cat.1.png'  

image_path = os.path.join(image_dir, image_file)  
mask_path = os.path.join(mask_dir, mask_file)  
image, mask = load_pet_data(image_path, mask_path)  

# 显示图像和掩码  
plt.figure(figsize=(10, 5))  
plt.subplot(1, 2, 1)  
plt.imshow(image)  
plt.title('Original Image')  
plt.axis('off')  

plt.subplot(1, 2, 2)  
plt.imshow(mask)  
plt.title('Mask')  
plt.axis('off')  

plt.show()

六、总结

Oxford-IIIT Pet Dataset 是一个重要的数据集,适用于图像分割和分类任务,尤其在宠物领域的研究中。无论您是在进行学术研究还是开发应用,这个数据集都提供了丰富的信息和资源。

Logo

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区,共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐