SKU-110k-Datensatz

Der SKU-110k-Datensatz ist eine Sammlung dicht gepackter Bilder von Einzelhandelsregalen, die zur Unterstützung der Forschung im Bereich der Objekterkennung entwickelt wurde. Der von Eran Goldman et al. entwickelte Datensatz enthält über 110.000 eindeutige Kategorien von Lagerhaltungseinheiten (SKU) mit dicht gepackten Objekten, die oft ähnlich oder sogar identisch aussehen und in der Nähe positioniert sind.

Beobachten: So trainieren Sie YOLOv10 auf dem SKU-110k-Datensatz unter Verwendung von Ultralytics | Retail Dataset

Datensatz Beispielbild

Wesentliche Merkmale

SKU-110k enthält Bilder von Ladenregalen aus aller Welt mit dicht gepackten Objekten, die eine Herausforderung für moderne Objektdetektoren darstellen.
Der Datensatz umfasst über 110.000 eindeutige SKU-Kategorien, die ein breites Spektrum von Objekten abbilden.
Zu den Anmerkungen gehören Begrenzungsrahmen für Objekte und SKU-Kategoriebezeichnungen.

Struktur des Datensatzes

Der SKU-110k-Datensatz ist in drei Hauptteilmengen unterteilt:

Trainingsmenge: Dieser Teilsatz enthält 8.219 Bilder und Anmerkungen, die für das Training von Objekterkennungsmodellen verwendet werden.
Validierungssatz: Dieser Teilsatz besteht aus 588 Bildern und Anmerkungen, die für die Modellvalidierung während des Trainings verwendet werden.
Testsatz: Dieser Teilsatz umfasst 2.936 Bilder, die für die abschließende Bewertung der trainierten Objekterkennungsmodelle bestimmt sind.

Anwendungen

Der SKU-110k-Datensatz wird häufig für das Training und die Evaluierung von Deep-Learning-Modellen für Objekterkennungsaufgaben verwendet, insbesondere in dicht gepackten Szenen wie Einzelhandelsregalen. Zu seinen Anwendungen gehören:

Bestandsmanagement und Automatisierung im Einzelhandel
Produkterkennung auf Plattformen des elektronischen Handels
Überprüfung der Planogrammkonformität
Selbstbedienungs-Kassensysteme in Geschäften
Kommissionier- und Sortierroboter in Lagern

Die Vielfalt der SKU-Kategorien und die dicht gepackten Objektanordnungen machen den Datensatz zu einer wertvollen Ressource für Forscher und Praktiker auf dem Gebiet des Computer-Vision.

Datensatz YAML

Eine YAML-Datei (Yet Another Markup Language) wird zur Definition der Dataset-Konfiguration verwendet. Sie enthält Informationen über die Pfade, Klassen und andere relevante Informationen des Datasets. Im Fall des SKU-110K-Datensatzes wird die Datei SKU-110K.yaml Datei wird verwaltet unter https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/SKU-110K.yaml.

ultralytics/cfg/datasets/SKU-110K.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# SKU-110K retail items dataset https://github.com/eg4000/SKU110K_CVPR19 by Trax Retail
# Documentation: https://docs.ultralytics.com/datasets/detect/sku-110k/
# Example usage: yolo train data=SKU-110K.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── SKU-110K  ← downloads here (13.6 GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/SKU-110K # dataset root dir
train: train.txt # train images (relative to 'path')  8219 images
val: val.txt # val images (relative to 'path')  588 images
test: test.txt # test images (optional)  2936 images

# Classes
names:
  0: object

# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
  import shutil
  from pathlib import Path

  import numpy as np
  import pandas as pd
  from tqdm import tqdm

  from ultralytics.utils.downloads import download
  from ultralytics.utils.ops import xyxy2xywh

  # Download
  dir = Path(yaml["path"])  # dataset root dir
  parent = Path(dir.parent)  # download dir
  urls = ["http://trax-geometry.s3.amazonaws.com/cvpr_challenge/SKU110K_fixed.tar.gz"]
  download(urls, dir=parent)

  # Rename directories
  if dir.exists():
      shutil.rmtree(dir)
  (parent / "SKU110K_fixed").rename(dir)  # rename dir
  (dir / "labels").mkdir(parents=True, exist_ok=True)  # create labels dir

  # Convert labels
  names = "image", "x1", "y1", "x2", "y2", "class", "image_width", "image_height"  # column names
  for d in "annotations_train.csv", "annotations_val.csv", "annotations_test.csv":
      x = pd.read_csv(dir / "annotations" / d, names=names).values  # annotations
      images, unique_images = x[:, 0], np.unique(x[:, 0])
      with open((dir / d).with_suffix(".txt").__str__().replace("annotations_", ""), "w", encoding="utf-8") as f:
          f.writelines(f"./images/{s}\n" for s in unique_images)
      for im in tqdm(unique_images, desc=f"Converting {dir / d}"):
          cls = 0  # single-class dataset
          with open((dir / "labels" / im).with_suffix(".txt"), "a", encoding="utf-8") as f:
              for r in x[images == im]:
                  w, h = r[6], r[7]  # image width, height
                  xywh = xyxy2xywh(np.array([[r[1] / w, r[2] / h, r[3] / w, r[4] / h]]))[0]  # instance
                  f.write(f"{cls} {xywh[0]:.5f} {xywh[1]:.5f} {xywh[2]:.5f} {xywh[3]:.5f}\n")  # write label

Verwendung

Um ein YOLO11n-Modell auf dem SKU-110K-Datensatz für 100 Epochen mit einer Bildgröße von 640 zu trainieren, können Sie die folgenden Codeschnipsel verwenden. Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Modelltraining.

Beispiel für einen Zug

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="SKU-110K.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo detect train data=SKU-110K.yaml model=yolo11n.pt epochs=100 imgsz=640

Beispieldaten und Anmerkungen

Der SKU-110k-Datensatz enthält eine Reihe von Einzelhandelsregalbildern mit dicht gepackten Objekten, die einen reichhaltigen Kontext für Objekterkennungsaufgaben bieten. Hier sind einige Beispiele von Daten aus dem Datensatz zusammen mit den entsprechenden Anmerkungen:

Datensatz Beispielbild

Bild eines dicht gepackten Einzelhandelsregals: Dieses Bild zeigt ein Beispiel für dicht gepackte Objekte in einem Einzelhandelsregal. Die Objekte sind mit Begrenzungsrahmen und SKU-Kategorie-Etiketten versehen.

Das Beispiel zeigt die Vielfalt und Komplexität der Daten im SKU-110k-Datensatz und unterstreicht die Bedeutung hochwertiger Daten für Aufgaben der Objekterkennung. Die dichte Anordnung der Produkte stellt einzigartige Herausforderungen für Erkennungsalgorithmen dar, was diesen Datensatz besonders wertvoll für die Entwicklung robuster, auf den Einzelhandel ausgerichteter Computer-Vision-Lösungen macht.

Zitate und Danksagungen

Wenn Sie den SKU-110k-Datensatz in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, zitieren Sie bitte das folgende Dokument:

BibTeX

@inproceedings{goldman2019dense,
  author    = {Eran Goldman and Roei Herzig and Aviv Eisenschtat and Jacob Goldberger and Tal Hassner},
  title     = {Precise Detection in Densely Packed Scenes},
  booktitle = {Proc. Conf. Comput. Vision Pattern Recognition (CVPR)},
  year      = {2019}
}

Wir möchten Eran Goldman et al. für die Erstellung und Pflege des SKU-110k-Datensatzes als wertvolle Ressource für die Computer-Vision-Forschungsgemeinschaft danken. Weitere Informationen über den SKU-110k-Datensatz und seine Ersteller finden Sie im GitHub-Repository des SKU-110k-Datensatzes.

FAQ

Was ist der SKU-110k-Datensatz und warum ist er für die Objekterkennung wichtig?

Der SKU-110k-Datensatz besteht aus dicht gepackten Bildern von Einzelhandelsregalen, die die Forschung bei der Objekterkennung unterstützen sollen. Er wurde von Eran Goldman et al. entwickelt und umfasst über 110.000 einzigartige SKU-Kategorien. Seine Bedeutung liegt in seiner Fähigkeit, modernste Objektdetektoren mit unterschiedlichen Objekterscheinungen und -nähe herauszufordern, was ihn zu einer unschätzbaren Ressource für Forscher und Praktiker im Bereich Computer Vision macht. Erfahren Sie mehr über die Struktur und die Anwendungen des Datensatzes in unserem Abschnitt SKU-110k Dataset.

Wie trainiere ich ein YOLO11 -Modell mit dem SKU-110k-Datensatz?

Das Trainieren eines YOLO11 Modells auf dem SKU-110k-Datensatz ist einfach. Hier ein Beispiel für das Training eines YOLO11n-Modells für 100 Epochen mit einer Bildgröße von 640:

Beispiel für einen Zug

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="SKU-110K.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo detect train data=SKU-110K.yaml model=yolo11n.pt epochs=100 imgsz=640

Eine umfassende Liste der verfügbaren Argumente finden Sie auf der Seite Modellschulung.

Was sind die wichtigsten Teilmengen des SKU-110k-Datensatzes?

Der SKU-110k-Datensatz ist in drei Hauptteilmengen unterteilt:

Trainingsset: Enthält 8.219 Bilder und Anmerkungen, die für das Training von Objekterkennungsmodellen verwendet werden.
Validierungssatz: Besteht aus 588 Bildern und Anmerkungen, die für die Modellvalidierung während des Trainings verwendet werden.
Testsatz: Enthält 2.936 Bilder, die für die abschließende Bewertung der trainierten Objekterkennungsmodelle bestimmt sind.

Weitere Einzelheiten finden Sie im Abschnitt Datensatzstruktur.

Wie konfiguriere ich den SKU-110k-Datensatz für das Training?

Die Konfiguration des SKU-110k-Datensatzes wird in einer YAML-Datei definiert, die Details zu den Pfaden, Klassen und anderen relevanten Informationen des Datensatzes enthält. Die SKU-110K.yaml Datei wird verwaltet unter SKU-110K.yaml. Sie können zum Beispiel ein Modell mit dieser Konfiguration trainieren, wie in unserer Verwendung Abschnitt.

Was sind die wichtigsten Merkmale des SKU-110k-Datensatzes im Kontext des Deep Learning?

Der SKU-110k-Datensatz enthält Bilder von Ladenregalen aus der ganzen Welt und zeigt dicht gepackte Objekte, die eine große Herausforderung für Objektdetektoren darstellen:

Über 110.000 einzigartige SKU-Kategorien
Vielfältige Erscheinungsformen von Objekten
Anmerkungen umfassen Begrenzungsrahmen und SKU-Kategoriebezeichnungen

Diese Merkmale machen den SKU-110k-Datensatz besonders wertvoll für das Training und die Evaluierung von Deep-Learning-Modellen bei Objekterkennungsaufgaben. Weitere Einzelheiten finden Sie im Abschnitt "Hauptmerkmale ".

Wie kann ich den SKU-110k-Datensatz in meiner Forschung zitieren?

Wenn Sie den SKU-110k-Datensatz in Ihrer Forschungs- oder Entwicklungsarbeit verwenden, zitieren Sie bitte das folgende Dokument:

BibTeX

@inproceedings{goldman2019dense,
  author    = {Eran Goldman and Roei Herzig and Aviv Eisenschtat and Jacob Goldberger and Tal Hassner},
  title     = {Precise Detection in Densely Packed Scenes},
  booktitle = {Proc. Conf. Comput. Vision Pattern Recognition (CVPR)},
  year      = {2019}
}