Link to this sectionSKU-110k Veri Kümesi#
SKU-110k veri kümesi, nesne algılama görevlerindeki araştırmaları desteklemek için tasarlanmış, yoğun şekilde paketlenmiş perakende raf görüntülerinden oluşan bir koleksiyondur. Eran Goldman ve arkadaşları tarafından geliştirilen veri kümesi, genellikle benzer veya hatta birbirinin aynısı görünen ve birbirine yakın konumlandırılmış, yoğun şekilde paketlenmiş nesnelere sahip 110.000'den fazla benzersiz stok tutma birimi (SKU) kategorisi içerir.
Watch: How to Train YOLOv10 on SKU-110k Dataset using Ultralytics | Retail Dataset

Link to this sectionTemel Özellikler#
- SKU-110k, en gelişmiş nesne algılayıcılar için zorluk oluşturan, yoğun şekilde paketlenmiş nesneler içeren dünyanın dört bir yanından mağaza rafı görüntülerini içerir.
- Veri kümesi, çok çeşitli nesne görünümleri sağlayan 110.000'den fazla benzersiz SKU kategorisi içerir.
- Ek açıklamalar, nesneler için sınırlayıcı kutuları ve SKU kategori etiketlerini içerir.
Link to this sectionVeri Kümesi Yapısı#
SKU-110k veri kümesi üç ana alt kümeye ayrılmıştır:
- Eğitim kümesi: Bu alt küme, nesne algılama modellerini eğitmek için kullanılan 8.219 görüntü ve açıklama içerir.
- Doğrulama kümesi: Bu alt küme, eğitim sırasında model doğrulaması için kullanılan 588 görüntü ve açıklamadan oluşur.
- Test kümesi: Bu alt küme, eğitilmiş nesne algılama modellerinin nihai değerlendirmesi için tasarlanmış 2.936 görüntü içerir.
Link to this sectionUygulamalar#
SKU-110k veri kümesi, özellikle perakende raf teşhirleri gibi yoğun paketlenmiş sahnelerde derin öğrenme modellerinin nesne algılama görevlerinde eğitilmesi ve değerlendirilmesi için yaygın olarak kullanılır. Uygulama alanları şunlardır:
- Perakende envanter yönetimi ve otomasyonu
- E-ticaret platformlarında ürün tanıma
- Planogram uyumluluk doğrulaması
- Mağazalardaki self-servis ödeme sistemleri
- Depolarda robotik toplama ve ayırma
Veri kümesinin çeşitli SKU kategorileri ve yoğun paketlenmiş nesne düzenlemeleri, onu bilgisayarlı görü alanındaki araştırmacılar ve uygulayıcılar için değerli bir kaynak haline getiriyor.
Link to this sectionVeri Kümesi YAML#
Veri kümesi yapılandırmasını tanımlamak için bir YAML (Yet Another Markup Language) dosyası kullanılır. Bu dosya; veri kümesinin yolları, sınıfları ve diğer ilgili bilgiler hakkında veriler içerir. SKU-110K veri kümesi durumunda, SKU-110K.yaml dosyası https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/SKU-110K.yaml adresinde tutulmaktadır.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# SKU-110K retail items dataset https://github.com/eg4000/SKU110K_CVPR19 by Trax Retail
# Documentation: https://docs.ultralytics.com/datasets/detect/sku-110k
# Example usage: yolo train data=SKU-110K.yaml
# parent
# ├── ultralytics
# └── datasets
# └── SKU-110K ← downloads here (13.6 GB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: SKU-110K # dataset root dir
train: train.txt # train images (relative to 'path') 8219 images
val: val.txt # val images (relative to 'path') 588 images
test: test.txt # test images (optional) 2936 images
# Classes
names:
0: object
# Download script/URL (optional) ---------------------------------------------------------------------------------------
download: |
import shutil
from pathlib import Path
import numpy as np
import polars as pl
from ultralytics.utils import TQDM
from ultralytics.utils.downloads import download
from ultralytics.utils.ops import xyxy2xywh
# Download
dir = Path(yaml["path"]) # dataset root dir
parent = Path(dir.parent) # download dir
urls = ["http://trax-geometry.s3.amazonaws.com/cvpr_challenge/SKU110K_fixed.tar.gz"]
download(urls, dir=parent)
# Rename directories
if dir.exists():
shutil.rmtree(dir)
(parent / "SKU110K_fixed").rename(dir) # rename dir
(dir / "labels").mkdir(parents=True, exist_ok=True) # create labels dir
# Convert labels
names = "image", "x1", "y1", "x2", "y2", "class", "image_width", "image_height" # column names
for d in "annotations_train.csv", "annotations_val.csv", "annotations_test.csv":
x = pl.read_csv(dir / "annotations" / d, has_header=False, new_columns=names, infer_schema_length=None).to_numpy() # annotations
images, unique_images = x[:, 0], np.unique(x[:, 0])
with open((dir / d).with_suffix(".txt").__str__().replace("annotations_", ""), "w", encoding="utf-8") as f:
f.writelines(f"./images/{s}\n" for s in unique_images)
for im in TQDM(unique_images, desc=f"Converting {dir / d}"):
cls = 0 # single-class dataset
with open((dir / "labels" / im).with_suffix(".txt"), "a", encoding="utf-8") as f:
for r in x[images == im]:
w, h = r[6], r[7] # image width, height
xywh = xyxy2xywh(np.array([[r[1] / w, r[2] / h, r[3] / w, r[4] / h]]))[0] # instance
f.write(f"{cls} {xywh[0]:.5f} {xywh[1]:.5f} {xywh[2]:.5f} {xywh[3]:.5f}\n") # write labelLink to this sectionKullanım#
Bir YOLO26n modelini SKU-110K veri kümesi üzerinde 640 görüntü boyutuyla 100 dönem (epoch) boyunca eğitmek için aşağıdaki kod parçacıklarını kullanabilirsin. Mevcut argümanların kapsamlı bir listesi için model Eğitim sayfasına bakabilirsin.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="SKU-110K.yaml", epochs=100, imgsz=640)Link to this sectionÖrnek Veriler ve Etiketler#
SKU-110k veri kümesi, nesne algılama görevleri için zengin bir bağlam sağlayan, yoğun şekilde paketlenmiş nesnelere sahip çok çeşitli perakende raf görüntüleri içerir. İşte veri kümesinden alınan verilerin ilgili açıklamalarıyla birlikte bazı örnekleri:

- Yoğun paketlenmiş perakende raf görüntüsü: Bu görüntü, bir perakende raf ortamındaki yoğun paketlenmiş nesnelerin bir örneğini göstermektedir. Nesneler, sınırlayıcı kutular ve SKU kategori etiketleri ile işaretlenmiştir.
Bu örnek, SKU-110k veri kümesindeki verilerin çeşitliliğini ve karmaşıklığını sergiliyor ve nesne algılama görevleri için yüksek kaliteli verilerin önemini vurguluyor. Ürünlerin yoğun düzeni, algılama algoritmaları için benzersiz zorluklar sunarak bu veri kümesini, perakende odaklı sağlam bilgisayarlı görü çözümleri geliştirmek için özellikle değerli kılar.
Link to this sectionAlıntılar ve Teşekkür#
SKU-110k veri kümesini araştırma veya geliştirme çalışmalarında kullanırsan, lütfen aşağıdaki makaleye atıfta bulun:
@inproceedings{goldman2019dense,
author = {Eran Goldman and Roei Herzig and Aviv Eisenschtat and Jacob Goldberger and Tal Hassner},
title = {Precise Detection in Densely Packed Scenes},
booktitle = {Proc. Conf. Comput. Vision Pattern Recognition (CVPR)},
year = {2019}
}SKU-110k veri kümesini bilgisayarlı görü araştırma topluluğu için değerli bir kaynak olarak oluşturdukları ve sürdürdükleri için Eran Goldman ve arkadaşlarına teşekkür ederiz. SKU-110k veri kümesi ve yaratıcıları hakkında daha fazla bilgi için SKU-110k veri kümesi GitHub deposunu ziyaret et.
Link to this sectionSSS#
Link to this sectionSKU-110k veri kümesi nedir ve nesne algılama için neden önemlidir?#
SKU-110k veri kümesi, nesne algılama görevlerindeki araştırmalara yardımcı olmak için tasarlanmış, yoğun şekilde paketlenmiş perakende raf görüntülerinden oluşur. Eran Goldman ve arkadaşları tarafından geliştirilmiş olup 110.000'den fazla benzersiz SKU kategorisi içerir. Önemi, çok çeşitli nesne görünümleri ve yakınlıklarıyla en gelişmiş nesne algılayıcılarını zorlama yeteneğinde yatar, bu da onu bilgisayarlı görü alanındaki araştırmacılar ve uygulayıcılar için paha biçilmez bir kaynak haline getirir. Veri kümesinin yapısı ve uygulamaları hakkında daha fazla bilgiyi SKU-110k Veri Kümesi bölümümüzde bulabilirsin.
Link to this sectionSKU-110k veri kümesini kullanarak nasıl YOLO26 modeli eğitirim?#
SKU-110k veri kümesi üzerinde bir YOLO26 modeli eğitmek oldukça basittir. İşte 640 görüntü boyutuyla 100 dönem boyunca bir YOLO26n modeli eğitmek için bir örnek:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="SKU-110K.yaml", epochs=100, imgsz=640)Mevcut argümanların kapsamlı bir listesi için Eğitim sayfası modeline başvur.
Link to this sectionSKU-110k veri kümesinin ana alt kümeleri nelerdir?#
SKU-110k veri kümesi üç ana alt kümeye ayrılmıştır:
- Eğitim kümesi: Nesne algılama modellerini eğitmek için kullanılan 8.219 görüntü ve açıklama içerir.
- Doğrulama kümesi: Eğitim sırasında model doğrulaması için kullanılan 588 görüntü ve açıklamadan oluşur.
- Test kümesi: Eğitilmiş nesne algılama modellerinin nihai değerlendirmesi için tasarlanmış 2.936 görüntü içerir.
Daha fazla ayrıntı için Veri Kümesi Yapısı bölümüne bak.
Link to this sectionEğitim için SKU-110k veri kümesini nasıl yapılandırırım?#
SKU-110k veri kümesi yapılandırması, veri kümesinin yolları, sınıfları ve diğer ilgili bilgiler hakkında ayrıntıları içeren bir YAML dosyasında tanımlanır. SKU-110K.yaml dosyası SKU-110K.yaml adresinde tutulmaktadır. Örneğin, Kullanım bölümümüzde gösterildiği gibi bu yapılandırmayı kullanarak bir model eğitebilirsin.
Link to this sectionDerin öğrenme bağlamında SKU-110k veri kümesinin temel özellikleri nelerdir?#
SKU-110k veri kümesi, nesne algılayıcılar için önemli zorluklar oluşturan, yoğun şekilde paketlenmiş nesneleri sergileyen dünyanın dört bir yanından mağaza rafı görüntülerini içerir:
- 110.000'den fazla benzersiz SKU kategorisi
- Çeşitli nesne görünümleri
- Ek açıklamalar sınırlayıcı kutuları ve SKU kategori etiketlerini içerir
Bu özellikler, SKU-110k veri kümesini nesne algılama görevlerinde derin öğrenme modellerini eğitmek ve değerlendirmek için özellikle değerli kılar. Daha fazla ayrıntı için Temel Özellikler bölümüne bak.
Link to this sectionSKU-110k veri kümesine araştırmamda nasıl atıfta bulunabilirim?#
SKU-110k veri kümesini araştırma veya geliştirme çalışmalarında kullanırsan, lütfen aşağıdaki makaleye atıfta bulun:
@inproceedings{goldman2019dense,
author = {Eran Goldman and Roei Herzig and Aviv Eisenschtat and Jacob Goldberger and Tal Hassner},
title = {Precise Detection in Densely Packed Scenes},
booktitle = {Proc. Conf. Comput. Vision Pattern Recognition (CVPR)},
year = {2019}
}Veri kümesi hakkında daha fazla bilgi Alıntılar ve Teşekkür bölümünde bulunabilir.