İçeriğe geç

ImageNet Veri Kümesi

ImageNet, görsel nesne tanıma araştırmalarında kullanılmak üzere tasarlanmış, açıklamalı görüntülerden oluşan büyük ölçekli bir veritabanıdır. Her bir görüntünün WordNet eş kümeleri kullanılarak açıklandığı 14 milyondan fazla görüntü içerir ve bu da onu bilgisayarla görme görevlerinde derin öğrenme modellerini eğitmek için mevcut en kapsamlı kaynaklardan biri haline getirir.

ImageNet Önceden Eğitilmiş Modeller

Model boyut
(piksel)
acc
top1
acc
top5
Hız
CPU ONNX
(ms)
Hız
A100 TensorRT
(ms)
params
(M)
FLOPs
(B) 640'da
YOLOv8n-cls 224 69.0 88.3 12.9 0.31 2.7 4.3
YOLOv8s-cls 224 73.8 91.7 23.4 0.35 6.4 13.5
YOLOv8m-cls 224 76.8 93.5 85.4 0.62 17.0 42.7
YOLOv8l-cls 224 76.8 93.5 163.0 0.87 37.5 99.7
YOLOv8x-cls 224 79.0 94.6 232.0 1.01 57.4 154.8

Temel Özellikler

  • ImageNet, binlerce nesne kategorisini kapsayan 14 milyondan fazla yüksek çözünürlüklü görüntü içerir.
  • Veri kümesi WordNet hiyerarşisine göre düzenlenmiştir ve her bir söz dizimi bir kategoriyi temsil etmektedir.
  • ImageNet, özellikle görüntü sınıflandırma ve nesne algılama görevleri için bilgisayarla görme alanında eğitim ve kıyaslama için yaygın olarak kullanılmaktadır.
  • Her yıl düzenlenen ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC) bilgisayarla görme araştırmalarının ilerlemesinde önemli bir rol oynamıştır.

Veri Kümesi Yapısı

ImageNet veri kümesi WordNet hiyerarşisi kullanılarak düzenlenmiştir. Hiyerarşideki her düğüm bir kategoriyi temsil eder ve her kategori bir synset (eş anlamlı terimler koleksiyonu) tarafından tanımlanır. ImageNet'teki görüntülere bir veya daha fazla söz kümesi eklenir ve bu da çeşitli nesneleri ve aralarındaki ilişkileri tanımaya yönelik eğitim modelleri için zengin bir kaynak sağlar.

ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC)

Her yıl düzenlenen ImageNet Large Scale Visual Recognition Challenge (ILSVRC) bilgisayarla görme alanında önemli bir etkinlik olmuştur. Araştırmacılara ve geliştiricilere algoritmalarını ve modellerini standartlaştırılmış değerlendirme ölçütleriyle büyük ölçekli bir veri kümesi üzerinde değerlendirmeleri için bir platform sağlamıştır. ILSVRC, görüntü sınıflandırma, nesne algılama ve diğer bilgisayarla görme görevleri için derin öğrenme modellerinin geliştirilmesinde önemli ilerlemelere yol açmıştır.

Uygulamalar

ImageNet veri kümesi, görüntü sınıflandırma, nesne algılama ve nesne lokalizasyonu gibi çeşitli bilgisayarla görme görevlerinde derin öğrenme modellerini eğitmek ve değerlendirmek için yaygın olarak kullanılmaktadır. AlexNet, VGG ve ResNet gibi bazı popüler derin öğrenme mimarileri ImageNet veri kümesi kullanılarak geliştirilmiş ve kıyaslanmıştır.

Kullanım

ImageNet veri kümesinde 224x224 görüntü boyutunda 100 epok için bir derin öğrenme modelini eğitmek için aşağıdaki kod parçacıklarını kullanabilirsiniz. Kullanılabilir bağımsız değişkenlerin kapsamlı bir listesi için Model Eğitimi sayfasına bakın.

Tren Örneği

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagenet', epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet model=yolov8n-cls.pt epochs=100 imgsz=224

Örnek Görüntüler ve Açıklamalar

ImageNet veri kümesi, binlerce nesne kategorisini kapsayan yüksek çözünürlüklü görüntüler içerir ve bilgisayarla görme modellerini eğitmek ve değerlendirmek için çeşitli ve kapsamlı bir veri kümesi sağlar. İşte veri kümesinden bazı görüntü örnekleri:

Veri kümesi örnek görüntüleri

Örnek, ImageNet veri kümesindeki görüntülerin çeşitliliğini ve karmaşıklığını göstermekte ve sağlam bilgisayarla görme modellerini eğitmek için çeşitli bir veri kümesinin önemini vurgulamaktadır.

Atıflar ve Teşekkür

Araştırma veya geliştirme çalışmalarınızda ImageNet veri kümesini kullanıyorsanız, lütfen aşağıdaki makaleye atıfta bulunun:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Olga Russakovsky, Jia Deng ve Li Fei-Fei liderliğindeki ImageNet ekibine, makine öğrenimi ve bilgisayarla görme araştırma topluluğu için değerli bir kaynak olarak ImageNet veri kümesini oluşturdukları ve sürdürdükleri için teşekkür ederiz. ImageNet veri kümesi ve yaratıcıları hakkında daha fazla bilgi için ImageNet web sitesini ziyaret edin.



Oluşturma 2023-11-12, Güncelleme 2024-04-17
Yazarlar: glenn-jocher (5), RizwanMunawar (1)

Yorumlar