İçeriğe geç

ImageNet Veri Kümesi

ImageNet, görsel nesne tanıma araştırmalarında kullanılmak üzere tasarlanmış, açıklamalı görüntülerden oluşan büyük ölçekli bir veritabanıdır. Her bir görüntünün WordNet eş kümeleri kullanılarak açıklandığı 14 milyondan fazla görüntü içerir ve bu da onu bilgisayarla görme görevlerinde derin öğrenme modellerini eğitmek için mevcut en kapsamlı kaynaklardan biri haline getirir.

ImageNet Önceden Eğitilmiş Modeller

Model boyut
(piksel)
acc
top1
acc
top5
Hız
CPU ONNX
(ms)
Hız
A100 TensorRT
(ms)
params
(M)
FLOPs
(B) 640'da
YOLOv8n-cls 224 69.0 88.3 12.9 0.31 2.7 4.3
YOLOv8s-cls 224 73.8 91.7 23.4 0.35 6.4 13.5
YOLOv8m-cls 224 76.8 93.5 85.4 0.62 17.0 42.7
YOLOv8l-cls 224 76.8 93.5 163.0 0.87 37.5 99.7
YOLOv8x-cls 224 79.0 94.6 232.0 1.01 57.4 154.8

Temel Özellikler

  • ImageNet, binlerce nesne kategorisini kapsayan 14 milyondan fazla yüksek çözünürlüklü görüntü içerir.
  • Veri kümesi WordNet hiyerarşisine göre düzenlenmiştir ve her bir söz dizimi bir kategoriyi temsil etmektedir.
  • ImageNet, özellikle görüntü sınıflandırma ve nesne algılama görevleri için bilgisayarla görme alanında eğitim ve kıyaslama için yaygın olarak kullanılmaktadır.
  • Her yıl düzenlenen ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC) bilgisayarla görme araştırmalarının ilerlemesinde önemli bir rol oynamıştır.

Veri Kümesi Yapısı

ImageNet veri kümesi WordNet hiyerarşisi kullanılarak düzenlenmiştir. Hiyerarşideki her düğüm bir kategoriyi temsil eder ve her kategori bir synset (eş anlamlı terimler koleksiyonu) tarafından tanımlanır. ImageNet'teki görüntülere bir veya daha fazla söz kümesi eklenir ve bu da çeşitli nesneleri ve aralarındaki ilişkileri tanımaya yönelik eğitim modelleri için zengin bir kaynak sağlar.

ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC)

Her yıl düzenlenen ImageNet Large Scale Visual Recognition Challenge (ILSVRC) bilgisayarla görme alanında önemli bir etkinlik olmuştur. Araştırmacılara ve geliştiricilere algoritmalarını ve modellerini standartlaştırılmış değerlendirme ölçütleriyle büyük ölçekli bir veri kümesi üzerinde değerlendirmeleri için bir platform sağlamıştır. ILSVRC, görüntü sınıflandırma, nesne algılama ve diğer bilgisayarla görme görevleri için derin öğrenme modellerinin geliştirilmesinde önemli ilerlemelere yol açmıştır.

Uygulamalar

ImageNet veri kümesi, görüntü sınıflandırma, nesne algılama ve nesne lokalizasyonu gibi çeşitli bilgisayarla görme görevlerinde derin öğrenme modellerini eğitmek ve değerlendirmek için yaygın olarak kullanılmaktadır. AlexNet, VGG ve ResNet gibi bazı popüler derin öğrenme mimarileri ImageNet veri kümesi kullanılarak geliştirilmiş ve kıyaslanmıştır.

Kullanım

ImageNet veri kümesinde 224x224 görüntü boyutunda 100 epok için bir derin öğrenme modelini eğitmek için aşağıdaki kod parçacıklarını kullanabilirsiniz. Kullanılabilir bağımsız değişkenlerin kapsamlı bir listesi için Model Eğitimi sayfasına bakın.

Tren Örneği

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet model=yolov8n-cls.pt epochs=100 imgsz=224

Örnek Görüntüler ve Açıklamalar

ImageNet veri kümesi, binlerce nesne kategorisini kapsayan yüksek çözünürlüklü görüntüler içerir ve bilgisayarla görme modellerini eğitmek ve değerlendirmek için çeşitli ve kapsamlı bir veri kümesi sağlar. İşte veri kümesinden bazı görüntü örnekleri:

Veri kümesi örnek görüntüleri

Örnek, ImageNet veri kümesindeki görüntülerin çeşitliliğini ve karmaşıklığını göstermekte ve sağlam bilgisayarla görme modellerini eğitmek için çeşitli bir veri kümesinin önemini vurgulamaktadır.

Atıflar ve Teşekkür

Araştırma veya geliştirme çalışmalarınızda ImageNet veri kümesini kullanıyorsanız, lütfen aşağıdaki makaleye atıfta bulunun:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Olga Russakovsky, Jia Deng ve Li Fei-Fei liderliğindeki ImageNet ekibine, makine öğrenimi ve bilgisayarla görme araştırma topluluğu için değerli bir kaynak olarak ImageNet veri kümesini oluşturdukları ve sürdürdükleri için teşekkür ederiz. ImageNet veri kümesi ve yaratıcıları hakkında daha fazla bilgi için ImageNet web sitesini ziyaret edin.

SSS

ImageNet veri kümesi nedir ve bilgisayarla görmede nasıl kullanılır?

ImageNet veri kümesi, WordNet eş kümeleri kullanılarak kategorize edilmiş 14 milyondan fazla yüksek çözünürlüklü görüntüden oluşan büyük ölçekli bir veritabanıdır. Görüntü sınıflandırma ve nesne algılama dahil olmak üzere görsel nesne tanıma araştırmalarında yaygın olarak kullanılmaktadır. Veri setinin ek açıklamaları ve büyük hacmi, derin öğrenme modellerini eğitmek için zengin bir kaynak sağlar. Özellikle AlexNet, VGG ve ResNet gibi modeller ImageNet kullanılarak eğitilmiş ve kıyaslanmış, bilgisayarla görmenin ilerlemesindeki rolünü göstermiştir.

ImageNet veri kümesinde görüntü sınıflandırması için önceden eğitilmiş bir YOLO modelini nasıl kullanabilirim?

ImageNet veri kümesinde görüntü sınıflandırması için önceden eğitilmiş bir Ultralytics YOLO modeli kullanmak için aşağıdaki adımları izleyin:

Tren Örneği

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet model=yolov8n-cls.pt epochs=100 imgsz=224

Daha ayrıntılı eğitim talimatları için Eğitim sayfamıza bakın.

ImageNet veri kümesi projelerim için neden Ultralytics YOLOv8 ön eğitimli modelleri kullanmalıyım?

Ultralytics YOLOv8 Önceden eğitilmiş modeller, çeşitli bilgisayarla görme görevleri için hız ve doğruluk açısından son teknoloji ürünü performans sunar. Örneğin, ilk 1 doğruluk oranı %69,0 ve ilk 5 doğruluk oranı %88,3 olan YOLOv8n-cls modeli gerçek zamanlı uygulamalar için optimize edilmiştir. Önceden eğitilmiş modeller, sıfırdan eğitim için gereken hesaplama kaynaklarını azaltır ve geliştirme döngülerini hızlandırır. ImageNet Önceden Eğitilmiş Modeller bölümünde YOLOv8 modellerinin performans ölçümleri hakkında daha fazla bilgi edinin.

ImageNet veri kümesi nasıl yapılandırılmıştır ve neden önemlidir?

ImageNet veri kümesi WordNet hiyerarşisi kullanılarak düzenlenmiştir; burada hiyerarşideki her düğüm bir synset (eşanlamlı terimler koleksiyonu) tarafından tanımlanan bir kategoriyi temsil eder. Bu yapı, ayrıntılı ek açıklamalara olanak tanıyarak çok çeşitli nesneleri tanıyacak modelleri eğitmek için idealdir. ImageNet'in çeşitliliği ve açıklama zenginliği, onu sağlam ve genelleştirilebilir derin öğrenme modelleri geliştirmek için değerli bir veri kümesi haline getirmektedir. Bu organizasyon hakkında daha fazla bilgiyi Veri Kümesi Yapısı bölümünde bulabilirsiniz.

ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC) bilgisayarla görmede nasıl bir rol oynuyor?

Her yıl düzenlenen ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), algoritmaları büyük ölçekli, standartlaştırılmış bir veri kümesi üzerinde değerlendirmek için rekabetçi bir platform sağlayarak bilgisayarla görme alanındaki gelişmeleri yönlendirmede çok önemli olmuştur. Standartlaştırılmış değerlendirme ölçütleri sunarak görüntü sınıflandırma, nesne algılama ve görüntü segmentasyonu gibi alanlarda inovasyonu ve gelişimi teşvik etmektedir. Bu yarışma, derin öğrenme ve bilgisayarla görme teknolojileri ile mümkün olanın sınırlarını sürekli olarak zorlamıştır.



Oluşturma 2023-11-12, Güncelleme 2024-07-04
Yazarlar: glenn-jocher (8), RizwanMunawar (1)

Yorumlar