İçeriğe geç

ImageNet Veri Kümesi

ImageNet, görsel nesne tanıma araştırmalarında kullanılmak üzere tasarlanmış, açıklama eklenmiş görüntülerden oluşan büyük ölçekli bir veritabanıdır. Her biri WordNet eşanlamlı kümeleri kullanılarak açıklama eklenmiş 14 milyondan fazla görüntü içerir ve bu da onu derin öğrenme modellerini bilgisayarla görme görevlerinde eğitmek için mevcut en kapsamlı kaynaklardan biri yapar.

ImageNet Önceden Eğitilmiş Modeller

Modelboyut
(piksel)
acc
top1
acc
top5
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(Milyar) - 224
YOLO11n-cls22470.089.45.0 ± 0.31.1 ± 0.02.80.5
YOLO11s-cls22475.492.77.9 ± 0.21.3 ± 0.06.71.6
YOLO11m-cls22477.393.917.2 ± 0.42.0 ± 0.011.64.9
YOLO11l-cls22478.394.323.2 ± 0.32.8 ± 0.014.16.2
YOLO11x-cls22479.594.941.4 ± 0.93.8 ± 0.029.613.6

Temel Özellikler

  • ImageNet, binlerce nesne kategorisine yayılmış 14 milyondan fazla yüksek çözünürlüklü görüntü içerir.
  • Veri kümesi, her bir eşanlam kümesinin bir kategoriyi temsil ettiği WordNet hiyerarşisine göre düzenlenmiştir.
  • ImageNet, bilgisayar görüsü alanında, özellikle görüntü sınıflandırması ve nesne tespiti görevleri için eğitim ve karşılaştırma işlemleri için yaygın olarak kullanılır.
  • Yıllık ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), bilgisayar görüşü araştırmalarını ilerletmede etkili olmuştur.

Veri Seti Yapısı

ImageNet veri seti, WordNet hiyerarşisi kullanılarak düzenlenir. Hiyerarşideki her düğüm bir kategoriyi temsil eder ve her kategori bir eş anlamlı kümesi (eş anlamlı terimler koleksiyonu) tarafından açıklanır. ImageNet'teki görüntüler bir veya daha fazla eş anlamlı kümesiyle açıklanır ve bu da çeşitli nesneleri ve bunların ilişkilerini tanımak için modelleri eğitmek için zengin bir kaynak sağlar.

ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC)

Yıllık ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), bilgisayar görüşü alanında önemli bir etkinlik olmuştur. Araştırmacılar ve geliştiricilerin algoritmalarını ve modellerini, standartlaştırılmış değerlendirme metriklerine sahip büyük ölçekli bir veri seti üzerinde değerlendirmeleri için bir platform sağlamıştır. ILSVRC, görüntü sınıflandırması, nesne algılama ve diğer bilgisayar görüşü görevleri için derin öğrenme modellerinin geliştirilmesinde önemli ilerlemelere yol açmıştır.

Uygulamalar

ImageNet veri seti, görüntü sınıflandırması, nesne tespiti ve nesne yerelleştirmesi gibi çeşitli bilgisayarlı görü görevlerinde derin öğrenme modellerini eğitmek ve değerlendirmek için yaygın olarak kullanılır. AlexNet, VGG ve ResNet gibi bazı popüler derin öğrenme mimarileri, ImageNet veri seti kullanılarak geliştirilmiş ve kıyaslanmıştır.

Kullanım

224x224 görüntü boyutuyla ImageNet veri kümesinde bir derin öğrenme modelini 100 epoch için eğitmek için aşağıdaki kod parçacıklarını kullanabilirsiniz. Mevcut argümanların kapsamlı bir listesi için model Eğitim sayfasına bakın.

Eğitim Örneği

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet model=yolo11n-cls.pt epochs=100 imgsz=224

Örnek Görüntüler ve Açıklamalar

ImageNet veri seti, bilgisayarlı görü modellerini eğitmek ve değerlendirmek için çeşitli ve kapsamlı bir veri seti sağlayan, binlerce nesne kategorisine yayılan yüksek çözünürlüklü görüntüler içerir. İşte veri setinden bazı görüntü örnekleri:

Veri kümesi örnek görüntüleri

Bu örnek, ImageNet veri kümesindeki görüntülerin çeşitliliğini ve karmaşıklığını sergileyerek, sağlam bilgisayar görüşü modellerini eğitmek için çeşitli bir veri kümesinin önemini vurgulamaktadır.

Alıntılar ve Teşekkürler

Araştırma veya geliştirme çalışmalarınızda ImageNet veri kümesini kullanıyorsanız, lütfen aşağıdaki makaleye atıfta bulunun:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Makine öğrenimi ve bilgisayar görüşü araştırma topluluğu için değerli bir kaynak olan ImageNet veri setini oluşturdukları ve sürdürdükleri için Olga Russakovsky, Jia Deng ve Li Fei-Fei liderliğindeki ImageNet ekibine teşekkür etmek isteriz. ImageNet veri seti ve yaratıcıları hakkında daha fazla bilgi için ImageNet web sitesini ziyaret edin.

SSS

ImageNet veri seti nedir ve bilgisayarla görme alanında nasıl kullanılır?

ImageNet dataseti, WordNet eş anlam kümeleri kullanılarak kategorize edilmiş 14 milyondan fazla yüksek çözünürlüklü görüntüden oluşan büyük ölçekli bir veri tabanıdır. Görüntü sınıflandırma ve nesne tespiti dahil olmak üzere görsel nesne tanıma araştırmalarında yaygın olarak kullanılır. Veri setinin açıklamaları ve büyük hacmi, derin öğrenme modellerini eğitmek için zengin bir kaynak sağlar. Özellikle, AlexNet, VGG ve ResNet gibi modeller ImageNet kullanılarak eğitilmiş ve karşılaştırılmıştır, bu da bilgisayarla görme alanındaki rolünü göstermektedir.

Önceden eğitilmiş bir YOLO modelini ImageNet veri kümesinde görüntü sınıflandırması için nasıl kullanabilirim?

ImageNet veri kümesinde görüntü sınıflandırması için önceden eğitilmiş bir Ultralytics YOLO modelini kullanmak için şu adımları izleyin:

Eğitim Örneği

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet model=yolo11n-cls.pt epochs=100 imgsz=224

Daha kapsamlı eğitim talimatları için Eğitim sayfamıza bakın.

ImageNet veri kümesi projelerim için neden Ultralytics YOLO11 önceden eğitilmiş modellerini kullanmalıyım?

Ultralytics YOLO11 önceden eğitilmiş modelleri, çeşitli bilgisayar görüşü görevleri için hız ve doğruluk açısından son teknoloji performansı sunar. Örneğin, %70,0'lık bir top-1 doğruluğu ve %89,4'lük bir top-5 doğruluğu ile YOLO11n-cls modeli, gerçek zamanlı uygulamalar için optimize edilmiştir. Önceden eğitilmiş modeller, sıfırdan eğitim için gereken hesaplama kaynaklarını azaltır ve geliştirme döngülerini hızlandırır. ImageNet Önceden Eğitilmiş Modeller bölümünde YOLO11 modellerinin performans metrikleri hakkında daha fazla bilgi edinin.

ImageNet veri kümesi nasıl yapılandırılmıştır ve neden önemlidir?

ImageNet veri seti, WordNet hiyerarşisi kullanılarak düzenlenir; burada hiyerarşideki her düğüm, bir eş anlamlı kümesi (eş anlamlı terimler koleksiyonu) tarafından açıklanan bir kategoriyi temsil eder. Bu yapı, ayrıntılı açıklamalara olanak tanıyarak, çok çeşitli nesneleri tanımak için modelleri eğitmek için idealdir. ImageNet'in çeşitliliği ve açıklama zenginliği, sağlam ve genellenebilir derin öğrenme modelleri geliştirmek için onu değerli bir veri seti haline getirir. Bu organizasyon hakkında daha fazla bilgi Veri Seti Yapısı bölümünde bulunabilir.

ImageNet Büyük Ölçekli Görsel Tanıma Yarışması'nın (ILSVRC) bilgisayar görüşünde ne gibi bir rolü vardır?

Yıllık ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), algoritmaları büyük ölçekli, standartlaştırılmış bir veri seti üzerinde değerlendirmek için rekabetçi bir platform sağlayarak bilgisayar görüşündeki gelişmeleri yönlendirmede çok önemli olmuştur. Standartlaştırılmış değerlendirme metrikleri sunarak, görüntü sınıflandırması, nesne algılama ve görüntü segmentasyonu gibi alanlarda yeniliği ve gelişimi teşvik eder. Yarışma, derin öğrenme ve bilgisayar görüşü teknolojileriyle mümkün olanın sınırlarını sürekli olarak zorlamıştır.



📅 2 yıl önce oluşturuldu ✏️ 8 ay önce güncellendi
glenn-jocherambitious-octopusUltralyticsAssistantMatthewNoyceRizwanMunawarjk4e

Yorumlar