İçeriğe geç

ImageNet Veri Kümesi

ImageNet is a large-scale database of annotated images designed for use in visual object recognition research. It contains over 14 million images, with each image annotated using WordNet synsets, making it one of the most extensive resources available for training deep learning models in computer vision tasks.

ImageNet Önceden Eğitilmiş Modeller

Model boyut
(piksel)
acc
top1
acc
top5
Hız
CPU ONNX
(ms)
Speed
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B) 640'da
YOLO11n-cls 224 70.0 89.4 5.0 ± 0.3 1.1 ± 0.0 1.6 3.3
YOLO11s-cls 224 75.4 92.7 7.9 ± 0.2 1.3 ± 0.0 5.5 12.1
YOLO11m-cls 224 77.3 93.9 17.2 ± 0.4 2.0 ± 0.0 10.4 39.3
YOLO11l-cls 224 78.3 94.3 23.2 ± 0.3 2.8 ± 0.0 12.9 49.4
YOLO11x-cls 224 79.5 94.9 41.4 ± 0.9 3.8 ± 0.0 28.4 110.4

Temel Özellikler

  • ImageNet, binlerce nesne kategorisini kapsayan 14 milyondan fazla yüksek çözünürlüklü görüntü içerir.
  • Veri kümesi WordNet hiyerarşisine göre düzenlenmiştir ve her bir söz dizimi bir kategoriyi temsil etmektedir.
  • ImageNet is widely used for training and benchmarking in the field of computer vision, particularly for image classification and object detection tasks.
  • Her yıl düzenlenen ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC) bilgisayarla görme araştırmalarının ilerlemesinde önemli bir rol oynamıştır.

Veri Kümesi Yapısı

ImageNet veri kümesi WordNet hiyerarşisi kullanılarak düzenlenmiştir. Hiyerarşideki her düğüm bir kategoriyi temsil eder ve her kategori bir synset (eş anlamlı terimler koleksiyonu) tarafından tanımlanır. ImageNet'teki görüntülere bir veya daha fazla söz kümesi eklenir ve bu da çeşitli nesneleri ve aralarındaki ilişkileri tanımaya yönelik eğitim modelleri için zengin bir kaynak sağlar.

ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC)

Her yıl düzenlenen ImageNet Large Scale Visual Recognition Challenge (ILSVRC) bilgisayarla görme alanında önemli bir etkinlik olmuştur. Araştırmacılara ve geliştiricilere algoritmalarını ve modellerini standartlaştırılmış değerlendirme ölçütleriyle büyük ölçekli bir veri kümesi üzerinde değerlendirmeleri için bir platform sağlamıştır. ILSVRC, görüntü sınıflandırma, nesne algılama ve diğer bilgisayarla görme görevleri için derin öğrenme modellerinin geliştirilmesinde önemli ilerlemelere yol açmıştır.

Uygulamalar

ImageNet veri kümesi, görüntü sınıflandırma, nesne algılama ve nesne lokalizasyonu gibi çeşitli bilgisayarla görme görevlerinde derin öğrenme modellerini eğitmek ve değerlendirmek için yaygın olarak kullanılmaktadır. AlexNet, VGG ve ResNet gibi bazı popüler derin öğrenme mimarileri ImageNet veri kümesi kullanılarak geliştirilmiş ve kıyaslanmıştır.

Kullanım

To train a deep learning model on the ImageNet dataset for 100 epochs with an image size of 224x224, you can use the following code snippets. For a comprehensive list of available arguments, refer to the model Training page.

Tren Örneği

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet model=yolo11n-cls.pt epochs=100 imgsz=224

Örnek Görüntüler ve Açıklamalar

ImageNet veri kümesi, binlerce nesne kategorisini kapsayan yüksek çözünürlüklü görüntüler içerir ve bilgisayarla görme modellerini eğitmek ve değerlendirmek için çeşitli ve kapsamlı bir veri kümesi sağlar. İşte veri kümesinden bazı görüntü örnekleri:

Veri kümesi örnek görüntüleri

Örnek, ImageNet veri kümesindeki görüntülerin çeşitliliğini ve karmaşıklığını göstermekte ve sağlam bilgisayarla görme modellerini eğitmek için çeşitli bir veri kümesinin önemini vurgulamaktadır.

Atıflar ve Teşekkür

Araştırma veya geliştirme çalışmalarınızda ImageNet veri kümesini kullanıyorsanız, lütfen aşağıdaki makaleye atıfta bulunun:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

We would like to acknowledge the ImageNet team, led by Olga Russakovsky, Jia Deng, and Li Fei-Fei, for creating and maintaining the ImageNet dataset as a valuable resource for the machine learning and computer vision research community. For more information about the ImageNet dataset and its creators, visit the ImageNet website.

SSS

ImageNet veri kümesi nedir ve bilgisayarla görmede nasıl kullanılır?

ImageNet veri kümesi, WordNet eş kümeleri kullanılarak kategorize edilmiş 14 milyondan fazla yüksek çözünürlüklü görüntüden oluşan büyük ölçekli bir veritabanıdır. Görüntü sınıflandırma ve nesne algılama dahil olmak üzere görsel nesne tanıma araştırmalarında yaygın olarak kullanılmaktadır. Veri setinin ek açıklamaları ve büyük hacmi, derin öğrenme modellerini eğitmek için zengin bir kaynak sağlar. Özellikle AlexNet, VGG ve ResNet gibi modeller ImageNet kullanılarak eğitilmiş ve kıyaslanmış, bilgisayarla görmenin ilerlemesindeki rolünü göstermiştir.

ImageNet veri kümesinde görüntü sınıflandırması için önceden eğitilmiş bir YOLO modelini nasıl kullanabilirim?

ImageNet veri kümesinde görüntü sınıflandırması için önceden eğitilmiş bir Ultralytics YOLO modeli kullanmak için aşağıdaki adımları izleyin:

Tren Örneği

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet model=yolo11n-cls.pt epochs=100 imgsz=224

Daha ayrıntılı eğitim talimatları için Eğitim sayfamıza bakın.

Why should I use the Ultralytics YOLO11 pretrained models for my ImageNet dataset projects?

Ultralytics YOLO11 pretrained models offer state-of-the-art performance in terms of speed and accuracy for various computer vision tasks. For example, the YOLO11n-cls model, with a top-1 accuracy of 69.0% and a top-5 accuracy of 88.3%, is optimized for real-time applications. Pretrained models reduce the computational resources required for training from scratch and accelerate development cycles. Learn more about the performance metrics of YOLO11 models in the ImageNet Pretrained Models section.

ImageNet veri kümesi nasıl yapılandırılmıştır ve neden önemlidir?

ImageNet veri kümesi WordNet hiyerarşisi kullanılarak düzenlenmiştir; burada hiyerarşideki her düğüm bir synset (eşanlamlı terimler koleksiyonu) tarafından tanımlanan bir kategoriyi temsil eder. Bu yapı, ayrıntılı ek açıklamalara olanak tanıyarak çok çeşitli nesneleri tanıyacak modelleri eğitmek için idealdir. ImageNet'in çeşitliliği ve açıklama zenginliği, onu sağlam ve genelleştirilebilir derin öğrenme modelleri geliştirmek için değerli bir veri kümesi haline getirmektedir. Bu organizasyon hakkında daha fazla bilgiyi Veri Kümesi Yapısı bölümünde bulabilirsiniz.

ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC) bilgisayarla görmede nasıl bir rol oynuyor?

The annual ImageNet Large Scale Visual Recognition Challenge (ILSVRC) has been pivotal in driving advancements in computer vision by providing a competitive platform for evaluating algorithms on a large-scale, standardized dataset. It offers standardized evaluation metrics, fostering innovation and development in areas such as image classification, object detection, and image segmentation. The challenge has continuously pushed the boundaries of what is possible with deep learning and computer vision technologies.


📅 Created 11 months ago ✏️ Updated 10 days ago

Yorumlar