ImageNet Veri Kümesi
ImageNet is a large-scale database of annotated images designed for use in visual object recognition research. It contains over 14 million images, with each image annotated using WordNet synsets, making it one of the most extensive resources available for training deep learning models in computer vision tasks.
ImageNet Önceden Eğitilmiş Modelleri
| Model | boyut (piksel) | acc top1 | acc top5 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) at 224 |
|---|---|---|---|---|---|---|---|
| YOLO26n-cls | 224 | 71.4 | 90.1 | 5.0 ± 0.3 | 1.1 ± 0.0 | 2.8 | 0.5 |
| YOLO26s-cls | 224 | 76.0 | 92.9 | 7.9 ± 0.2 | 1.3 ± 0.0 | 6.7 | 1.6 |
| YOLO26m-cls | 224 | 78.1 | 94.2 | 17.2 ± 0.4 | 2.0 ± 0.0 | 11.6 | 4.9 |
| YOLO26l-cls | 224 | 79.0 | 94.6 | 23.2 ± 0.3 | 2.8 ± 0.0 | 14.1 | 6.2 |
| YOLO26x-cls | 224 | 79.9 | 95.0 | 41.4 ± 0.9 | 3.8 ± 0.0 | 29.6 | 13.6 |
Temel Özellikler
- ImageNet, binlerce nesne kategorisine yayılan 14 milyondan fazla yüksek çözünürlüklü görüntü içerir.
- Veri kümesi, her eşküme kavramının (synset) bir kategoriyi temsil ettiği WordNet hiyerarşisine göre düzenlenmiştir.
- ImageNet, özellikle görüntü sınıflandırma ve nesne algılama görevleri başta olmak üzere, bilgisayarlı görü alanında eğitim ve kıyaslama için yaygın olarak kullanılır.
- Her yıl düzenlenen ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), bilgisayarlı görü araştırmalarının ilerletilmesinde etkili olmuştur.
Veri Kümesi Yapısı
ImageNet veri kümesi, WordNet hiyerarşisi kullanılarak düzenlenmiştir. Hiyerarşideki her düğüm bir kategoriyi temsil eder ve her kategori bir eşküme kavramı (eş anlamlı terimler koleksiyonu) ile tanımlanır. ImageNet'teki görüntüler, modellerin çeşitli nesneleri ve bunların ilişkilerini tanıması için zengin bir kaynak sağlayan bir veya daha fazla eşküme kavramı ile etiketlenmiştir.
ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC)
Her yıl düzenlenen ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), bilgisayarlı görü alanında önemli bir etkinlik olmuştur. Araştırmacılara ve geliştiricilere, algoritmalarını ve modellerini standart değerlendirme metriklerine sahip büyük ölçekli bir veri kümesi üzerinde test etmeleri için bir platform sağlamıştır. ILSVRC, görüntü sınıflandırma, nesne algılama ve diğer bilgisayarlı görü görevleri için derin öğrenme modellerinin geliştirilmesinde önemli ilerlemelere yol açmıştır.
Uygulamalar
ImageNet veri kümesi, görüntü sınıflandırma, nesne algılama ve nesne yerelleştirme gibi çeşitli bilgisayarlı görü görevlerinde derin öğrenme modellerini eğitmek ve değerlendirmek için yaygın olarak kullanılır. AlexNet, VGG ve ResNet gibi bazı popüler derin öğrenme mimarileri, ImageNet veri kümesi kullanılarak geliştirilmiş ve kıyaslanmıştır.
Kullanım
Bir derin öğrenme modelini ImageNet veri kümesinde 224x224 görüntü boyutuyla 100 dönem (epoch) boyunca eğitmek için aşağıdaki kod parçacıklarını kullanabilirsin. Mevcut bağımsız değişkenlerin kapsamlı bir listesi için model Eğitim sayfasına başvur.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)Örnek Görüntüler ve Ek Açıklamalar
ImageNet veri kümesi, binlerce nesne kategorisine yayılan yüksek çözünürlüklü görüntüler içerir ve bilgisayarlı görü modellerini eğitmek ve değerlendirmek için çeşitli ve kapsamlı bir veri kümesi sağlar. İşte veri kümesinden bazı görüntü örnekleri:

Bu örnek, ImageNet veri kümesindeki görüntülerin çeşitliliğini ve karmaşıklığını sergileyerek, sağlam bilgisayarlı görü modelleri eğitmek için çeşitli bir veri kümesinin önemini vurgular.
Alıntılar ve Teşekkür
Eğer ImageNet veri kümesini araştırma veya geliştirme çalışmalarında kullanırsan, lütfen aşağıdaki makaleye atıfta bulun:
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}ImageNet veri kümesini makine öğrenimi ve bilgisayarlı görü araştırma topluluğu için değerli bir kaynak olarak oluşturdukları ve sürdürdükleri için Olga Russakovsky, Jia Deng ve Li Fei-Fei liderliğindeki ImageNet ekibine teşekkür ederiz. ImageNet veri kümesi ve yaratıcıları hakkında daha fazla bilgi için ImageNet web sitesini ziyaret et.
SSS
ImageNet veri kümesi nedir ve bilgisayarlı görüde nasıl kullanılır?
ImageNet veri kümesi, WordNet eşküme kavramları kullanılarak kategorize edilmiş 14 milyondan fazla yüksek çözünürlüklü görüntüden oluşan büyük ölçekli bir veritabanıdır. Görüntü sınıflandırma ve nesne algılama dahil olmak üzere görsel nesne tanıma araştırmalarında yaygın olarak kullanılır. Veri kümesinin açıklamaları ve hacmi, derin öğrenme modellerini eğitmek için zengin bir kaynak sağlar. Özellikle AlexNet, VGG ve ResNet gibi modeller, bilgisayarlı görünün ilerlemesindeki rolünü sergileyerek ImageNet kullanılarak eğitilmiş ve kıyaslanmıştır.
ImageNet veri kümesi üzerinde görüntü sınıflandırma için önceden eğitilmiş bir YOLO modelini nasıl kullanabilirim?
ImageNet veri kümesi üzerinde görüntü sınıflandırma için önceden eğitilmiş bir Ultralytics YOLO modelini kullanmak için şu adımları izle:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)Daha derinlemesine eğitim talimatları için Eğitim sayfamıza bak.
Neden ImageNet veri kümesi projelerim için Ultralytics YOLO26 önceden eğitilmiş modellerini kullanmalıyım?
Ultralytics YOLO26 önceden eğitilmiş modelleri, çeşitli bilgisayarlı görü görevleri için hız ve doğruluk açısından en son teknolojiyi sunar. Örneğin, %70,0 top-1 doğruluğu ve %89,4 top-5 doğruluğu ile YOLO26n-cls modeli, gerçek zamanlı uygulamalar için optimize edilmiştir. Önceden eğitilmiş modeller, sıfırdan eğitim için gereken hesaplama kaynaklarını azaltır ve geliştirme döngülerini hızlandırır. YOLO26 modellerinin performans metrikleri hakkında daha fazla bilgiyi ImageNet Önceden Eğitilmiş Modeller bölümünde bulabilirsin.
ImageNet veri kümesi nasıl yapılandırılmıştır ve neden önemlidir?
ImageNet veri kümesi, hiyerarşideki her düğümün bir eşküme kavramı (eş anlamlı terimler koleksiyonu) ile tanımlanan bir kategoriyi temsil ettiği WordNet hiyerarşisi kullanılarak düzenlenmiştir. Bu yapı, detaylı etiketlemeye izin vererek modelleri çok çeşitli nesneleri tanıyacak şekilde eğitmek için ideal hale getirir. ImageNet'in çeşitliliği ve etiketleme zenginliği, onu sağlam ve genelleştirilebilir derin öğrenme modelleri geliştirmek için değerli bir veri kümesi yapar. Bu organizasyon hakkında daha fazlası Veri Kümesi Yapısı bölümünde bulunabilir.
ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC) bilgisayarlı görüde hangi rolü oynar?
Her yıl düzenlenen ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), algoritmaları büyük ölçekli ve standart bir veri kümesi üzerinde değerlendirmek için rekabetçi bir platform sağlayarak bilgisayarlı görüdeki ilerlemeleri tetiklemede çok önemli olmuştur. Standart değerlendirme metrikleri sunarak görüntü sınıflandırma, nesne algılama ve görüntü bölütleme gibi alanlarda inovasyonu ve gelişimi teşvik eder. Yarışma, derin öğrenme ve bilgisayarlı görü teknolojileriyle nelerin mümkün olduğunun sınırlarını sürekli olarak zorlamıştır.