ImageNet veri kümesi WordNet hiyerarşisi kullanılarak düzenlenmiştir. Hiyerarşideki her düğüm bir kategoriyi temsil eder ve her kategori bir synset (eş anlamlı terimler koleksiyonu) tarafından tanımlanır. ImageNet'teki görüntülere bir veya daha fazla söz kümesi eklenir ve bu da çeşitli nesneleri ve aralarındaki ilişkileri tanımaya yönelik eğitim modelleri için zengin bir kaynak sağlar.
Her yıl düzenlenen ImageNet Large Scale Visual Recognition Challenge (ILSVRC) bilgisayarla görme alanında önemli bir etkinlik olmuştur. Araştırmacılara ve geliştiricilere algoritmalarını ve modellerini standartlaştırılmış değerlendirme ölçütleriyle büyük ölçekli bir veri kümesi üzerinde değerlendirmeleri için bir platform sağlamıştır. ILSVRC, görüntü sınıflandırma, nesne algılama ve diğer bilgisayarla görme görevleri için derin öğrenme modellerinin geliştirilmesinde önemli ilerlemelere yol açmıştır.
ImageNet veri kümesi, görüntü sınıflandırma, nesne algılama ve nesne lokalizasyonu gibi çeşitli bilgisayarla görme görevlerinde derin öğrenme modellerini eğitmek ve değerlendirmek için yaygın olarak kullanılmaktadır. AlexNet, VGG ve ResNet gibi bazı popüler derin öğrenme mimarileri ImageNet veri kümesi kullanılarak geliştirilmiş ve kıyaslanmıştır.
ImageNet veri kümesinde 224x224 görüntü boyutunda 100 epok için bir derin öğrenme modelini eğitmek için aşağıdaki kod parçacıklarını kullanabilirsiniz. Kullanılabilir bağımsız değişkenlerin kapsamlı bir listesi için Model Eğitimi sayfasına bakın.
Tren Örneği
ImageNet veri kümesi, binlerce nesne kategorisini kapsayan yüksek çözünürlüklü görüntüler içerir ve bilgisayarla görme modellerini eğitmek ve değerlendirmek için çeşitli ve kapsamlı bir veri kümesi sağlar. İşte veri kümesinden bazı görüntü örnekleri:
Örnek, ImageNet veri kümesindeki görüntülerin çeşitliliğini ve karmaşıklığını göstermekte ve sağlam bilgisayarla görme modellerini eğitmek için çeşitli bir veri kümesinin önemini vurgulamaktadır.
Araştırma veya geliştirme çalışmalarınızda ImageNet veri kümesini kullanıyorsanız, lütfen aşağıdaki makaleye atıfta bulunun:
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}
Olga Russakovsky, Jia Deng ve Li Fei-Fei liderliğindeki ImageNet ekibine, makine öğrenimi ve bilgisayarla görme araştırma topluluğu için değerli bir kaynak olarak ImageNet veri kümesini oluşturdukları ve sürdürdükleri için teşekkür ederiz. ImageNet veri kümesi ve yaratıcıları hakkında daha fazla bilgi için ImageNet web sitesini ziyaret edin.
ImageNet veri kümesi, WordNet eş kümeleri kullanılarak kategorize edilmiş 14 milyondan fazla yüksek çözünürlüklü görüntüden oluşan büyük ölçekli bir veritabanıdır. Görüntü sınıflandırma ve nesne algılama dahil olmak üzere görsel nesne tanıma araştırmalarında yaygın olarak kullanılmaktadır. Veri setinin ek açıklamaları ve büyük hacmi, derin öğrenme modellerini eğitmek için zengin bir kaynak sağlar. Özellikle AlexNet, VGG ve ResNet gibi modeller ImageNet kullanılarak eğitilmiş ve kıyaslanmış, bilgisayarla görmenin ilerlemesindeki rolünü göstermiştir.
ImageNet veri kümesinde görüntü sınıflandırması için önceden eğitilmiş bir Ultralytics YOLO modeli kullanmak için aşağıdaki adımları izleyin:
Tren Örneği
Daha ayrıntılı eğitim talimatları için Eğitim sayfamıza bakın.
Ultralytics YOLO11 ön eğitimli modelleri, çeşitli bilgisayarla görme görevleri için hız ve doğruluk açısından son teknoloji ürünü performans sunar. Örneğin, ilk 1 doğruluk oranı %69,0 ve ilk 5 doğruluk oranı %88,3 olan YOLO11n-cls modeli, gerçek zamanlı uygulamalar için optimize edilmiştir. Önceden eğitilmiş modeller, sıfırdan eğitim için gereken hesaplama kaynaklarını azaltır ve geliştirme döngülerini hızlandırır. ImageNet Önceden Eğitilmiş Modeller bölümünde YOLO11 modellerinin performans ölçümleri hakkında daha fazla bilgi edinin.
ImageNet veri kümesi WordNet hiyerarşisi kullanılarak düzenlenmiştir; burada hiyerarşideki her düğüm bir synset (eşanlamlı terimler koleksiyonu) tarafından tanımlanan bir kategoriyi temsil eder. Bu yapı, ayrıntılı ek açıklamalara olanak tanıyarak çok çeşitli nesneleri tanıyacak modelleri eğitmek için idealdir. ImageNet'in çeşitliliği ve açıklama zenginliği, onu sağlam ve genelleştirilebilir derin öğrenme modelleri geliştirmek için değerli bir veri kümesi haline getirmektedir. Bu organizasyon hakkında daha fazla bilgiyi Veri Kümesi Yapısı bölümünde bulabilirsiniz.
Her yıl düzenlenen ImageNet Büyük Ölçekli Görsel Tanıma Yarışması (ILSVRC), algoritmaları büyük ölçekli, standartlaştırılmış bir veri kümesi üzerinde değerlendirmek için rekabetçi bir platform sağlayarak bilgisayarla görme alanındaki gelişmeleri yönlendirmede çok önemli olmuştur. Standartlaştırılmış değerlendirme ölçütleri sunarak görüntü sınıflandırma, nesne algılama ve görüntü segmentasyonu gibi alanlarda inovasyonu ve gelişimi teşvik etmektedir. Bu yarışma, derin öğrenme ve bilgisayarla görme teknolojileri ile mümkün olanın sınırlarını sürekli olarak zorlamıştır.