İçeriğe geç

KITTI Veri Kümesi

Kitti veri seti, otonom sürüş ve bilgisayarla görme için en etkili kıyaslama veri setlerinden biridir. Karlsruhe Teknoloji Enstitüsü ve Chicago'daki Toyota Teknoloji Enstitüsü tarafından yayınlanan bu veri seti, gerçek dünya sürüş senaryolarından toplanan stereo kamera, LiDAR ve GPS/IMU verilerini içermektedir.

Nesne algılama, derinlik tahmini, optik akış ve görsel odometri alanlarındaki algoritmaları değerlendirmek için yaygın olarak kullanılmaktadır. Veri seti, 2D nesne algılama görevleri için Ultralytics YOLO11 ile tamamen uyumludur ve eğitim ve değerlendirme için Ultralytics platformuna kolayca entegre edilebilir.

Veri Seti Yapısı

Uyarı

Kitti orijinal test seti, temel gerçek ek açıklamaları içermediği için burada hariç tutulmuştur.

Veri kümesi toplamda 7.481 görüntü içermektedir ve her biri arabalar, yayalar, bisikletliler ve diğer yol unsurları gibi nesneler için ayrıntılı açıklamalarla eşleştirilmiştir. Veri kümesi iki ana alt kümeye ayrılmıştır:

  • Eğitim seti: Model eğitimi için kullanılan açıklamalı etiketlere sahip 5.985 görüntü içerir.
  • Doğrulama seti: Performans değerlendirmesi ve kıyaslama için kullanılan ilgili açıklamalara sahip 1.496 görüntü içerir.

Uygulamalar

Kitti veri seti, otonom sürüş ve robotik alanındaki gelişmeleri mümkün kılarak aşağıdaki gibi görevleri destekliyor:

  • Otonom araç algısı: Kendi kendine sürüş sistemlerinde güvenli navigasyon için araçları, yayaları ve engelleri tespit etmek ve izlemek için eğitim modelleri.
  • 3B sahne anlama: Makinelerin uzamsal ortamları anlamasına yardımcı olmak için derinlik tahmini, stereo görüş ve 3B nesne konumlandırmayı destekleme.
  • Optik akış ve hareket tahmini: Nesnelerin hareketini tahmin etmek ve dinamik ortamlarda yörünge planlamasını iyileştirmek için hareket analizinin etkinleştirilmesi.
  • Bilgisayarla görme kıyaslaması: Nesne algılama ve izleme dahil olmak üzere çoklu görüş görevlerinde performansı değerlendirmek için standart bir ölçüt olarak hizmet eder.

Veri Seti YAML

Ultralytics , bir YAML dosyası kullanarak kitti veri kümesi yapılandırmasını tanımlar. Bu dosya, veri kümesi yollarını, sınıf etiketlerini ve eğitim için gerekli meta verileri belirtir. Yapılandırma dosyası ultralytics adresinde mevcuttur.

ultralytics.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Kitti dataset by Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago
# Documentation: https://docs.ultralytics.com/datasets/detect/kitti/
# Example usage: yolo train data=kitti.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── kitti ← downloads here (390.5 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: kitti # dataset root dir
train: images/train # train images (relative to 'path') 5985 images
val: images/val # val images (relative to 'path') 1496 images

names:
  0: car
  1: van
  2: truck
  3: pedestrian
  4: person_sitting
  5: cyclist
  6: tram
  7: misc

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/kitti.zip

Kullanım

Bir YOLO11n modelini 640 görüntü boyutuyla 100 epok boyunca kitti veri kümesi üzerinde eğitmek için aşağıdaki komutları kullanın. Daha fazla ayrıntı için Eğitim sayfasına bakın.

Eğitim Örneği

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on kitti dataset
results = model.train(data="kitti.yaml", epochs=100, imgsz=640)
yolo detect train data=kitti.yaml model=yolo11n.pt epochs=100 imgsz=640

Aynı yapılandırma dosyasını kullanarak değerlendirme, çıkarım ve dışa aktarma görevlerini doğrudan komut satırından veya Python API'sinden de gerçekleştirebilirsiniz.

Örnek Görüntüler ve Açıklamalar

Kitti veri seti çeşitli sürüş senaryoları sunmaktadır. Her görüntü, 2D nesne algılama görevleri için sınırlayıcı kutu ek açıklamaları içerir. Örnek, veri setinin zengin çeşitliliğini sergileyerek farklı gerçek dünya koşullarında sağlam model genellemesi sağlar.

Kitti örnek görüntüsü

Alıntılar ve Teşekkürler

Araştırmanızda kitti veri setini kullanırsanız, lütfen aşağıdaki makaleye atıfta bulunun:

Alıntı

@article{Geiger2013IJRR,
  author = {Andreas Geiger and Philip Lenz and Christoph Stiller and Raquel Urtasun},
  title = {Vision meets Robotics: The KITTI Dataset},
  journal = {International Journal of Robotics Research (IJRR)},
  year = {2013}
}

Bilgisayarla görme, robotik ve otonom sistemlerdeki ilerlemeyi şekillendirmeye devam eden bu kapsamlı veri setini sağladığı için KITTI Vision Benchmark Suite'e teşekkür ederiz. Daha fazla bilgi için kitti web sitesini ziyaret edin.

SSS

Kitti veri seti ne için kullanılır?

Kitti veri kümesi öncelikle otonom sürüşte bilgisayarla görme araştırmaları için kullanılmakta ve nesne algılama, derinlik tahmini, optik akış ve 3B yerelleştirme gibi görevleri desteklemektedir.

Kitti veri setine kaç resim dahil edilmiştir?

Veri kümesi, kentsel, kırsal ve otoyol sahnelerinde çekilen 5.985 etiketli eğitim görüntüsü ve 1.496 doğrulama görüntüsü içermektedir. Orijinal test seti, temel gerçek ek açıklamaları içermediği için burada hariç tutulmuştur.

Veri kümesinde hangi nesne sınıflarına açıklama eklenmiştir?

kitti, arabalar, yayalar, bisikletliler, kamyonlar, tramvaylar ve çeşitli yol kullanıcıları gibi nesneler için ek açıklamalar içerir.

Ultralytics YOLO11 modellerini kitti veri kümesini kullanarak eğitebilir miyim?

Evet, kitti Ultralytics YOLO11 ile tamamen uyumludur. Sağlanan YAML yapılandırma dosyasını kullanarak modelleri doğrudan eğitebilir ve doğrulayabilirsiniz.

Kitti veri kümesi yapılandırma dosyasını nerede bulabilirim?

YAML dosyasına ultralytics adresinden erişebilirsiniz.



📅 0 gün önce oluşturuldu ✏️ 0 gün önce güncellendi

Yorumlar