Yapılandırma

YOLO ayarları ve hiperparametreleri, modelin performansı, hızı ve doğruluğu üzerinde kritik bir rol oynar. Bu ayarlar, eğitim, doğrulama ve tahmin dahil olmak üzere modelin çeşitli aşamalardaki davranışını etkileyebilir.



Watch: Mastering Ultralytics YOLO: Configuration

Ultralytics komutları şu sözdizimini kullanır:

Örnek
yolo TASK MODE ARGS

Burada:

Varsayılan ARG değerleri bu sayfada tanımlanmıştır ve cfg/default.yaml dosyasından gelir.

Görevler

Ultralytics YOLO modelleri, aşağıdakiler dahil olmak üzere çeşitli bilgisayarlı görü görevlerini gerçekleştirebilir:

  • Detect: Nesne algılama, bir görüntü veya video içindeki nesneleri tanımlar ve konumlandırır.
  • Segment: Örnek segmentasyonu, bir görüntüyü veya videoyu farklı nesnelere veya sınıflara karşılık gelen bölgelere ayırır.
  • Classify: Görüntü sınıflandırma, bir girdi görüntüsünün sınıf etiketini tahmin eder.
  • Pose: Poz tahmini, bir görüntü veya videodaki nesneleri tanımlar ve anahtar noktalarını tahmin eder.
  • OBB: Yönlendirilmiş Sınırlayıcı Kutular, uydu veya tıbbi görüntüler için uygun olan döndürülmüş sınırlayıcı kutuları kullanır.
ArgümanVarsayılanAçıklama
task'detect'Specifies the YOLO task: detect for object detection, segment for segmentation, classify for classification, pose for pose estimation, and obb for oriented bounding boxes. Each task is tailored to specific outputs and problems in image and video analysis.

Görevler Kılavuzu

Modlar

Ultralytics YOLO modelleri, her biri model yaşam döngüsünün belirli bir aşaması için tasarlanmış farklı modlarda çalışır:

  • Train: Bir YOLO modelini özel bir veri kümesi üzerinde eğit.
  • Val: Eğitilmiş bir YOLO modelini doğrula.
  • Predict: Yeni görüntüler veya videolar üzerinde tahmin yapmak için eğitilmiş bir YOLO modeli kullan.
  • Export: Bir YOLO modelini dağıtım için dışa aktar.
  • Track: Bir YOLO modeli kullanarak nesneleri gerçek zamanlı olarak izle.
  • Benchmark: YOLO dışa aktarımlarının (ONNX, TensorRT, vb.) hızını ve doğruluğunu kıyasla.
ArgümanVarsayılanAçıklama
mode'train'YOLO modelinin çalışma modunu belirtir: model eğitimi için train, doğrulama için val, çıkarım için predict, dağıtım formatlarına dönüştürme için export, nesne izleme için track ve performans değerlendirmesi için benchmark. Her mod, geliştirmeden dağıtıma kadar farklı aşamaları destekler.

Modlar Kılavuzu

Eğitim Ayarları

YOLO modelleri için eğitim ayarları, modelin performansını, hızını ve doğruluğunu etkileyen hiperparametreleri ve yapılandırmaları içerir. Temel ayarlar arasında yığın boyutu, öğrenme oranı, momentum ve ağırlık azalması bulunur. Optimize edici, kayıp fonksiyonu ve veri kümesi bileşimi seçimi de eğitimi etkiler. İnce ayar ve deneyler, optimum performans için çok önemlidir. Daha fazla ayrıntı için Ultralytics giriş noktası fonksiyonuna bakabilirsin.

ArgümanTürVarsayılanAçıklama
modelstrNoneEğitim için model dosyasını belirtir. Bir .pt önceden eğitilmiş modeline veya bir .yaml yapılandırma dosyasına giden bir yolu kabul eder. Model yapısını tanımlamak veya ağırlıkları başlatmak için gereklidir.
datastrNoneVeri kümesi yapılandırma dosyasına giden yol (örneğin coco8.yaml). Bu dosya, eğitim ve doğrulama verilerine giden yollar, sınıf adları ve sınıf sayısı dahil olmak üzere veri kümesine özgü parametreleri içerir.
epochsint100Toplam eğitim dönemi (epoch) sayısı. Her epoch, tüm veri kümesinin üzerinden tam bir geçişi temsil eder. Bu değeri ayarlamak, eğitim süresini ve model performansını etkileyebilir.
timefloatNoneSaat cinsinden maksimum eğitim süresi. Ayarlanırsa, epochs argümanını geçersiz kılar ve eğitimin belirtilen süreden sonra otomatik olarak durmasını sağlar. Zaman kısıtlı eğitim senaryoları için yararlıdır.
patienceint100Eğitimi erken durdurmadan önce doğrulama metriklerinde iyileşme olmadan beklenecek dönem sayısı. Performans sabitlendiğinde eğitimi durdurarak aşırı öğrenmeyi önlemeye yardımcı olur.
batchint veya float16Yığın boyutu, üç mod ile: tam sayı olarak ayarlanabilir (örneğin batch=16), %60 GPU bellek kullanımı için otomatik mod (batch=-1) veya belirtilen kullanım oranı ile otomatik mod (batch=0.70).
imgszint640Eğitim için hedef görüntü boyutu. Görüntüler, belirtilen değere eşit kenarlara sahip karelere yeniden boyutlandırılır (rect=False ise), YOLO modelleri için en boy oranını korur ancak RT-DETR için korumaz. Model doğruluğunu ve hesaplama karmaşıklığını etkiler.
saveboolTrueEğitim kontrol noktalarının ve nihai model ağırlıklarının kaydedilmesini sağlar. Eğitimi devam ettirmek veya model dağıtımı için yararlıdır.
save_periodint-1Dönemler halinde belirtilen model kontrol noktalarını kaydetme sıklığı. -1 değeri bu özelliği devre dışı bırakır. Uzun eğitim oturumları sırasında ara modelleri kaydetmek için yararlıdır.
cacheboolFalseVeri kümesi görüntülerinin bellekte (True/ram), diskte (disk) önbelleğe alınmasını sağlar veya devre dışı bırakır (False). Artan bellek kullanımı pahasına disk I/O'sunu azaltarak eğitim hızını artırır.
deviceint veya str veya listNoneEğitim için hesaplama cihazını/cihazlarını belirtir: tek bir GPU (device=0), çoklu GPU'lar (device=[0,1]), CPU (device=cpu), Apple silikon için MPS (device=mps), Huawei Ascend NPU (device=npu veya device=npu:0) veya en boşta olan GPU'nun otomatik seçimi (device=-1) ya da boşta olan birden fazla GPU (device=[-1,-1]).
workersint8Veri yükleme için çalışan iş parçacığı sayısı (Çoklu GPU eğitimi ise her RANK için). Özellikle çoklu GPU kurulumlarında veri ön işlemenin ve modele beslemenin hızını etkiler.
projectstrNoneEğitim çıktılarının kaydedildiği proje dizininin adı. Farklı deneylerin düzenli bir şekilde depolanmasını sağlar.
namestrNoneEğitim çalışmasının adı. Eğitim günlüklerinin ve çıktılarının depolandığı proje klasörü içinde bir alt dizin oluşturmak için kullanılır.
exist_okboolFalseTrue ise, mevcut bir proje/isim dizininin üzerine yazılmasına izin verir. Önceki çıktıları manuel olarak temizlemeye gerek kalmadan yinelemeli deneyler için yararlıdır.
pretrainedbool veya strTrueEğitime önceden eğitilmiş ağırlıklarla mı başlanacağını belirler. Bir boolean değer veya yüklenecek ağırlıklara giden bir dizgi yolu olabilir. pretrained=False, model mimarisini korurken rastgele başlatılan ağırlıklarla eğitir.
optimizerstr'auto'Eğitim için optimize edici seçimi. Seçenekler arasında SGD, MuSGD, Adam, Adamax, AdamW, NAdam, RAdam, RMSProp veya model yapılandırmasına dayalı otomatik seçim için auto bulunur. Yakınsama hızını ve kararlılığını etkiler.
seedint0Eğitim için rastgele tohum değerini ayarlar, aynı yapılandırmalara sahip çalıştırmalar arasında sonuçların tekrarlanabilirliğini sağlar.
deterministicboolTrueDeterministik algoritma kullanımını zorunlu kılar, tekrarlanabilirliği sağlar ancak deterministik olmayan algoritmalar üzerindeki kısıtlama nedeniyle performansı ve hızı etkileyebilir.
verboseboolTrueEğitim sırasında ayrıntılı çıktıyı etkinleştirir, ilerleme çubuklarını, dönem başına metrikleri ve ek eğitim bilgilerini konsolda görüntüler.
single_clsboolFalseEğitim sırasında çok sınıflı veri kümelerindeki tüm sınıfları tek bir sınıf olarak ele alır. İkili sınıflandırma görevleri için veya sınıflandırmadan ziyade nesne varlığına odaklanırken yararlıdır.
classeslist[int]NoneEğitim yapılacak sınıf kimliklerinin bir listesini belirtir. Eğitim sırasında yalnızca belirli sınıfları filtrelemek ve bunlara odaklanmak için yararlıdır.
rectboolFalseMinimum dolgu stratejisini etkinleştirir—bir yığındaki görüntüler ortak bir boyuta ulaşmak için minimum düzeyde doldurulur, en uzun kenar imgsz değerine eşittir. Verimliliği ve hızı artırabilir ancak model doğruluğunu etkileyebilir.
multi_scalefloat0.0Her yığında imgsz değerini +/- multi_scale kadar rastgele değiştirir (örneğin 0.25 -> 0.75x ila 1.25x), model adım katlarına yuvarlanır; 0.0 çok ölçekli eğitimi devre dışı bırakır.
cos_lrboolFalseDönemler boyunca bir kosinüs eğrisini takip ederek öğrenme oranını ayarlayan bir kosinüs öğrenme oranı zamanlayıcısı kullanır. Daha iyi yakınsama için öğrenme oranını yönetmeye yardımcı olur.
close_mosaicint10Eğitimi tamamlamadan önce stabilize etmek için son N epokta veri artırma işlemini devre dışı bırakır. 0 olarak ayarlanması bu özelliği kapatır.
resumeboolFalseEğitimi en son kaydedilen kontrol noktasından sürdürür. Model ağırlıklarını, optimize edici durumunu ve epok sayısını otomatik olarak yükleyerek eğitimin kesintisiz devam etmesini sağlar.
ampboolTrueOtomatik Karma Hassasiyet (AMP) eğitimini etkinleştirerek bellek kullanımını azaltır ve doğruluk üzerindeki minimal etkiyle eğitim hızını artırabilir.
fractionfloat1.0Eğitim için kullanılacak veri kümesi oranını belirtir. Tam veri kümesinin bir alt kümesinde eğitim yapmaya olanak tanır, deneyler için veya kaynaklar kısıtlı olduğunda kullanışlıdır.
profileboolFalseEğitim sırasında ONNX ve TensorRT hızlarının profillenmesini etkinleştirir; model dağıtımını optimize etmek için kullanışlıdır.
freezeint veya listNoneModelin ilk N katmanını veya belirtilen indeksli katmanları dondurarak eğitilebilir parametre sayısını azaltır. İnce ayar veya transfer öğrenimi için kullanışlıdır.
lr0float0.01Başlangıç öğrenme oranı (örn. SGD=1E-2, Adam=1E-3). Bu değeri ayarlamak, model ağırlıklarının güncellenme hızını etkileyerek optimizasyon süreci için kritiktir.
lrffloat0.01Başlangıç oranının bir fraksiyonu olarak nihai öğrenme oranı = (lr0 * lrf), öğrenme oranını zamanla ayarlamak için zamanlayıcılarla birlikte kullanılır.
momentumfloat0.937SGD için momentum faktörü veya Adam optimize ediciler için beta1, geçmiş gradyanların mevcut güncellemeye dahil edilmesini etkiler.
weight_decayfloat0.0005Aşırı öğrenmeyi (overfitting) önlemek için büyük ağırlıkları cezalandıran L2 düzenlileştirme terimi.
warmup_epochsfloat3.0Öğrenme oranı ısınması için epok sayısı; eğitimi erken aşamada stabilize etmek için öğrenme oranını düşük bir değerden başlangıç değerine kademeli olarak artırır.
warmup_momentumfloat0.8Isınma aşaması için başlangıç momentumu; ısınma süresi boyunca belirlenen momentuma kademeli olarak ayarlanır.
warmup_bias_lrfloat0.1Isınma aşamasında sapma (bias) parametreleri için öğrenme oranı; ilk epoklarda model eğitiminin stabilize edilmesine yardımcı olur.
boxfloat7.5Kayıp fonksiyonunda kutu kaybı bileşeninin ağırlığı; sınırlayıcı kutu koordinatlarını doğru tahmin etmeye ne kadar odaklanılacağını etkiler.
clsfloat0.5Toplam kayıp fonksiyonunda sınıflandırma kaybının ağırlığı; diğer bileşenlere kıyasla doğru sınıf tahmini önemini etkiler.
cls_pwfloat0.0Ters sınıf frekansını kullanarak sınıf dengesizliğini yönetmek için sınıf ağırlıklandırma gücü. 0.0 sınıf ağırlıklandırmayı devre dışı bırakır, 1.0 tam ters frekans ağırlıklandırması uygular. 0 ile 1 arasındaki değerler kısmi ağırlıklandırma sağlar.
dflfloat1.5Belirli YOLO sürümlerinde ince taneli sınıflandırma için kullanılan dağılım odak kaybının ağırlığı.
posefloat12.0Poz tahmini için eğitilen modellerde poz kaybının ağırlığı; poz anahtar noktalarını doğru tahmin etmeye verilen önemi etkiler.
kobjfloat1.0Poz tahmini modellerinde anahtar nokta nesnellik kaybının ağırlığı; tespit güveni ile poz doğruluğunu dengeler.
rlefloat1.0Poz tahmini modellerinde kalıntı log-olasılık tahmin kaybının ağırlığı; anahtar nokta konumlandırmasının hassasiyetini etkiler.
anglefloat1.0OBB modellerinde açı kaybının ağırlığı; yönlendirilmiş sınırlayıcı kutu açı tahminlerinin hassasiyetini etkiler.
nbsint64Kayıp normalizasyonu için nominal yığın boyutu.
overlap_maskboolTrueNesne maskelerinin eğitim için tek bir maskede birleştirilip birleştirilmeyeceğini veya her nesne için ayrı tutulup tutulmayacağını belirler. Çakışma durumunda, birleştirme sırasında küçük maske büyük maskenin üzerine bindirilir.
mask_ratioint4Segmentasyon maskeleri için alt örnekleme oranı; eğitim sırasında kullanılan maskelerin çözünürlüğünü etkiler.
dropoutfloat0.0Sınıflandırma görevlerinde düzenlileştirme için dropout oranı; eğitim sırasında birimleri rastgele devre dışı bırakarak aşırı öğrenmeyi önler.
valboolTrueEğitim sırasında doğrulamayı etkinleştirerek model performansının ayrı bir veri kümesi üzerinde periyodik değerlendirilmesine olanak tanır.
plotsboolTrueEğitim ve doğrulama metriklerinin ve tahmin örneklerinin grafiklerini oluşturur ve kaydeder; model performansı ve öğrenme süreci hakkında görsel içgörüler sağlar.
compilebool veya strFalsePyTorch 2.x torch.compile grafik derlemesini backend='inductor' ile etkinleştirir. True"default" kabul eder, False devre dışı bırakır veya "default", "reduce-overhead", "max-autotune-no-cudagraphs" gibi bir dize modu alır. Desteklenmiyorsa uyarı vererek eager moduna döner.
max_detint300Eğitimin doğrulama aşamasında tutulan maksimum nesne sayısını belirtir.
Yığın Boyutu Ayarları hakkında not

batch argümanı üç yapılandırma seçeneği sunar:

  • Sabit Yığın Boyutu: Bir tam sayı ile yığın başına görüntü sayısını belirtin (örn. batch=16).
  • Otomatik Mod (%60 GPU Belleği): Yaklaşık %60 CUDA bellek kullanımına otomatik ayarlama için batch=-1 kullanın.
  • Kullanım Oranı ile Otomatik Mod: Belirtilen GPU bellek kullanımına göre ayarlamak için bir oran belirleyin (örn. batch=0.70).

Eğitim Kılavuzu

Tahmin Ayarları

YOLO modelleri için tahmin ayarları, çıkarım sırasında performansı, hızı ve doğruluğu etkileyen hiperparametreleri ve yapılandırmaları içerir. Temel ayarlar arasında güven eşiği, Maksimum Olmayan Baskılama (NMS) eşiği ve sınıf sayısı bulunur. Giriş verisi boyutu, formatı ve maskeler gibi ek özellikler de tahminleri etkiler. Bu ayarları optimize etmek, en iyi performans için gereklidir.

Çıkarım argümanları:

ArgümanTürVarsayılanAçıklama
sourcestr veya int veya NoneNoneÇıkarım için veri kaynağını belirtir. Bir görüntü yolu, video dosyası, dizin, URL veya canlı yayınlar için cihaz kimliği olabilir. Belirtilmezse bir uyarı kaydedilir ve model yerleşik demo varlıklarına (ultralytics/assets veya OBB için bir demo URL'si) döner. Çok çeşitli formatları ve kaynakları destekleyerek farklı giriş türleri genelinde esnek uygulama sağlar.
conffloat0.25Tespitler için minimum güven eşiğini belirler. Bu eşiğin altındaki güvenle tespit edilen nesneler göz ardı edilecektir. Bu değeri ayarlamak yanlış pozitifleri azaltmaya yardımcı olabilir.
ioufloat0.7Maksimum Olmayan Baskılama (NMS) için Kesişim Üzerinden Birlik (IoU) eşiği. Daha düşük değerler çakışan kutuları eleyerek daha az tespit sonucu verir; kopyaları azaltmak için kullanışlıdır.
imgszint veya tuple640Letterbox target. An integer gives a square N×N; a tuple gives (height, width). With rect=True, the actual tensor may be smaller than this target due to minimum-rectangle padding. Use rect=False for a fixed size. See Fixed shape vs minimum rectangle.
rectboolTrueEğer True ise, mümkün olduğunda minimum dikdörtgen dolgusu kullanın (aynı şekilli yığın ve desteklenen arka uç). Eğer False ise, her zaman tam imgsz değerine dolgu yapın. Bkz. Sabit şekil vs minimum dikdörtgen.
halfboolFalseDoğruluk üzerindeki minimal etkiyle desteklenen GPU'larda model çıkarımını hızlandırabilen yarı hassasiyetli (FP16) çıkarımı etkinleştirir.
devicestrNoneÇıkarım için cihazı belirtir (örn. cpu, cuda:0, 0, npu veya npu:0). Kullanıcıların CPU, belirli bir GPU, Huawei Ascend NPU veya model yürütme için diğer bilgi işlem cihazlarını seçmelerine olanak tanır.
batchint1Çıkarım için yığın boyutunu belirtir (yalnızca kaynak bir dizin, video dosyası veya .txt dosyası olduğunda çalışır). Daha büyük bir yığın boyutu daha yüksek verim sağlayarak çıkarım için gereken toplam süreyi kısaltabilir.
max_detint300Görüntü başına izin verilen maksimum tespit sayısı. Modelin tek bir çıkarımda tespit edebileceği toplam nesne sayısını sınırlar ve yoğun sahnelerde aşırı çıktı oluşmasını önler.
vid_strideint1Video girişleri için kare aralığı (stride). İşlem hızını artırmak için videolardaki karelerin atlanmasına olanak tanır, ancak zamansal çözünürlükten ödün verir. 1 değeri her kareyi işlerken, daha yüksek değerler kareleri atlar.
stream_bufferboolFalseVideo akışları için gelen karelerin sıraya alınıp alınmayacağını belirler. Eğer False ise, yeni karelere yer açmak için eski kareler atılır (gerçek zamanlı uygulamalar için optimize edilmiştir). Eğer True ise, yeni kareleri bir arabelleğe alır ve hiçbir karenin atlanmamasını sağlar; ancak çıkarım FPS'si akış FPS'sinden düşükse gecikmeye neden olur.
visualizeboolFalseÇıkarım sırasında model özelliklerinin görselleştirilmesini etkinleştirir ve modelin ne "gördüğüne" dair içgörüler sağlar. Hata ayıklama ve model yorumlama için kullanışlıdır.
augmentboolFalseTahminler için test zamanı artırmayı (TTA) etkinleştirir; çıkarım hızından ödün vererek tespit sağlamlığını potansiyel olarak artırır.
agnostic_nmsboolFalseSınıftan bağımsız Non-Maximum Suppression (NMS) yöntemini etkinleştirir; bu, farklı sınıflara ait çakışan kutuları birleştirir. Sınıf çakışmasının yaygın olduğu çok sınıflı tespit senaryolarında yararlıdır. Uçtan uca modeller için (YOLO26, YOLOv10), bu özellik yalnızca aynı tespitin birden fazla sınıf etiketiyle (IoU=1.0 kopyaları) görünmesini engeller ve farklı kutular arasında IoU eşik tabanlı bir bastırma işlemi gerçekleştirmez.
classeslist[int]NoneTahminleri belirli sınıf kimliklerine (class ID) göre filtreler. Yalnızca belirtilen sınıflara ait tespitler döndürülür. Çok sınıflı tespit görevlerinde ilgili nesnelere odaklanmak için kullanışlıdır.
retina_masksboolFalseYüksek çözünürlüklü segmentasyon maskeleri döndürür. Etkinleştirilirse, döndürülen maskeler (masks.data) orijinal görüntü boyutuyla eşleşir. Devre dışı bırakılırsa, çıkarım sırasında kullanılan görüntü boyutuna sahip olurlar.
embedlist[int]NoneÖzellik vektörlerinin veya embeddings kısımlarının çıkarılacağı katmanları belirtir. Kümeleme veya benzerlik arama gibi sonraki görevler için kullanışlıdır.
projectstrNonesave özelliği etkinleştirildiğinde tahmin çıktılarının kaydedileceği proje dizininin adı.
namestrNoneTahmin çalıştırmasının adı. save etkinleştirildiğinde tahmin çıktılarının saklandığı proje klasörü içinde bir alt dizin oluşturmak için kullanılır.
streamboolFalseTüm kareleri aynı anda belleğe yüklemek yerine, Results nesnelerinden oluşan bir jeneratör döndürerek uzun videolar veya çok sayıda görüntü için bellek açısından verimli işlem yapılmasını sağlar.
verboseboolTrueTahmin süreci hakkında gerçek zamanlı geri bildirim sağlamak için terminalde ayrıntılı çıkarım günlüklerinin görüntülenip görüntülenmeyeceğini kontrol eder.
compilebool veya strFalsePyTorch 2.x torch.compile grafik derlemesini backend='inductor' ile etkinleştirir. True"default" kabul eder, False devre dışı bırakır veya "default", "reduce-overhead", "max-autotune-no-cudagraphs" gibi bir dize modu alır. Desteklenmiyorsa uyarı vererek eager moduna döner.
end2endboolNoneNMS içermeyen çıkarımı destekleyen YOLO modellerinde (YOLO26, YOLOv10) uçtan uca modunu geçersiz kılar. False olarak ayarlamak, tahmini geleneksel NMS hattını kullanarak çalıştırmanıza ve ayrıca iou argümanını kullanmanıza olanak tanır. Ayrıntılar için Uçtan Uca Tespit rehberine bak.

Görselleştirme argümanları:

ArgümanTürVarsayılanAçıklama
showboolFalseEğer True ise, açıklamalı görüntüleri veya videoları bir pencerede görüntüler. Geliştirme veya test sırasında anında görsel geri bildirim için kullanışlıdır.
saveboolFalse or TrueAçıklamalı görüntülerin veya videoların dosyalara kaydedilmesini etkinleştirir. Dokümantasyon, ileri analiz veya sonuçları paylaşmak için kullanışlıdır. CLI kullanırken varsayılan olarak True, Python'da kullanıldığında False değerini alır.
save_framesboolFalseVideoları işlerken, tek tek kareleri görüntü olarak kaydeder. Belirli kareleri ayıklamak veya ayrıntılı kare kare analiz için kullanışlıdır.
save_txtboolFalseTespit sonuçlarını [class] [x_center] [y_center] [width] [height] [confidence] formatını izleyerek bir metin dosyasına kaydeder. Diğer analiz araçlarıyla entegrasyon için kullanışlıdır.
save_confboolFalseKaydedilen metin dosyalarına güven puanlarını (confidence scores) dahil eder. İşlem sonrası ve analiz için mevcut ayrıntıyı artırır.
save_cropboolFalseTespit edilen nesnelerin kırpılmış görüntülerini kaydeder. Veri seti artırma, analiz veya belirli nesneler için odaklanmış veri setleri oluşturmak için kullanışlıdır.
show_labelsboolTrueGörsel çıktıda her tespit için etiketleri görüntüler. Tespit edilen nesnelerin anında anlaşılmasını sağlar.
show_confboolTrueEtiketle birlikte her tespit için güven puanını görüntüler. Her bir tespit için modelin kesinliği hakkında fikir verir.
show_boxesboolTrueTespit edilen nesnelerin etrafına sınırlayıcı kutular (bounding boxes) çizer. Görüntülerdeki veya video karelerindeki nesnelerin görsel tanımlaması ve konumlandırılması için gereklidir.
line_widthint or NoneNoneSınırlayıcı kutuların çizgi kalınlığını belirtir. None ise, çizgi kalınlığı otomatik olarak görüntü boyutuna göre ayarlanır. Netlik için görsel özelleştirme sağlar.

Tahmin Rehberi

Doğrulama Ayarları

YOLO modelleri için doğrulama ayarları, performansı bir doğrulama veri setinde değerlendirmek için hiperparametreleri ve yapılandırmaları içerir. Bu ayarlar performansı, hızı ve doğruluğu etkiler. Yaygın ayarlar arasında yığın boyutu (batch size), doğrulama sıklığı ve performans metrikleri bulunur. Doğrulama veri setinin boyutu ve bileşimi ile birlikte özel görev de süreci etkiler.

ArgümanTürVarsayılanAçıklama
datastrNoneVeri seti yapılandırma dosyasına (ör. coco8.yaml) giden yolu belirtir. Bu dosya, doğrulama verisine giden yolu içermelidir.
imgszint640Giriş görüntülerinin boyutunu tanımlar. İşlenmeden önce tüm görüntüler bu boyuta yeniden boyutlandırılır. Daha büyük boyutlar, küçük nesneler için doğruluğu artırabilir ancak hesaplama süresini uzatır.
batchint16Yığın başına düşen görüntü sayısını ayarlar. Daha yüksek değerler GPU belleğini daha verimli kullanır ancak daha fazla VRAM gerektirir. Kullanılabilir donanım kaynaklarına göre ayarla.
save_jsonboolFalseEğer True ise, sonuçları daha fazla analiz, diğer araçlarla entegrasyon veya COCO gibi değerlendirme sunucularına gönderim için bir JSON dosyasına kaydeder.
conffloat0.001Tespitler için minimum güven eşiğini ayarlar. Daha düşük değerler geri çağırmayı (recall) artırır ancak daha fazla yanlış pozitif (false positive) ortaya çıkarabilir. Hassasiyet-geri çağırma eğrilerini hesaplamak için doğrulama sırasında kullanılır.
ioufloat0.7Sets the Intersection Over Union threshold for Non-Maximum Suppression. Controls duplicate detection elimination.
max_detint300Görüntü başına maksimum tespit sayısını sınırlar. Yoğun sahnelerde aşırı tespiti önlemek ve hesaplama kaynaklarını yönetmek için kullanışlıdır.
halfboolFalseYarı hassasiyetli (FP16) hesaplamayı etkinleştirir; bellek kullanımını azaltır ve doğruluk üzerinde minimum etki ile hızı artırabilir.
devicestrNoneDoğrulama için cihazı belirtir (cpu, cuda:0, npu, npu:0 vb.). None olduğunda, mevcut en iyi cihazı otomatik olarak seçer. Birden fazla CUDA cihazı virgülle ayrılarak belirtilebilir.
dnnboolFalseEğer True ise, ONNX model çıkarımı için OpenCV DNN modülünü kullanır ve PyTorch çıkarım yöntemlerine bir alternatif sunar.
plotsboolTrueTrue olarak ayarlandığında, model performansının görsel değerlendirmesi için tahminlere karşı temel doğruluk (ground truth), karışıklık matrisleri ve PR eğrileri oluşturur ve kaydeder.
classeslist[int]NoneDeğerlendirilecek sınıf kimliklerinin bir listesini belirtir. Değerlendirme sırasında belirli sınıfları filtrelemek ve yalnızca onlara odaklanmak için kullanışlıdır.
rectboolTrueEğer True ise, yığın oluşturma için dikdörtgensel çıkarım kullanır; dolguyu (padding) azaltır ve görüntüleri orijinal en boy oranlarında işleyerek hızı ve verimliliği potansiyel olarak artırır.
splitstr'val'Doğrulama için kullanılacak veri seti bölümünü belirler (val, test veya train). Performans değerlendirmesi için veri segmenti seçiminde esneklik sağlar.
projectstrNoneDoğrulama çıktılarının kaydedileceği proje dizininin adı. Farklı deneylerden veya modellerden gelen sonuçları düzenlemeye yardımcı olur.
namestrNoneDoğrulama çalıştırmasının adı. Proje klasörü içinde doğrulama günlüklerinin ve çıktılarının saklandığı bir alt dizin oluşturmak için kullanılır.
verboseboolTrueEğer True ise, sınıf bazlı metrikler, yığın ilerlemesi ve ek hata ayıklama bilgileri dahil olmak üzere doğrulama süreci sırasında ayrıntılı bilgileri görüntüler.
save_txtboolFalseEğer True ise, tespit sonuçlarını görüntü başına bir dosya olacak şekilde metin dosyalarına kaydeder; ileri analiz, özel işlem sonrası veya diğer sistemlerle entegrasyon için kullanışlıdır.
save_confboolFalseEğer True ise, save_txt etkinleştirildiğinde kaydedilen metin dosyalarına güven değerlerini dahil eder; analiz ve filtreleme için daha ayrıntılı çıktı sağlar.
workersint8Veri yükleme için çalışan iş parçacığı sayısı. Daha yüksek değerler veri ön işlemesini hızlandırabilir ancak CPU kullanımını artırabilir. 0 olarak ayarlamak, bazı ortamlarda daha kararlı olabilen ana iş parçacığını kullanır.
augmentboolFalseDoğrulama sırasında test zamanı artırmayı (TTA) etkinleştirir; girişin dönüştürülmüş sürümleri üzerinde çıkarım çalıştırarak, çıkarım hızından ödün verip tespit doğruluğunu potansiyel olarak artırır.
agnostic_nmsboolFalseSınıftan bağımsız Non-Maximum Suppression yöntemini etkinleştirir; bu, tahmin edilen sınıftan bağımsız olarak çakışan kutuları birleştirir. Örnek odaklı uygulamalar için kullanışlıdır. Uçtan uca modeller için (YOLO26, YOLOv10), bu özellik yalnızca aynı tespitin birden fazla sınıf etiketiyle (IoU=1.0 kopyaları) görünmesini engeller ve farklı kutular arasında IoU eşik tabanlı bir bastırma işlemi gerçekleştirmez.
single_clsboolFalseDoğrulama sırasında tüm sınıfları tek bir sınıf olarak ele alır. İkili tespit görevlerinde model performansını değerlendirmek veya sınıf ayrımlarının önemli olmadığı durumlar için kullanışlıdır.
visualizeboolFalseHer görüntü için temel doğrulukları (ground truths), gerçek pozitifleri, yanlış pozitifleri ve yanlış negatifleri görselleştirir. Hata ayıklama ve model yorumlama için kullanışlıdır.
compilebool veya strFalsePyTorch 2.x torch.compile grafik derlemesini backend='inductor' ile etkinleştirir. True"default" kabul eder, False devre dışı bırakır veya "default", "reduce-overhead", "max-autotune-no-cudagraphs" gibi bir dize modu alır. Desteklenmiyorsa uyarı vererek eager moduna döner.
end2endboolNoneNMS içermeyen çıkarımı destekleyen YOLO modellerinde (YOLO26, YOLOv10) uçtan uca modunu geçersiz kılar. False olarak ayarlamak, doğrulamayı geleneksel NMS hattını kullanarak çalıştırmanıza ve ayrıca iou argümanını kullanmanıza olanak tanır.

Optimum performans sağlamak ve aşırı öğrenmeyi tespit edip önlemek için dikkatli ince ayar ve deneme çok önemlidir.

Doğrulama Rehberi

Dışa Aktarma Ayarları

YOLO modelleri için dışa aktarma ayarları, modeli farklı ortamlarda kullanmak üzere kaydetme veya dışa aktarma yapılandırmalarını içerir. Bu ayarlar performansı, boyutu ve uyumluluğu etkiler. Temel ayarlar arasında dışa aktarılan dosya formatı (ör. ONNX, TensorFlow SavedModel), hedef cihaz (ör. CPU, GPU) ve maskeler gibi özellikler bulunur. Modelin görevi ve hedef ortamın kısıtlamaları da dışa aktarma sürecini etkiler.

ArgümanTürVarsayılanAçıklama
formatstr'torchscript''onnx', 'torchscript', 'engine' (TensorRT) veya diğerleri gibi dışa aktarılan model için hedef format. Her format farklı dağıtım ortamlarıyla uyumluluk sağlar.
imgszint veya tuple640Desired image size for the model input. Can be an integer for square images (e.g., 640 for 640×640) or a tuple (height, width) for specific dimensions.
kerasboolFalseTensorFlow SavedModel için Keras formatına dışa aktarmayı etkinleştirir; TensorFlow sunumu ve API'leriyle uyumluluk sağlar.
optimizeboolFalseTorchScript'e dışa aktarırken mobil cihazlar için optimizasyon uygular; model boyutunu potansiyel olarak küçültür ve çıkarım performansını artırır. NCNN formatı veya CUDA cihazlarıyla uyumlu değildir. DeepX için, çıkarım gecikmesini azaltan ve derleme süresini artıran daha yüksek bir derleyici optimizasyonunu etkinleştirir.
halfboolFalseFP16 (yarı hassasiyetli) nicelemeyi etkinleştirir; model boyutunu küçültür ve desteklenen donanımlarda çıkarımı hızlandırabilir. INT8 niceleme veya yalnızca CPU dışa aktarmalarıyla uyumlu değildir. Yalnızca belirli formatlar için kullanılabilir, ör. ONNX (aşağıya bakınız).
int8boolFalseINT8 nicelemeyi etkinleştirir; modeli daha da sıkıştırır ve minimum doğruluk kaybıyla çıkarımı hızlandırır; öncelikle uç cihazlar için. TensorRT ile kullanıldığında, eğitim sonrası niceleme (PTQ) gerçekleştirir.
dynamicboolFalseTorchScript, ONNX, OpenVINO, TensorRT ve CoreML dışa aktarmaları için dinamik giriş boyutlarına izin verir; değişen görüntü boyutlarını işlemede esnekliği artırır. INT8 ile TensorRT kullanılırken otomatik olarak True olarak ayarlanır.
simplifyboolTrueONNX dışa aktarmaları için model grafiğini onnxslim ile basitleştirir; performansı ve çıkarım motorlarıyla uyumluluğu potansiyel olarak artırır.
opsetintNoneFarklı ONNX ayrıştırıcıları ve çalışma zamanlarıyla uyumluluk için ONNX opset sürümünü belirtir. Ayarlanmazsa, desteklenen en son sürümü kullanır.
workspacefloat veya NoneNoneBellek kullanımı ve performans arasında denge kurarak, TensorRT optimizasyonları için GiB cinsinden maksimum çalışma alanı boyutunu ayarlar. TensorRT tarafından cihazın maksimum kapasitesine kadar otomatik tahsis için None değerini kullan.
nmsboolFalseDesteklendiğinde (bkz. Dışa Aktarma Formatları), dışa aktarılan modele NMS (Non-Maximum Suppression) ekleyerek tespit sonrası işleme verimliliğini artırır. Uçtan uca modeller için kullanılamaz.
batchint1Dışa aktarılan modelin toplu çıkarım boyutunu veya predict modunda aynı anda işleyeceği maksimum görüntü sayısını belirtir. Edge TPU dışa aktarımları için bu değer otomatik olarak 1'e ayarlanır.
devicestrNoneDışa aktarma için cihazı belirtir: GPU (device=0), CPU (device=cpu), Apple silicon için MPS (device=mps), Huawei Ascend NPU (device=npu veya device=npu:0) veya NVIDIA Jetson için DLA (device=dla:0 veya device=dla:1). TensorRT dışa aktarımları otomatik olarak GPU kullanır.
datastr'coco8.yaml'INT8 niceleme kalibrasyonu için gerekli olan veri kümesi yapılandırma dosyasının yolu. INT8 etkinken belirtilmezse, kalibrasyon için yedek olarak coco8.yaml kullanılır.
fractionfloat1.0INT8 niceleme kalibrasyonu için kullanılacak veri kümesi oranını belirtir. Tam veri kümesinin bir alt kümesinde kalibrasyon yapmaya olanak tanır; bu, deneyler veya kaynaklar sınırlı olduğunda kullanışlıdır. INT8 etkinken belirtilmezse, veri kümesinin tamamı kullanılır.
end2endboolNoneNMS içermeyen çıkarımı (YOLO26, YOLOv10) destekleyen YOLO modellerindeki uçtan uca modu geçersiz kılar. Bunu False olarak ayarlamak, bu modelleri geleneksel NMS tabanlı işlem sonrası hattıyla uyumlu olacak şekilde dışa aktarmanı sağlar. Ayrıntılar için Uçtan Uca Tespit rehberine göz at.

Düşünceli yapılandırma, dışa aktarılan modelin kullanım durumu için optimize edilmesini ve hedef ortamda etkili bir şekilde çalışmasını sağlar.

Dışa Aktarma Rehberi

Çözüm Ayarları

Ultralytics Çözümleri yapılandırma ayarları, nesne sayma, ısı haritası oluşturma, egzersiz takibi, veri analizi, bölge takibi, sıra yönetimi ve bölge tabanlı sayım gibi görevler için modelleri özelleştirme esnekliği sunar. Bu seçenekler, özel ihtiyaçlara göre uyarlanmış doğru ve kullanışlı sonuçlar için kolay ayarlamalar yapılmasına olanak tanır.

ArgümanTürVarsayılanAçıklama
modelstrNoneBir Ultralytics YOLO model dosyasına giden yol.
regionlist'[(20, 400), (1260, 400)]'Sayım bölgesini tanımlayan noktalar listesi.
show_inboolTrueVideo akışında giriş sayılarını gösterip göstermemeyi kontrol eden bayrak.
show_outboolTrueVideo akışında çıkış sayılarını gösterip göstermemeyi kontrol eden bayrak.
analytics_typestr'line'Grafik türü; örn. line, bar, area veya pie.
colormapintcv2.COLORMAP_DEEPGREENIsı haritası için kullanılacak renk haritası.
json_filestrNoneTüm park koordinatları verilerini içeren JSON dosyasına giden yol.
up_anglefloat145.0'Yukarı' poz için açı eşiği.
kptslist[int]'[6, 8, 10]'Egzersizleri izlemek için kullanılan üç anahtar nokta indeksi listesi. Bu anahtar noktalar; şınav, barfiks, squat ve karın egzersizleri gibi hareketler için omuzlar, dirsekler ve bilekler gibi vücut eklemlerine veya kısımlarına karşılık gelir.
down_angleint90'Aşağı' poz için açı eşiği.
blur_ratiofloat0.50.1 - 1.0 aralığındaki değerlerle bulanıklık yoğunluğunun yüzdesini ayarlar.
crop_dirstr'cropped-detections'Kırpılmış tespitleri saklamak için dizin adı.
recordsint5Güvenlik alarm sistemi ile e-posta tetiklemek için toplam tespit sayısı.
vision_pointtuple[int, int](20, 20)VisionEye Çözümü kullanılarak vizyonun nesneleri takip edeceği ve yollar çizeceği nokta.
sourcestrNoneGirdi kaynağına (video, RTSP vb.) giden yol. Yalnızca Çözümler komut satırı arayüzü (CLI) ile kullanılabilir.
figsizetuple[int, int](12.8, 7.2)Isı haritaları veya grafikler gibi analiz çizelgeleri için figür boyutu.
fpsfloat30.0Hız hesaplamaları için kullanılan saniyedeki kare sayısı.
max_histint5Hız/yön hesaplamaları için nesne başına izlenecek maksimum geçmiş nokta sayısı.
meter_per_pixelfloat0.05Piksel mesafesini gerçek dünya birimlerine dönüştürmek için kullanılan ölçeklendirme faktörü.
max_speedint120Görsel katmanlardaki maksimum hız sınırı (uyarılarda kullanılır).
datastr'images'Benzerlik araması için kullanılan görüntü dizinine giden yol.

Çözümler Rehberi

Çoğaltma Ayarları

Veri çoğaltma teknikleri, eğitim verilerine değişkenlik katarak YOLO modelinin sağlamlığını ve performansını artırmak için gereklidir; böylece modelin görülmemiş verilere daha iyi genelleme yapmasına yardımcı olur. Aşağıdaki tablo, her bir çoğaltma argümanının amacını ve etkisini özetlemektedir:

ArgümanTürVarsayılanDesteklenen GörevlerAralıkAçıklama
hsv_hfloat0.015detect, segment, pose, obb, classify0.0 - 1.0Görüntünün tonunu renk çarkının bir kesri kadar ayarlar ve renk değişkenliği getirir. Modelin farklı ışık koşullarında genelleme yapmasına yardımcı olur.
hsv_sfloat0.7detect, segment, pose, obb, classify0.0 - 1.0Görüntünün doygunluğunu bir kesir kadar değiştirerek renk yoğunluğunu etkiler. Farklı çevresel koşulları simüle etmek için kullanışlıdır.
hsv_vfloat0.4detect, segment, pose, obb, classify0.0 - 1.0Görüntünün değerini (parlaklığını) bir kesir kadar değiştirerek, modelin çeşitli ışık koşullarında iyi performans göstermesine yardımcı olur.
degreesfloat0detect, segment, pose, obb0.0 - 180Görüntüyü belirtilen derece aralığında rastgele döndürerek modelin nesneleri çeşitli yönelimlerde tanıma yeteneğini geliştirir.
translatefloat0.1detect, segment, pose, obb0.0 - 1.0Görüntüyü, görüntü boyutunun bir kesri kadar yatay ve dikey olarak kaydırarak kısmen görünür nesneleri tespit etmeyi öğrenmeye yardımcı olur.
scalefloat0.5detect, segment, pose, obb, classify0 - 1Görüntüyü bir kazanç faktörüyle ölçeklendirerek, kameradan farklı mesafelerdeki nesneleri simüle eder.
shearfloat0detect, segment, pose, obb-180 - +180Görüntüyü belirtilen derecede eğerek, nesnelerin farklı açılardan görüntülenmesi etkisini taklit eder.
perspectivefloat0detect, segment, pose, obb0.0 - 0.001Görüntüye rastgele perspektif dönüşümü uygulayarak modelin 3D uzaydaki nesneleri anlama yeteneğini geliştirir.
flipudfloat0detect, segment, pose, obb, classify0.0 - 1.0Görüntüyü belirtilen olasılıkla baş aşağı çevirir, nesnenin özelliklerini etkilemeden veri değişkenliğini artırır.
fliplrfloat0.5detect, segment, pose, obb, classify0.0 - 1.0Görüntüyü belirtilen olasılıkla soldan sağa çevirir; simetrik nesneleri öğrenmek ve veri kümesi çeşitliliğini artırmak için kullanışlıdır.
bgrfloat0detect, segment, pose, obb0.0 - 1.0Görüntü kanallarını belirtilen olasılıkla RGB'den BGR'ye çevirir; yanlış kanal sıralamasına karşı dayanıklılığı artırmak için kullanışlıdır.
mosaicfloat1detect, segment, pose, obb0.0 - 1.0Dört eğitim görüntüsünü birleştirerek farklı sahne kompozisyonlarını ve nesne etkileşimlerini simüle eder. Karmaşık sahne anlayışı için oldukça etkilidir.
mixupfloat0detect, segment, pose, obb0.0 - 1.0İki görüntüyü ve etiketlerini harmanlayarak bileşik bir görüntü oluşturur. Etiket gürültüsü ve görsel değişkenlik ekleyerek modelin genelleme yeteneğini geliştirir.
cutmixfloat0detect, segment, pose, obb0.0 - 1.0İki görüntünün kısımlarını birleştirerek, belirgin bölgeleri korurken kısmi bir karışım oluşturur. Tıkanma senaryoları yaratarak model dayanıklılığını artırır.
copy_pastefloat0segment0.0 - 1.0Nesne örneklerini artırmak için nesneleri görüntüler arasında kopyalar ve yapıştırır.
copy_paste_modestrflipsegment-Kullanılacak copy-paste stratejisini belirler. Seçenekler arasında 'flip' ve 'mixup' bulunur.
auto_augmentstrrandaugmentclassify-Görsel çeşitlilik yoluyla model performansını artırmak için önceden tanımlanmış bir artırma politikası ('randaugment', 'autoaugment' veya 'augmix') uygular.
erasingfloat0.4classify0.0 - 1.0Eğitim sırasında modelin daha az belirgin özelliklere odaklanmasını teşvik etmek için görüntü bölgelerini rastgele siler.
augmentationslist``detect, segment, pose, obb-İleri düzey veri artırma için özel Albumentations dönüşümleri (yalnızca Python API). Özel artırma ihtiyaçları için bir dönüşüm nesneleri listesi kabul eder.

Bu ayarları veri kümesi ve görev gereksinimlerini karşılayacak şekilde ayarla. Farklı değerlerle denemeler yapmak, en iyi model performansı için optimal artırma stratejisini bulmana yardımcı olabilir.

Artırma Rehberi

Günlükleme, Kontrol Noktaları ve Çizim Ayarları

Bir YOLO modeli eğitirken günlükleme, kontrol noktaları, çizim ve dosya yönetimi önemlidir:

  • Günlükleme: TensorBoard gibi kütüphaneleri kullanarak veya bir dosyaya yazarak modelin ilerlemesini takip et ve sorunları tanıla.
  • Kontrol Noktaları: Eğitimi sürdürmek veya farklı yapılandırmalarla denemeler yapmak için modeli düzenli aralıklarla kaydet.
  • Çizim: Matplotlib veya TensorBoard gibi kütüphaneleri kullanarak performansı ve eğitim ilerlemesini görselleştir.
  • Dosya yönetimi: Kolay erişim ve analiz için kontrol noktaları, günlük dosyaları ve çizimler gibi eğitim sırasında oluşturulan dosyaları düzenle.

Bu yönlerin etkili yönetimi, ilerlemeyi takip etmene yardımcı olur ve hata ayıklamayı ve optimizasyonu kolaylaştırır.

ArgümanVarsayılanAçıklama
project'runs'Eğitim çalışmalarını kaydetmek için kök dizini belirtir. Her çalışma ayrı bir alt dizine kaydedilir.
name'exp'Deney adını tanımlar. Belirtilmezse, YOLO üzerine yazmayı önlemek için her çalışma için bu adı artırır (örneğin, exp, exp-2).
exist_okFalseMevcut bir deney dizininin üzerine yazılıp yazılmayacağını belirler. True üzerine yazmaya izin verir; False bunu önler.
plotsTrueControls the generation and saving of training and validation plots. Set to True to create plots like loss curves, precision-recall curves, and sample predictions for visual tracking of performance.
saveTrueEğitim kontrol noktalarının ve nihai model ağırlıklarının kaydedilmesini etkinleştirir. Model durumlarını periyodik olarak kaydetmek, eğitimin sürdürülmesine veya modelin dağıtılmasına olanak sağlamak için True değerine ayarla.

Özel Yapılandırma Dosyası

Bağımsız değişkenleri satır içi geçirmeden tam bir bağımsız değişken setini yeniden kullanmak için kaydedilmiş bir YAML yükle. cfg bağımsız değişkeni default.yaml içindeki değerleri geçersiz kılar, ancak yanında geçirilen ek bağımsız değişkenler yine de öncelik alır.

ArgümanVarsayılanAçıklama
cfgNoneDeğerleri default.yaml girişlerinin yerini alan bir YAML dosyasının yolu. Çalışan bir CLI örneği için Varsayılan Yapılandırma Dosyasını Geçersiz Kılma bölümüne bak.

SSS

Eğitim sırasında YOLO modelimin performansını nasıl artırabilirim?

Performansı, yığın boyutu, öğrenme oranı, momentum ve ağırlık azalması gibi hiper parametreleri ayarlayarak artır. Veri artırma ayarlarını değiştir, doğru optimize ediciyi seç ve erken durdurma veya karışık hassasiyet gibi teknikleri kullan. Ayrıntılar için Eğitim Rehberine bak.

YOLO model doğruluğu için temel hiper parametreler nelerdir?

Doğruluğu etkileyen temel hiper parametreler şunlardır:

  • Yığın Boyutu (batch): Daha büyük boyutlar eğitimi dengeleyebilir ancak daha fazla bellek gerektirir.
  • Öğrenme Oranı (lr0): Daha küçük oranlar ince ayarlar sunar ancak daha yavaş yakınsama sağlar.
  • Momentum (momentum): Gradyan vektörlerini hızlandırarak salınımları sönümler.
  • Görüntü Boyutu (imgsz): Daha büyük boyutlar doğruluğu artırır ancak hesaplama yükünü artırır.

Bunları veri kümene ve donanımına göre ayarla. Eğitim Ayarları bölümünde daha fazla bilgi edin.

Bir YOLO modelini eğitmek için öğrenme oranını nasıl ayarlarım?

The learning rate (lr0) is crucial; start with 0.01 for SGD or 0.001 for Adam optimizer. Monitor metrics and adjust as needed. Use cosine learning rate schedulers (cos_lr) or warmup (warmup_epochs, warmup_momentum). Details are in the Train Guide.

YOLO modelleri için varsayılan çıkarım ayarları nelerdir?

Varsayılan ayarlar şunları içerir:

  • Güven Eşiği (conf=0.25): Algılamalar için minimum güven.
  • IoU Eşiği (iou=0.7): Maksimum Olmayan Bastırma (NMS) için.
  • Görüntü Boyutu (imgsz=640): Giriş görüntülerini yeniden boyutlandırır.
  • Cihaz (device=None): CPU, GPU, Apple MPS veya Huawei Ascend NPU (npu) seçer.

Tam bir genel bakış için Tahmin Ayarlarına ve Tahmin Rehberine bak.

Neden YOLO modelleriyle karışık hassasiyetli eğitim kullanmalı?

Karışık hassasiyet eğitimi (amp=True), FP16 ve FP32 kullanarak bellek kullanımını azaltır ve eğitimi hızlandırır. Modern GPU'lar için faydalıdır, önemli bir doğruluk kaybı olmadan daha büyük modellere ve daha hızlı hesaplamalara olanak tanır. Eğitim Rehberinde daha fazla bilgi edin.

Yorumlar