Yapılandırma
YOLO ayarları ve hiperparametreleri, modelin performansı, hızı ve doğruluğu üzerinde kritik bir rol oynar. Bu ayarlar, eğitim, doğrulama ve tahmin dahil olmak üzere modelin çeşitli aşamalardaki davranışını etkileyebilir.
Watch: Mastering Ultralytics YOLO: Configuration
Ultralytics komutları şu sözdizimini kullanır:
yolo TASK MODE ARGSBurada:
TASK(isteğe bağlı), şunlardan biridir: (detect, segment, classify, pose, obb)MODE(zorunlu), şunlardan biridir: (train, val, predict, export, track, benchmark)ARGS(optional) arearg=valuepairs likeimgsz=640that override defaults.
Varsayılan ARG değerleri bu sayfada tanımlanmıştır ve cfg/default.yaml dosyasından gelir.
Görevler
Ultralytics YOLO modelleri, aşağıdakiler dahil olmak üzere çeşitli bilgisayarlı görü görevlerini gerçekleştirebilir:
- Detect: Nesne algılama, bir görüntü veya video içindeki nesneleri tanımlar ve konumlandırır.
- Segment: Örnek segmentasyonu, bir görüntüyü veya videoyu farklı nesnelere veya sınıflara karşılık gelen bölgelere ayırır.
- Classify: Görüntü sınıflandırma, bir girdi görüntüsünün sınıf etiketini tahmin eder.
- Pose: Poz tahmini, bir görüntü veya videodaki nesneleri tanımlar ve anahtar noktalarını tahmin eder.
- OBB: Yönlendirilmiş Sınırlayıcı Kutular, uydu veya tıbbi görüntüler için uygun olan döndürülmüş sınırlayıcı kutuları kullanır.
| Argüman | Varsayılan | Açıklama |
|---|---|---|
task | 'detect' | Specifies the YOLO task: detect for object detection, segment for segmentation, classify for classification, pose for pose estimation, and obb for oriented bounding boxes. Each task is tailored to specific outputs and problems in image and video analysis. |
Modlar
Ultralytics YOLO modelleri, her biri model yaşam döngüsünün belirli bir aşaması için tasarlanmış farklı modlarda çalışır:
- Train: Bir YOLO modelini özel bir veri kümesi üzerinde eğit.
- Val: Eğitilmiş bir YOLO modelini doğrula.
- Predict: Yeni görüntüler veya videolar üzerinde tahmin yapmak için eğitilmiş bir YOLO modeli kullan.
- Export: Bir YOLO modelini dağıtım için dışa aktar.
- Track: Bir YOLO modeli kullanarak nesneleri gerçek zamanlı olarak izle.
- Benchmark: YOLO dışa aktarımlarının (ONNX, TensorRT, vb.) hızını ve doğruluğunu kıyasla.
| Argüman | Varsayılan | Açıklama |
|---|---|---|
mode | 'train' | YOLO modelinin çalışma modunu belirtir: model eğitimi için train, doğrulama için val, çıkarım için predict, dağıtım formatlarına dönüştürme için export, nesne izleme için track ve performans değerlendirmesi için benchmark. Her mod, geliştirmeden dağıtıma kadar farklı aşamaları destekler. |
Eğitim Ayarları
YOLO modelleri için eğitim ayarları, modelin performansını, hızını ve doğruluğunu etkileyen hiperparametreleri ve yapılandırmaları içerir. Temel ayarlar arasında yığın boyutu, öğrenme oranı, momentum ve ağırlık azalması bulunur. Optimize edici, kayıp fonksiyonu ve veri kümesi bileşimi seçimi de eğitimi etkiler. İnce ayar ve deneyler, optimum performans için çok önemlidir. Daha fazla ayrıntı için Ultralytics giriş noktası fonksiyonuna bakabilirsin.
| Argüman | Tür | Varsayılan | Açıklama |
|---|---|---|---|
model | str | None | Eğitim için model dosyasını belirtir. Bir .pt önceden eğitilmiş modeline veya bir .yaml yapılandırma dosyasına giden bir yolu kabul eder. Model yapısını tanımlamak veya ağırlıkları başlatmak için gereklidir. |
data | str | None | Veri kümesi yapılandırma dosyasına giden yol (örneğin coco8.yaml). Bu dosya, eğitim ve doğrulama verilerine giden yollar, sınıf adları ve sınıf sayısı dahil olmak üzere veri kümesine özgü parametreleri içerir. |
epochs | int | 100 | Toplam eğitim dönemi (epoch) sayısı. Her epoch, tüm veri kümesinin üzerinden tam bir geçişi temsil eder. Bu değeri ayarlamak, eğitim süresini ve model performansını etkileyebilir. |
time | float | None | Saat cinsinden maksimum eğitim süresi. Ayarlanırsa, epochs argümanını geçersiz kılar ve eğitimin belirtilen süreden sonra otomatik olarak durmasını sağlar. Zaman kısıtlı eğitim senaryoları için yararlıdır. |
patience | int | 100 | Eğitimi erken durdurmadan önce doğrulama metriklerinde iyileşme olmadan beklenecek dönem sayısı. Performans sabitlendiğinde eğitimi durdurarak aşırı öğrenmeyi önlemeye yardımcı olur. |
batch | int veya float | 16 | Yığın boyutu, üç mod ile: tam sayı olarak ayarlanabilir (örneğin batch=16), %60 GPU bellek kullanımı için otomatik mod (batch=-1) veya belirtilen kullanım oranı ile otomatik mod (batch=0.70). |
imgsz | int | 640 | Eğitim için hedef görüntü boyutu. Görüntüler, belirtilen değere eşit kenarlara sahip karelere yeniden boyutlandırılır (rect=False ise), YOLO modelleri için en boy oranını korur ancak RT-DETR için korumaz. Model doğruluğunu ve hesaplama karmaşıklığını etkiler. |
save | bool | True | Eğitim kontrol noktalarının ve nihai model ağırlıklarının kaydedilmesini sağlar. Eğitimi devam ettirmek veya model dağıtımı için yararlıdır. |
save_period | int | -1 | Dönemler halinde belirtilen model kontrol noktalarını kaydetme sıklığı. -1 değeri bu özelliği devre dışı bırakır. Uzun eğitim oturumları sırasında ara modelleri kaydetmek için yararlıdır. |
cache | bool | False | Veri kümesi görüntülerinin bellekte (True/ram), diskte (disk) önbelleğe alınmasını sağlar veya devre dışı bırakır (False). Artan bellek kullanımı pahasına disk I/O'sunu azaltarak eğitim hızını artırır. |
device | int veya str veya list | None | Eğitim için hesaplama cihazını/cihazlarını belirtir: tek bir GPU (device=0), çoklu GPU'lar (device=[0,1]), CPU (device=cpu), Apple silikon için MPS (device=mps), Huawei Ascend NPU (device=npu veya device=npu:0) veya en boşta olan GPU'nun otomatik seçimi (device=-1) ya da boşta olan birden fazla GPU (device=[-1,-1]). |
workers | int | 8 | Veri yükleme için çalışan iş parçacığı sayısı (Çoklu GPU eğitimi ise her RANK için). Özellikle çoklu GPU kurulumlarında veri ön işlemenin ve modele beslemenin hızını etkiler. |
project | str | None | Eğitim çıktılarının kaydedildiği proje dizininin adı. Farklı deneylerin düzenli bir şekilde depolanmasını sağlar. |
name | str | None | Eğitim çalışmasının adı. Eğitim günlüklerinin ve çıktılarının depolandığı proje klasörü içinde bir alt dizin oluşturmak için kullanılır. |
exist_ok | bool | False | True ise, mevcut bir proje/isim dizininin üzerine yazılmasına izin verir. Önceki çıktıları manuel olarak temizlemeye gerek kalmadan yinelemeli deneyler için yararlıdır. |
pretrained | bool veya str | True | Eğitime önceden eğitilmiş ağırlıklarla mı başlanacağını belirler. Bir boolean değer veya yüklenecek ağırlıklara giden bir dizgi yolu olabilir. pretrained=False, model mimarisini korurken rastgele başlatılan ağırlıklarla eğitir. |
optimizer | str | 'auto' | Eğitim için optimize edici seçimi. Seçenekler arasında SGD, MuSGD, Adam, Adamax, AdamW, NAdam, RAdam, RMSProp veya model yapılandırmasına dayalı otomatik seçim için auto bulunur. Yakınsama hızını ve kararlılığını etkiler. |
seed | int | 0 | Eğitim için rastgele tohum değerini ayarlar, aynı yapılandırmalara sahip çalıştırmalar arasında sonuçların tekrarlanabilirliğini sağlar. |
deterministic | bool | True | Deterministik algoritma kullanımını zorunlu kılar, tekrarlanabilirliği sağlar ancak deterministik olmayan algoritmalar üzerindeki kısıtlama nedeniyle performansı ve hızı etkileyebilir. |
verbose | bool | True | Eğitim sırasında ayrıntılı çıktıyı etkinleştirir, ilerleme çubuklarını, dönem başına metrikleri ve ek eğitim bilgilerini konsolda görüntüler. |
single_cls | bool | False | Eğitim sırasında çok sınıflı veri kümelerindeki tüm sınıfları tek bir sınıf olarak ele alır. İkili sınıflandırma görevleri için veya sınıflandırmadan ziyade nesne varlığına odaklanırken yararlıdır. |
classes | list[int] | None | Eğitim yapılacak sınıf kimliklerinin bir listesini belirtir. Eğitim sırasında yalnızca belirli sınıfları filtrelemek ve bunlara odaklanmak için yararlıdır. |
rect | bool | False | Minimum dolgu stratejisini etkinleştirir—bir yığındaki görüntüler ortak bir boyuta ulaşmak için minimum düzeyde doldurulur, en uzun kenar imgsz değerine eşittir. Verimliliği ve hızı artırabilir ancak model doğruluğunu etkileyebilir. |
multi_scale | float | 0.0 | Her yığında imgsz değerini +/- multi_scale kadar rastgele değiştirir (örneğin 0.25 -> 0.75x ila 1.25x), model adım katlarına yuvarlanır; 0.0 çok ölçekli eğitimi devre dışı bırakır. |
cos_lr | bool | False | Dönemler boyunca bir kosinüs eğrisini takip ederek öğrenme oranını ayarlayan bir kosinüs öğrenme oranı zamanlayıcısı kullanır. Daha iyi yakınsama için öğrenme oranını yönetmeye yardımcı olur. |
close_mosaic | int | 10 | Eğitimi tamamlamadan önce stabilize etmek için son N epokta veri artırma işlemini devre dışı bırakır. 0 olarak ayarlanması bu özelliği kapatır. |
resume | bool | False | Eğitimi en son kaydedilen kontrol noktasından sürdürür. Model ağırlıklarını, optimize edici durumunu ve epok sayısını otomatik olarak yükleyerek eğitimin kesintisiz devam etmesini sağlar. |
amp | bool | True | Otomatik Karma Hassasiyet (AMP) eğitimini etkinleştirerek bellek kullanımını azaltır ve doğruluk üzerindeki minimal etkiyle eğitim hızını artırabilir. |
fraction | float | 1.0 | Eğitim için kullanılacak veri kümesi oranını belirtir. Tam veri kümesinin bir alt kümesinde eğitim yapmaya olanak tanır, deneyler için veya kaynaklar kısıtlı olduğunda kullanışlıdır. |
profile | bool | False | Eğitim sırasında ONNX ve TensorRT hızlarının profillenmesini etkinleştirir; model dağıtımını optimize etmek için kullanışlıdır. |
freeze | int veya list | None | Modelin ilk N katmanını veya belirtilen indeksli katmanları dondurarak eğitilebilir parametre sayısını azaltır. İnce ayar veya transfer öğrenimi için kullanışlıdır. |
lr0 | float | 0.01 | Başlangıç öğrenme oranı (örn. SGD=1E-2, Adam=1E-3). Bu değeri ayarlamak, model ağırlıklarının güncellenme hızını etkileyerek optimizasyon süreci için kritiktir. |
lrf | float | 0.01 | Başlangıç oranının bir fraksiyonu olarak nihai öğrenme oranı = (lr0 * lrf), öğrenme oranını zamanla ayarlamak için zamanlayıcılarla birlikte kullanılır. |
momentum | float | 0.937 | SGD için momentum faktörü veya Adam optimize ediciler için beta1, geçmiş gradyanların mevcut güncellemeye dahil edilmesini etkiler. |
weight_decay | float | 0.0005 | Aşırı öğrenmeyi (overfitting) önlemek için büyük ağırlıkları cezalandıran L2 düzenlileştirme terimi. |
warmup_epochs | float | 3.0 | Öğrenme oranı ısınması için epok sayısı; eğitimi erken aşamada stabilize etmek için öğrenme oranını düşük bir değerden başlangıç değerine kademeli olarak artırır. |
warmup_momentum | float | 0.8 | Isınma aşaması için başlangıç momentumu; ısınma süresi boyunca belirlenen momentuma kademeli olarak ayarlanır. |
warmup_bias_lr | float | 0.1 | Isınma aşamasında sapma (bias) parametreleri için öğrenme oranı; ilk epoklarda model eğitiminin stabilize edilmesine yardımcı olur. |
box | float | 7.5 | Kayıp fonksiyonunda kutu kaybı bileşeninin ağırlığı; sınırlayıcı kutu koordinatlarını doğru tahmin etmeye ne kadar odaklanılacağını etkiler. |
cls | float | 0.5 | Toplam kayıp fonksiyonunda sınıflandırma kaybının ağırlığı; diğer bileşenlere kıyasla doğru sınıf tahmini önemini etkiler. |
cls_pw | float | 0.0 | Ters sınıf frekansını kullanarak sınıf dengesizliğini yönetmek için sınıf ağırlıklandırma gücü. 0.0 sınıf ağırlıklandırmayı devre dışı bırakır, 1.0 tam ters frekans ağırlıklandırması uygular. 0 ile 1 arasındaki değerler kısmi ağırlıklandırma sağlar. |
dfl | float | 1.5 | Belirli YOLO sürümlerinde ince taneli sınıflandırma için kullanılan dağılım odak kaybının ağırlığı. |
pose | float | 12.0 | Poz tahmini için eğitilen modellerde poz kaybının ağırlığı; poz anahtar noktalarını doğru tahmin etmeye verilen önemi etkiler. |
kobj | float | 1.0 | Poz tahmini modellerinde anahtar nokta nesnellik kaybının ağırlığı; tespit güveni ile poz doğruluğunu dengeler. |
rle | float | 1.0 | Poz tahmini modellerinde kalıntı log-olasılık tahmin kaybının ağırlığı; anahtar nokta konumlandırmasının hassasiyetini etkiler. |
angle | float | 1.0 | OBB modellerinde açı kaybının ağırlığı; yönlendirilmiş sınırlayıcı kutu açı tahminlerinin hassasiyetini etkiler. |
nbs | int | 64 | Kayıp normalizasyonu için nominal yığın boyutu. |
overlap_mask | bool | True | Nesne maskelerinin eğitim için tek bir maskede birleştirilip birleştirilmeyeceğini veya her nesne için ayrı tutulup tutulmayacağını belirler. Çakışma durumunda, birleştirme sırasında küçük maske büyük maskenin üzerine bindirilir. |
mask_ratio | int | 4 | Segmentasyon maskeleri için alt örnekleme oranı; eğitim sırasında kullanılan maskelerin çözünürlüğünü etkiler. |
dropout | float | 0.0 | Sınıflandırma görevlerinde düzenlileştirme için dropout oranı; eğitim sırasında birimleri rastgele devre dışı bırakarak aşırı öğrenmeyi önler. |
val | bool | True | Eğitim sırasında doğrulamayı etkinleştirerek model performansının ayrı bir veri kümesi üzerinde periyodik değerlendirilmesine olanak tanır. |
plots | bool | True | Eğitim ve doğrulama metriklerinin ve tahmin örneklerinin grafiklerini oluşturur ve kaydeder; model performansı ve öğrenme süreci hakkında görsel içgörüler sağlar. |
compile | bool veya str | False | PyTorch 2.x torch.compile grafik derlemesini backend='inductor' ile etkinleştirir. True → "default" kabul eder, False devre dışı bırakır veya "default", "reduce-overhead", "max-autotune-no-cudagraphs" gibi bir dize modu alır. Desteklenmiyorsa uyarı vererek eager moduna döner. |
max_det | int | 300 | Eğitimin doğrulama aşamasında tutulan maksimum nesne sayısını belirtir. |
batch argümanı üç yapılandırma seçeneği sunar:
- Sabit Yığın Boyutu: Bir tam sayı ile yığın başına görüntü sayısını belirtin (örn.
batch=16). - Otomatik Mod (%60 GPU Belleği): Yaklaşık %60 CUDA bellek kullanımına otomatik ayarlama için
batch=-1kullanın. - Kullanım Oranı ile Otomatik Mod: Belirtilen GPU bellek kullanımına göre ayarlamak için bir oran belirleyin (örn.
batch=0.70).
Tahmin Ayarları
YOLO modelleri için tahmin ayarları, çıkarım sırasında performansı, hızı ve doğruluğu etkileyen hiperparametreleri ve yapılandırmaları içerir. Temel ayarlar arasında güven eşiği, Maksimum Olmayan Baskılama (NMS) eşiği ve sınıf sayısı bulunur. Giriş verisi boyutu, formatı ve maskeler gibi ek özellikler de tahminleri etkiler. Bu ayarları optimize etmek, en iyi performans için gereklidir.
Çıkarım argümanları:
| Argüman | Tür | Varsayılan | Açıklama |
|---|---|---|---|
source | str veya int veya None | None | Çıkarım için veri kaynağını belirtir. Bir görüntü yolu, video dosyası, dizin, URL veya canlı yayınlar için cihaz kimliği olabilir. Belirtilmezse bir uyarı kaydedilir ve model yerleşik demo varlıklarına (ultralytics/assets veya OBB için bir demo URL'si) döner. Çok çeşitli formatları ve kaynakları destekleyerek farklı giriş türleri genelinde esnek uygulama sağlar. |
conf | float | 0.25 | Tespitler için minimum güven eşiğini belirler. Bu eşiğin altındaki güvenle tespit edilen nesneler göz ardı edilecektir. Bu değeri ayarlamak yanlış pozitifleri azaltmaya yardımcı olabilir. |
iou | float | 0.7 | Maksimum Olmayan Baskılama (NMS) için Kesişim Üzerinden Birlik (IoU) eşiği. Daha düşük değerler çakışan kutuları eleyerek daha az tespit sonucu verir; kopyaları azaltmak için kullanışlıdır. |
imgsz | int veya tuple | 640 | Letterbox target. An integer gives a square N×N; a tuple gives (height, width). With rect=True, the actual tensor may be smaller than this target due to minimum-rectangle padding. Use rect=False for a fixed size. See Fixed shape vs minimum rectangle. |
rect | bool | True | Eğer True ise, mümkün olduğunda minimum dikdörtgen dolgusu kullanın (aynı şekilli yığın ve desteklenen arka uç). Eğer False ise, her zaman tam imgsz değerine dolgu yapın. Bkz. Sabit şekil vs minimum dikdörtgen. |
half | bool | False | Doğruluk üzerindeki minimal etkiyle desteklenen GPU'larda model çıkarımını hızlandırabilen yarı hassasiyetli (FP16) çıkarımı etkinleştirir. |
device | str | None | Çıkarım için cihazı belirtir (örn. cpu, cuda:0, 0, npu veya npu:0). Kullanıcıların CPU, belirli bir GPU, Huawei Ascend NPU veya model yürütme için diğer bilgi işlem cihazlarını seçmelerine olanak tanır. |
batch | int | 1 | Çıkarım için yığın boyutunu belirtir (yalnızca kaynak bir dizin, video dosyası veya .txt dosyası olduğunda çalışır). Daha büyük bir yığın boyutu daha yüksek verim sağlayarak çıkarım için gereken toplam süreyi kısaltabilir. |
max_det | int | 300 | Görüntü başına izin verilen maksimum tespit sayısı. Modelin tek bir çıkarımda tespit edebileceği toplam nesne sayısını sınırlar ve yoğun sahnelerde aşırı çıktı oluşmasını önler. |
vid_stride | int | 1 | Video girişleri için kare aralığı (stride). İşlem hızını artırmak için videolardaki karelerin atlanmasına olanak tanır, ancak zamansal çözünürlükten ödün verir. 1 değeri her kareyi işlerken, daha yüksek değerler kareleri atlar. |
stream_buffer | bool | False | Video akışları için gelen karelerin sıraya alınıp alınmayacağını belirler. Eğer False ise, yeni karelere yer açmak için eski kareler atılır (gerçek zamanlı uygulamalar için optimize edilmiştir). Eğer True ise, yeni kareleri bir arabelleğe alır ve hiçbir karenin atlanmamasını sağlar; ancak çıkarım FPS'si akış FPS'sinden düşükse gecikmeye neden olur. |
visualize | bool | False | Çıkarım sırasında model özelliklerinin görselleştirilmesini etkinleştirir ve modelin ne "gördüğüne" dair içgörüler sağlar. Hata ayıklama ve model yorumlama için kullanışlıdır. |
augment | bool | False | Tahminler için test zamanı artırmayı (TTA) etkinleştirir; çıkarım hızından ödün vererek tespit sağlamlığını potansiyel olarak artırır. |
agnostic_nms | bool | False | Sınıftan bağımsız Non-Maximum Suppression (NMS) yöntemini etkinleştirir; bu, farklı sınıflara ait çakışan kutuları birleştirir. Sınıf çakışmasının yaygın olduğu çok sınıflı tespit senaryolarında yararlıdır. Uçtan uca modeller için (YOLO26, YOLOv10), bu özellik yalnızca aynı tespitin birden fazla sınıf etiketiyle (IoU=1.0 kopyaları) görünmesini engeller ve farklı kutular arasında IoU eşik tabanlı bir bastırma işlemi gerçekleştirmez. |
classes | list[int] | None | Tahminleri belirli sınıf kimliklerine (class ID) göre filtreler. Yalnızca belirtilen sınıflara ait tespitler döndürülür. Çok sınıflı tespit görevlerinde ilgili nesnelere odaklanmak için kullanışlıdır. |
retina_masks | bool | False | Yüksek çözünürlüklü segmentasyon maskeleri döndürür. Etkinleştirilirse, döndürülen maskeler (masks.data) orijinal görüntü boyutuyla eşleşir. Devre dışı bırakılırsa, çıkarım sırasında kullanılan görüntü boyutuna sahip olurlar. |
embed | list[int] | None | Özellik vektörlerinin veya embeddings kısımlarının çıkarılacağı katmanları belirtir. Kümeleme veya benzerlik arama gibi sonraki görevler için kullanışlıdır. |
project | str | None | save özelliği etkinleştirildiğinde tahmin çıktılarının kaydedileceği proje dizininin adı. |
name | str | None | Tahmin çalıştırmasının adı. save etkinleştirildiğinde tahmin çıktılarının saklandığı proje klasörü içinde bir alt dizin oluşturmak için kullanılır. |
stream | bool | False | Tüm kareleri aynı anda belleğe yüklemek yerine, Results nesnelerinden oluşan bir jeneratör döndürerek uzun videolar veya çok sayıda görüntü için bellek açısından verimli işlem yapılmasını sağlar. |
verbose | bool | True | Tahmin süreci hakkında gerçek zamanlı geri bildirim sağlamak için terminalde ayrıntılı çıkarım günlüklerinin görüntülenip görüntülenmeyeceğini kontrol eder. |
compile | bool veya str | False | PyTorch 2.x torch.compile grafik derlemesini backend='inductor' ile etkinleştirir. True → "default" kabul eder, False devre dışı bırakır veya "default", "reduce-overhead", "max-autotune-no-cudagraphs" gibi bir dize modu alır. Desteklenmiyorsa uyarı vererek eager moduna döner. |
end2end | bool | None | NMS içermeyen çıkarımı destekleyen YOLO modellerinde (YOLO26, YOLOv10) uçtan uca modunu geçersiz kılar. False olarak ayarlamak, tahmini geleneksel NMS hattını kullanarak çalıştırmanıza ve ayrıca iou argümanını kullanmanıza olanak tanır. Ayrıntılar için Uçtan Uca Tespit rehberine bak. |
Görselleştirme argümanları:
| Argüman | Tür | Varsayılan | Açıklama |
|---|---|---|---|
show | bool | False | Eğer True ise, açıklamalı görüntüleri veya videoları bir pencerede görüntüler. Geliştirme veya test sırasında anında görsel geri bildirim için kullanışlıdır. |
save | bool | False or True | Açıklamalı görüntülerin veya videoların dosyalara kaydedilmesini etkinleştirir. Dokümantasyon, ileri analiz veya sonuçları paylaşmak için kullanışlıdır. CLI kullanırken varsayılan olarak True, Python'da kullanıldığında False değerini alır. |
save_frames | bool | False | Videoları işlerken, tek tek kareleri görüntü olarak kaydeder. Belirli kareleri ayıklamak veya ayrıntılı kare kare analiz için kullanışlıdır. |
save_txt | bool | False | Tespit sonuçlarını [class] [x_center] [y_center] [width] [height] [confidence] formatını izleyerek bir metin dosyasına kaydeder. Diğer analiz araçlarıyla entegrasyon için kullanışlıdır. |
save_conf | bool | False | Kaydedilen metin dosyalarına güven puanlarını (confidence scores) dahil eder. İşlem sonrası ve analiz için mevcut ayrıntıyı artırır. |
save_crop | bool | False | Tespit edilen nesnelerin kırpılmış görüntülerini kaydeder. Veri seti artırma, analiz veya belirli nesneler için odaklanmış veri setleri oluşturmak için kullanışlıdır. |
show_labels | bool | True | Görsel çıktıda her tespit için etiketleri görüntüler. Tespit edilen nesnelerin anında anlaşılmasını sağlar. |
show_conf | bool | True | Etiketle birlikte her tespit için güven puanını görüntüler. Her bir tespit için modelin kesinliği hakkında fikir verir. |
show_boxes | bool | True | Tespit edilen nesnelerin etrafına sınırlayıcı kutular (bounding boxes) çizer. Görüntülerdeki veya video karelerindeki nesnelerin görsel tanımlaması ve konumlandırılması için gereklidir. |
line_width | int or None | None | Sınırlayıcı kutuların çizgi kalınlığını belirtir. None ise, çizgi kalınlığı otomatik olarak görüntü boyutuna göre ayarlanır. Netlik için görsel özelleştirme sağlar. |
Doğrulama Ayarları
YOLO modelleri için doğrulama ayarları, performansı bir doğrulama veri setinde değerlendirmek için hiperparametreleri ve yapılandırmaları içerir. Bu ayarlar performansı, hızı ve doğruluğu etkiler. Yaygın ayarlar arasında yığın boyutu (batch size), doğrulama sıklığı ve performans metrikleri bulunur. Doğrulama veri setinin boyutu ve bileşimi ile birlikte özel görev de süreci etkiler.
| Argüman | Tür | Varsayılan | Açıklama |
|---|---|---|---|
data | str | None | Veri seti yapılandırma dosyasına (ör. coco8.yaml) giden yolu belirtir. Bu dosya, doğrulama verisine giden yolu içermelidir. |
imgsz | int | 640 | Giriş görüntülerinin boyutunu tanımlar. İşlenmeden önce tüm görüntüler bu boyuta yeniden boyutlandırılır. Daha büyük boyutlar, küçük nesneler için doğruluğu artırabilir ancak hesaplama süresini uzatır. |
batch | int | 16 | Yığın başına düşen görüntü sayısını ayarlar. Daha yüksek değerler GPU belleğini daha verimli kullanır ancak daha fazla VRAM gerektirir. Kullanılabilir donanım kaynaklarına göre ayarla. |
save_json | bool | False | Eğer True ise, sonuçları daha fazla analiz, diğer araçlarla entegrasyon veya COCO gibi değerlendirme sunucularına gönderim için bir JSON dosyasına kaydeder. |
conf | float | 0.001 | Tespitler için minimum güven eşiğini ayarlar. Daha düşük değerler geri çağırmayı (recall) artırır ancak daha fazla yanlış pozitif (false positive) ortaya çıkarabilir. Hassasiyet-geri çağırma eğrilerini hesaplamak için doğrulama sırasında kullanılır. |
iou | float | 0.7 | Sets the Intersection Over Union threshold for Non-Maximum Suppression. Controls duplicate detection elimination. |
max_det | int | 300 | Görüntü başına maksimum tespit sayısını sınırlar. Yoğun sahnelerde aşırı tespiti önlemek ve hesaplama kaynaklarını yönetmek için kullanışlıdır. |
half | bool | False | Yarı hassasiyetli (FP16) hesaplamayı etkinleştirir; bellek kullanımını azaltır ve doğruluk üzerinde minimum etki ile hızı artırabilir. |
device | str | None | Doğrulama için cihazı belirtir (cpu, cuda:0, npu, npu:0 vb.). None olduğunda, mevcut en iyi cihazı otomatik olarak seçer. Birden fazla CUDA cihazı virgülle ayrılarak belirtilebilir. |
dnn | bool | False | Eğer True ise, ONNX model çıkarımı için OpenCV DNN modülünü kullanır ve PyTorch çıkarım yöntemlerine bir alternatif sunar. |
plots | bool | True | True olarak ayarlandığında, model performansının görsel değerlendirmesi için tahminlere karşı temel doğruluk (ground truth), karışıklık matrisleri ve PR eğrileri oluşturur ve kaydeder. |
classes | list[int] | None | Değerlendirilecek sınıf kimliklerinin bir listesini belirtir. Değerlendirme sırasında belirli sınıfları filtrelemek ve yalnızca onlara odaklanmak için kullanışlıdır. |
rect | bool | True | Eğer True ise, yığın oluşturma için dikdörtgensel çıkarım kullanır; dolguyu (padding) azaltır ve görüntüleri orijinal en boy oranlarında işleyerek hızı ve verimliliği potansiyel olarak artırır. |
split | str | 'val' | Doğrulama için kullanılacak veri seti bölümünü belirler (val, test veya train). Performans değerlendirmesi için veri segmenti seçiminde esneklik sağlar. |
project | str | None | Doğrulama çıktılarının kaydedileceği proje dizininin adı. Farklı deneylerden veya modellerden gelen sonuçları düzenlemeye yardımcı olur. |
name | str | None | Doğrulama çalıştırmasının adı. Proje klasörü içinde doğrulama günlüklerinin ve çıktılarının saklandığı bir alt dizin oluşturmak için kullanılır. |
verbose | bool | True | Eğer True ise, sınıf bazlı metrikler, yığın ilerlemesi ve ek hata ayıklama bilgileri dahil olmak üzere doğrulama süreci sırasında ayrıntılı bilgileri görüntüler. |
save_txt | bool | False | Eğer True ise, tespit sonuçlarını görüntü başına bir dosya olacak şekilde metin dosyalarına kaydeder; ileri analiz, özel işlem sonrası veya diğer sistemlerle entegrasyon için kullanışlıdır. |
save_conf | bool | False | Eğer True ise, save_txt etkinleştirildiğinde kaydedilen metin dosyalarına güven değerlerini dahil eder; analiz ve filtreleme için daha ayrıntılı çıktı sağlar. |
workers | int | 8 | Veri yükleme için çalışan iş parçacığı sayısı. Daha yüksek değerler veri ön işlemesini hızlandırabilir ancak CPU kullanımını artırabilir. 0 olarak ayarlamak, bazı ortamlarda daha kararlı olabilen ana iş parçacığını kullanır. |
augment | bool | False | Doğrulama sırasında test zamanı artırmayı (TTA) etkinleştirir; girişin dönüştürülmüş sürümleri üzerinde çıkarım çalıştırarak, çıkarım hızından ödün verip tespit doğruluğunu potansiyel olarak artırır. |
agnostic_nms | bool | False | Sınıftan bağımsız Non-Maximum Suppression yöntemini etkinleştirir; bu, tahmin edilen sınıftan bağımsız olarak çakışan kutuları birleştirir. Örnek odaklı uygulamalar için kullanışlıdır. Uçtan uca modeller için (YOLO26, YOLOv10), bu özellik yalnızca aynı tespitin birden fazla sınıf etiketiyle (IoU=1.0 kopyaları) görünmesini engeller ve farklı kutular arasında IoU eşik tabanlı bir bastırma işlemi gerçekleştirmez. |
single_cls | bool | False | Doğrulama sırasında tüm sınıfları tek bir sınıf olarak ele alır. İkili tespit görevlerinde model performansını değerlendirmek veya sınıf ayrımlarının önemli olmadığı durumlar için kullanışlıdır. |
visualize | bool | False | Her görüntü için temel doğrulukları (ground truths), gerçek pozitifleri, yanlış pozitifleri ve yanlış negatifleri görselleştirir. Hata ayıklama ve model yorumlama için kullanışlıdır. |
compile | bool veya str | False | PyTorch 2.x torch.compile grafik derlemesini backend='inductor' ile etkinleştirir. True → "default" kabul eder, False devre dışı bırakır veya "default", "reduce-overhead", "max-autotune-no-cudagraphs" gibi bir dize modu alır. Desteklenmiyorsa uyarı vererek eager moduna döner. |
end2end | bool | None | NMS içermeyen çıkarımı destekleyen YOLO modellerinde (YOLO26, YOLOv10) uçtan uca modunu geçersiz kılar. False olarak ayarlamak, doğrulamayı geleneksel NMS hattını kullanarak çalıştırmanıza ve ayrıca iou argümanını kullanmanıza olanak tanır. |
Optimum performans sağlamak ve aşırı öğrenmeyi tespit edip önlemek için dikkatli ince ayar ve deneme çok önemlidir.
Dışa Aktarma Ayarları
YOLO modelleri için dışa aktarma ayarları, modeli farklı ortamlarda kullanmak üzere kaydetme veya dışa aktarma yapılandırmalarını içerir. Bu ayarlar performansı, boyutu ve uyumluluğu etkiler. Temel ayarlar arasında dışa aktarılan dosya formatı (ör. ONNX, TensorFlow SavedModel), hedef cihaz (ör. CPU, GPU) ve maskeler gibi özellikler bulunur. Modelin görevi ve hedef ortamın kısıtlamaları da dışa aktarma sürecini etkiler.
| Argüman | Tür | Varsayılan | Açıklama |
|---|---|---|---|
format | str | 'torchscript' | 'onnx', 'torchscript', 'engine' (TensorRT) veya diğerleri gibi dışa aktarılan model için hedef format. Her format farklı dağıtım ortamlarıyla uyumluluk sağlar. |
imgsz | int veya tuple | 640 | Desired image size for the model input. Can be an integer for square images (e.g., 640 for 640×640) or a tuple (height, width) for specific dimensions. |
keras | bool | False | TensorFlow SavedModel için Keras formatına dışa aktarmayı etkinleştirir; TensorFlow sunumu ve API'leriyle uyumluluk sağlar. |
optimize | bool | False | TorchScript'e dışa aktarırken mobil cihazlar için optimizasyon uygular; model boyutunu potansiyel olarak küçültür ve çıkarım performansını artırır. NCNN formatı veya CUDA cihazlarıyla uyumlu değildir. DeepX için, çıkarım gecikmesini azaltan ve derleme süresini artıran daha yüksek bir derleyici optimizasyonunu etkinleştirir. |
half | bool | False | FP16 (yarı hassasiyetli) nicelemeyi etkinleştirir; model boyutunu küçültür ve desteklenen donanımlarda çıkarımı hızlandırabilir. INT8 niceleme veya yalnızca CPU dışa aktarmalarıyla uyumlu değildir. Yalnızca belirli formatlar için kullanılabilir, ör. ONNX (aşağıya bakınız). |
int8 | bool | False | INT8 nicelemeyi etkinleştirir; modeli daha da sıkıştırır ve minimum doğruluk kaybıyla çıkarımı hızlandırır; öncelikle uç cihazlar için. TensorRT ile kullanıldığında, eğitim sonrası niceleme (PTQ) gerçekleştirir. |
dynamic | bool | False | TorchScript, ONNX, OpenVINO, TensorRT ve CoreML dışa aktarmaları için dinamik giriş boyutlarına izin verir; değişen görüntü boyutlarını işlemede esnekliği artırır. INT8 ile TensorRT kullanılırken otomatik olarak True olarak ayarlanır. |
simplify | bool | True | ONNX dışa aktarmaları için model grafiğini onnxslim ile basitleştirir; performansı ve çıkarım motorlarıyla uyumluluğu potansiyel olarak artırır. |
opset | int | None | Farklı ONNX ayrıştırıcıları ve çalışma zamanlarıyla uyumluluk için ONNX opset sürümünü belirtir. Ayarlanmazsa, desteklenen en son sürümü kullanır. |
workspace | float veya None | None | Bellek kullanımı ve performans arasında denge kurarak, TensorRT optimizasyonları için GiB cinsinden maksimum çalışma alanı boyutunu ayarlar. TensorRT tarafından cihazın maksimum kapasitesine kadar otomatik tahsis için None değerini kullan. |
nms | bool | False | Desteklendiğinde (bkz. Dışa Aktarma Formatları), dışa aktarılan modele NMS (Non-Maximum Suppression) ekleyerek tespit sonrası işleme verimliliğini artırır. Uçtan uca modeller için kullanılamaz. |
batch | int | 1 | Dışa aktarılan modelin toplu çıkarım boyutunu veya predict modunda aynı anda işleyeceği maksimum görüntü sayısını belirtir. Edge TPU dışa aktarımları için bu değer otomatik olarak 1'e ayarlanır. |
device | str | None | Dışa aktarma için cihazı belirtir: GPU (device=0), CPU (device=cpu), Apple silicon için MPS (device=mps), Huawei Ascend NPU (device=npu veya device=npu:0) veya NVIDIA Jetson için DLA (device=dla:0 veya device=dla:1). TensorRT dışa aktarımları otomatik olarak GPU kullanır. |
data | str | 'coco8.yaml' | INT8 niceleme kalibrasyonu için gerekli olan veri kümesi yapılandırma dosyasının yolu. INT8 etkinken belirtilmezse, kalibrasyon için yedek olarak coco8.yaml kullanılır. |
fraction | float | 1.0 | INT8 niceleme kalibrasyonu için kullanılacak veri kümesi oranını belirtir. Tam veri kümesinin bir alt kümesinde kalibrasyon yapmaya olanak tanır; bu, deneyler veya kaynaklar sınırlı olduğunda kullanışlıdır. INT8 etkinken belirtilmezse, veri kümesinin tamamı kullanılır. |
end2end | bool | None | NMS içermeyen çıkarımı (YOLO26, YOLOv10) destekleyen YOLO modellerindeki uçtan uca modu geçersiz kılar. Bunu False olarak ayarlamak, bu modelleri geleneksel NMS tabanlı işlem sonrası hattıyla uyumlu olacak şekilde dışa aktarmanı sağlar. Ayrıntılar için Uçtan Uca Tespit rehberine göz at. |
Düşünceli yapılandırma, dışa aktarılan modelin kullanım durumu için optimize edilmesini ve hedef ortamda etkili bir şekilde çalışmasını sağlar.
Çözüm Ayarları
Ultralytics Çözümleri yapılandırma ayarları, nesne sayma, ısı haritası oluşturma, egzersiz takibi, veri analizi, bölge takibi, sıra yönetimi ve bölge tabanlı sayım gibi görevler için modelleri özelleştirme esnekliği sunar. Bu seçenekler, özel ihtiyaçlara göre uyarlanmış doğru ve kullanışlı sonuçlar için kolay ayarlamalar yapılmasına olanak tanır.
| Argüman | Tür | Varsayılan | Açıklama |
|---|---|---|---|
model | str | None | Bir Ultralytics YOLO model dosyasına giden yol. |
region | list | '[(20, 400), (1260, 400)]' | Sayım bölgesini tanımlayan noktalar listesi. |
show_in | bool | True | Video akışında giriş sayılarını gösterip göstermemeyi kontrol eden bayrak. |
show_out | bool | True | Video akışında çıkış sayılarını gösterip göstermemeyi kontrol eden bayrak. |
analytics_type | str | 'line' | Grafik türü; örn. line, bar, area veya pie. |
colormap | int | cv2.COLORMAP_DEEPGREEN | Isı haritası için kullanılacak renk haritası. |
json_file | str | None | Tüm park koordinatları verilerini içeren JSON dosyasına giden yol. |
up_angle | float | 145.0 | 'Yukarı' poz için açı eşiği. |
kpts | list[int] | '[6, 8, 10]' | Egzersizleri izlemek için kullanılan üç anahtar nokta indeksi listesi. Bu anahtar noktalar; şınav, barfiks, squat ve karın egzersizleri gibi hareketler için omuzlar, dirsekler ve bilekler gibi vücut eklemlerine veya kısımlarına karşılık gelir. |
down_angle | int | 90 | 'Aşağı' poz için açı eşiği. |
blur_ratio | float | 0.5 | 0.1 - 1.0 aralığındaki değerlerle bulanıklık yoğunluğunun yüzdesini ayarlar. |
crop_dir | str | 'cropped-detections' | Kırpılmış tespitleri saklamak için dizin adı. |
records | int | 5 | Güvenlik alarm sistemi ile e-posta tetiklemek için toplam tespit sayısı. |
vision_point | tuple[int, int] | (20, 20) | VisionEye Çözümü kullanılarak vizyonun nesneleri takip edeceği ve yollar çizeceği nokta. |
source | str | None | Girdi kaynağına (video, RTSP vb.) giden yol. Yalnızca Çözümler komut satırı arayüzü (CLI) ile kullanılabilir. |
figsize | tuple[int, int] | (12.8, 7.2) | Isı haritaları veya grafikler gibi analiz çizelgeleri için figür boyutu. |
fps | float | 30.0 | Hız hesaplamaları için kullanılan saniyedeki kare sayısı. |
max_hist | int | 5 | Hız/yön hesaplamaları için nesne başına izlenecek maksimum geçmiş nokta sayısı. |
meter_per_pixel | float | 0.05 | Piksel mesafesini gerçek dünya birimlerine dönüştürmek için kullanılan ölçeklendirme faktörü. |
max_speed | int | 120 | Görsel katmanlardaki maksimum hız sınırı (uyarılarda kullanılır). |
data | str | 'images' | Benzerlik araması için kullanılan görüntü dizinine giden yol. |
Çoğaltma Ayarları
Veri çoğaltma teknikleri, eğitim verilerine değişkenlik katarak YOLO modelinin sağlamlığını ve performansını artırmak için gereklidir; böylece modelin görülmemiş verilere daha iyi genelleme yapmasına yardımcı olur. Aşağıdaki tablo, her bir çoğaltma argümanının amacını ve etkisini özetlemektedir:
| Argüman | Tür | Varsayılan | Desteklenen Görevler | Aralık | Açıklama |
|---|---|---|---|---|---|
hsv_h | float | 0.015 | detect, segment, pose, obb, classify | 0.0 - 1.0 | Görüntünün tonunu renk çarkının bir kesri kadar ayarlar ve renk değişkenliği getirir. Modelin farklı ışık koşullarında genelleme yapmasına yardımcı olur. |
hsv_s | float | 0.7 | detect, segment, pose, obb, classify | 0.0 - 1.0 | Görüntünün doygunluğunu bir kesir kadar değiştirerek renk yoğunluğunu etkiler. Farklı çevresel koşulları simüle etmek için kullanışlıdır. |
hsv_v | float | 0.4 | detect, segment, pose, obb, classify | 0.0 - 1.0 | Görüntünün değerini (parlaklığını) bir kesir kadar değiştirerek, modelin çeşitli ışık koşullarında iyi performans göstermesine yardımcı olur. |
degrees | float | 0 | detect, segment, pose, obb | 0.0 - 180 | Görüntüyü belirtilen derece aralığında rastgele döndürerek modelin nesneleri çeşitli yönelimlerde tanıma yeteneğini geliştirir. |
translate | float | 0.1 | detect, segment, pose, obb | 0.0 - 1.0 | Görüntüyü, görüntü boyutunun bir kesri kadar yatay ve dikey olarak kaydırarak kısmen görünür nesneleri tespit etmeyi öğrenmeye yardımcı olur. |
scale | float | 0.5 | detect, segment, pose, obb, classify | 0 - 1 | Görüntüyü bir kazanç faktörüyle ölçeklendirerek, kameradan farklı mesafelerdeki nesneleri simüle eder. |
shear | float | 0 | detect, segment, pose, obb | -180 - +180 | Görüntüyü belirtilen derecede eğerek, nesnelerin farklı açılardan görüntülenmesi etkisini taklit eder. |
perspective | float | 0 | detect, segment, pose, obb | 0.0 - 0.001 | Görüntüye rastgele perspektif dönüşümü uygulayarak modelin 3D uzaydaki nesneleri anlama yeteneğini geliştirir. |
flipud | float | 0 | detect, segment, pose, obb, classify | 0.0 - 1.0 | Görüntüyü belirtilen olasılıkla baş aşağı çevirir, nesnenin özelliklerini etkilemeden veri değişkenliğini artırır. |
fliplr | float | 0.5 | detect, segment, pose, obb, classify | 0.0 - 1.0 | Görüntüyü belirtilen olasılıkla soldan sağa çevirir; simetrik nesneleri öğrenmek ve veri kümesi çeşitliliğini artırmak için kullanışlıdır. |
bgr | float | 0 | detect, segment, pose, obb | 0.0 - 1.0 | Görüntü kanallarını belirtilen olasılıkla RGB'den BGR'ye çevirir; yanlış kanal sıralamasına karşı dayanıklılığı artırmak için kullanışlıdır. |
mosaic | float | 1 | detect, segment, pose, obb | 0.0 - 1.0 | Dört eğitim görüntüsünü birleştirerek farklı sahne kompozisyonlarını ve nesne etkileşimlerini simüle eder. Karmaşık sahne anlayışı için oldukça etkilidir. |
mixup | float | 0 | detect, segment, pose, obb | 0.0 - 1.0 | İki görüntüyü ve etiketlerini harmanlayarak bileşik bir görüntü oluşturur. Etiket gürültüsü ve görsel değişkenlik ekleyerek modelin genelleme yeteneğini geliştirir. |
cutmix | float | 0 | detect, segment, pose, obb | 0.0 - 1.0 | İki görüntünün kısımlarını birleştirerek, belirgin bölgeleri korurken kısmi bir karışım oluşturur. Tıkanma senaryoları yaratarak model dayanıklılığını artırır. |
copy_paste | float | 0 | segment | 0.0 - 1.0 | Nesne örneklerini artırmak için nesneleri görüntüler arasında kopyalar ve yapıştırır. |
copy_paste_mode | str | flip | segment | - | Kullanılacak copy-paste stratejisini belirler. Seçenekler arasında 'flip' ve 'mixup' bulunur. |
auto_augment | str | randaugment | classify | - | Görsel çeşitlilik yoluyla model performansını artırmak için önceden tanımlanmış bir artırma politikası ('randaugment', 'autoaugment' veya 'augmix') uygular. |
erasing | float | 0.4 | classify | 0.0 - 1.0 | Eğitim sırasında modelin daha az belirgin özelliklere odaklanmasını teşvik etmek için görüntü bölgelerini rastgele siler. |
augmentations | list | `` | detect, segment, pose, obb | - | İleri düzey veri artırma için özel Albumentations dönüşümleri (yalnızca Python API). Özel artırma ihtiyaçları için bir dönüşüm nesneleri listesi kabul eder. |
Bu ayarları veri kümesi ve görev gereksinimlerini karşılayacak şekilde ayarla. Farklı değerlerle denemeler yapmak, en iyi model performansı için optimal artırma stratejisini bulmana yardımcı olabilir.
Günlükleme, Kontrol Noktaları ve Çizim Ayarları
Bir YOLO modeli eğitirken günlükleme, kontrol noktaları, çizim ve dosya yönetimi önemlidir:
- Günlükleme: TensorBoard gibi kütüphaneleri kullanarak veya bir dosyaya yazarak modelin ilerlemesini takip et ve sorunları tanıla.
- Kontrol Noktaları: Eğitimi sürdürmek veya farklı yapılandırmalarla denemeler yapmak için modeli düzenli aralıklarla kaydet.
- Çizim: Matplotlib veya TensorBoard gibi kütüphaneleri kullanarak performansı ve eğitim ilerlemesini görselleştir.
- Dosya yönetimi: Kolay erişim ve analiz için kontrol noktaları, günlük dosyaları ve çizimler gibi eğitim sırasında oluşturulan dosyaları düzenle.
Bu yönlerin etkili yönetimi, ilerlemeyi takip etmene yardımcı olur ve hata ayıklamayı ve optimizasyonu kolaylaştırır.
| Argüman | Varsayılan | Açıklama |
|---|---|---|
project | 'runs' | Eğitim çalışmalarını kaydetmek için kök dizini belirtir. Her çalışma ayrı bir alt dizine kaydedilir. |
name | 'exp' | Deney adını tanımlar. Belirtilmezse, YOLO üzerine yazmayı önlemek için her çalışma için bu adı artırır (örneğin, exp, exp-2). |
exist_ok | False | Mevcut bir deney dizininin üzerine yazılıp yazılmayacağını belirler. True üzerine yazmaya izin verir; False bunu önler. |
plots | True | Controls the generation and saving of training and validation plots. Set to True to create plots like loss curves, precision-recall curves, and sample predictions for visual tracking of performance. |
save | True | Eğitim kontrol noktalarının ve nihai model ağırlıklarının kaydedilmesini etkinleştirir. Model durumlarını periyodik olarak kaydetmek, eğitimin sürdürülmesine veya modelin dağıtılmasına olanak sağlamak için True değerine ayarla. |
Özel Yapılandırma Dosyası
Bağımsız değişkenleri satır içi geçirmeden tam bir bağımsız değişken setini yeniden kullanmak için kaydedilmiş bir YAML yükle. cfg bağımsız değişkeni default.yaml içindeki değerleri geçersiz kılar, ancak yanında geçirilen ek bağımsız değişkenler yine de öncelik alır.
| Argüman | Varsayılan | Açıklama |
|---|---|---|
cfg | None | Değerleri default.yaml girişlerinin yerini alan bir YAML dosyasının yolu. Çalışan bir CLI örneği için Varsayılan Yapılandırma Dosyasını Geçersiz Kılma bölümüne bak. |
SSS
Eğitim sırasında YOLO modelimin performansını nasıl artırabilirim?
Performansı, yığın boyutu, öğrenme oranı, momentum ve ağırlık azalması gibi hiper parametreleri ayarlayarak artır. Veri artırma ayarlarını değiştir, doğru optimize ediciyi seç ve erken durdurma veya karışık hassasiyet gibi teknikleri kullan. Ayrıntılar için Eğitim Rehberine bak.
YOLO model doğruluğu için temel hiper parametreler nelerdir?
Doğruluğu etkileyen temel hiper parametreler şunlardır:
- Yığın Boyutu (
batch): Daha büyük boyutlar eğitimi dengeleyebilir ancak daha fazla bellek gerektirir. - Öğrenme Oranı (
lr0): Daha küçük oranlar ince ayarlar sunar ancak daha yavaş yakınsama sağlar. - Momentum (
momentum): Gradyan vektörlerini hızlandırarak salınımları sönümler. - Görüntü Boyutu (
imgsz): Daha büyük boyutlar doğruluğu artırır ancak hesaplama yükünü artırır.
Bunları veri kümene ve donanımına göre ayarla. Eğitim Ayarları bölümünde daha fazla bilgi edin.
Bir YOLO modelini eğitmek için öğrenme oranını nasıl ayarlarım?
The learning rate (lr0) is crucial; start with 0.01 for SGD or 0.001 for Adam optimizer. Monitor metrics and adjust as needed. Use cosine learning rate schedulers (cos_lr) or warmup (warmup_epochs, warmup_momentum). Details are in the Train Guide.
YOLO modelleri için varsayılan çıkarım ayarları nelerdir?
Varsayılan ayarlar şunları içerir:
- Güven Eşiği (
conf=0.25): Algılamalar için minimum güven. - IoU Eşiği (
iou=0.7): Maksimum Olmayan Bastırma (NMS) için. - Görüntü Boyutu (
imgsz=640): Giriş görüntülerini yeniden boyutlandırır. - Cihaz (
device=None): CPU, GPU, Apple MPS veya Huawei Ascend NPU (npu) seçer.
Tam bir genel bakış için Tahmin Ayarlarına ve Tahmin Rehberine bak.
Neden YOLO modelleriyle karışık hassasiyetli eğitim kullanmalı?
Karışık hassasiyet eğitimi (amp=True), FP16 ve FP32 kullanarak bellek kullanımını azaltır ve eğitimi hızlandırır. Modern GPU'lar için faydalıdır, önemli bir doğruluk kaybı olmadan daha büyük modellere ve daha hızlı hesaplamalara olanak tanır. Eğitim Rehberinde daha fazla bilgi edin.