Açıklamalı Bilgisayar Görüntüsü Verileri için Veri Ön İşleme Teknikleri

Q: How can I use Ultralytics YOLO for data augmentation?

Ultralytics YOLO26 ile veri artırma için, veri kümesi yapılandırma dosyasını (.yaml) değiştirmeniz gerekir. Bu dosyada, rastgele kırpmalar, yatay çevirmeler ve parlaklık ayarlamaları gibi çeşitli artırma tekniklerini belirtebilirsiniz. Bu, burada açıklanan eğitim yapılandırmaları kullanılarak etkili bir şekilde yapılabilir. Veri artırma, daha sağlam bir veri kümesi oluşturmaya, aşırı uyumu azaltmaya ve model genellemesini iyileştirmeye yardımcı olur.

Q: What are the best data normalization techniques for computer vision data?

Normalizasyon, eğitim sırasında daha hızlı yakınsama ve gelişmiş performans için piksel değerlerini standart bir aralığa ölçekler. Yaygın teknikler şunlardır: YOLO26 için normalizasyon, RGB'ye dönüştürme ve piksel değeri ölçeklendirme dahil olmak üzere otomatik olarak ele alınır. Daha fazla bilgiyi model eğitimi bölümünde bulabilirsiniz.

Giriş

Bilgisayar görüşü projenizin hedeflerini ve veri toplama ve açıklama ekleme işlemlerini tanımladıktan sonra, bir sonraki adım açıklama eklenmiş verileri ön işlemek ve model eğitimi için hazırlamaktır. İyi performans gösteren bir model oluşturmak için temiz ve tutarlı veriler hayati önem taşır.

İzle: Gerçek Dünya Senaryolarında Model Doğruluğunu İyileştirmek için Veri Ön İşleme ve Artırma Nasıl Kullanılır? 🚀

Ön işleme, görüntüleri yeniden boyutlandırmayı, piksel değerlerini normalleştirmeyi, veri kümesini artırmayı ve verileri eğitim, doğrulama ve test kümelerine ayırmayı içeren bir bilgisayarlı görü projesi iş akışındaki bir adımdır. Verilerinizi temizlemek için temel teknikleri ve en iyi uygulamaları keşfedelim!

Veri Ön İşlemenin Önemi

Verilerimizi zaten birden fazla hususu göz önünde bulundurarak dikkatlice topluyor ve etiketliyoruz. O zaman, veri ön işlemesini bir bilgisayarlı görü projesi için bu kadar önemli kılan nedir? Veri ön işleme, verilerinizi hesaplama yükünü azaltan ve model performansını iyileştirmeye yardımcı olan eğitim için uygun bir formata getirmekle ilgilidir. İşte ön işlemenin ele aldığı ham verilerdeki bazı yaygın sorunlar:

Gürültü (Noise): Verilerdeki ilgisiz veya rastgele varyasyonlar.
Tutarsızlık: Görüntü boyutları, formatları ve kalitesindeki farklılıklar.
Dengesizlik: Veri kümesindeki sınıfların veya kategorilerin eşit olmayan dağılımı.

Veri Ön İşleme Teknikleri

Veri ön işlemede ilk ve en önemli adımlardan biri yeniden boyutlandırmadır. Bazı modeller değişken giriş boyutlarını işlemek için tasarlanmıştır, ancak birçok model tutarlı bir giriş boyutu gerektirir. Görüntüleri yeniden boyutlandırmak, onları tek tip hale getirir ve hesaplama karmaşıklığını azaltır.

Görüntüleri Yeniden Boyutlandırma

Görüntülerinizi aşağıdaki yöntemleri kullanarak yeniden boyutlandırabilirsiniz:

Bilinear Enterpolasyon: En yakın dört piksel değerinin ağırlıklı ortalamasını alarak piksel değerlerini yumuşatır.
En Yakın Komşu: Ortalama almadan en yakın piksel değerini atar, bu da bloklu bir görüntüye ancak daha hızlı hesaplamaya yol açar.

Yeniden boyutlandırmayı daha basit bir görev haline getirmek için aşağıdaki araçları kullanabilirsiniz:

OpenCV: Görüntü işleme için kapsamlı işlevlere sahip popüler bir bilgisayar görüşü kütüphanesi.
PIL (Pillow): Görüntü dosyalarını açmak, işlemek ve kaydetmek için bir python Görüntüleme Kitaplığı.

YOLO26 ile ilgili olarak, model eğitimi sırasındaki 'imgsz' parametresi esnek giriş boyutlarına olanak tanır. 640 gibi belirli bir boyuta ayarlandığında, model giriş görüntülerini en büyük boyutları 640 piksel olacak şekilde yeniden boyutlandırırken orijinal en boy oranını korur.

Modelinizin ve veri kümenizin özel ihtiyaçlarını değerlendirerek, yeniden boyutlandırmanın gerekli bir ön işleme adımı olup olmadığını veya modelinizin değişen boyutlardaki görüntüleri verimli bir şekilde işleyip işleyemeyeceğini belirleyebilirsiniz.

Piksel Değerlerini Normalleştirme

Bir diğer ön işleme tekniği de normalleştirmedir. Normalleştirme, piksel değerlerini standart bir aralığa ölçeklendirir; bu da eğitim sırasında daha hızlı yakınsamaya yardımcı olur ve model performansını artırır. İşte bazı yaygın normalleştirme teknikleri:

Min-Max Ölçeklendirme: Piksel değerlerini 0 ile 1 aralığına ölçeklendirir.
Z-Skoru Normalizasyonu: Piksel değerlerini ortalama ve standart sapmalarına göre ölçeklendirir.

YOLO26 özelinde, normalizasyon model eğitimi sırasında ön işleme hattının bir parçası olarak sorunsuz bir şekilde ele alınır. YOLO26, RGB'ye dönüştürme, piksel değerlerini [0, 1] aralığına ölçeklendirme ve önceden tanımlanmış ortalama ve standart sapma değerleri kullanarak normalizasyon dahil olmak üzere çeşitli ön işleme adımlarını otomatik olarak gerçekleştirir.

Veri Kümesini Bölme

Verileri temizledikten sonra, veri kümesini bölmeye hazırsınız. Verileri eğitim, doğrulama ve test kümelerine bölmek, modelin genelleme performansını değerlendirmek için görülmemiş veriler üzerinde değerlendirilebilmesini sağlamak için yapılır. Yaygın bir bölünme, eğitim için %70, doğrulama için %20 ve test için %10'dur. Verilerinizi bölmek için scikit-learn veya TensorFlow gibi çeşitli araçlar ve kütüphaneler kullanabilirsiniz.

Veri kümenizi bölerken aşağıdakileri göz önünde bulundurun:

Veri Dağılımını Koruma: Sınıfların veri dağılımının eğitim, doğrulama ve test setleri genelinde korunmasını sağlayın.
Veri Sızıntısından Kaçınma: Genellikle, veri artırma, veri kümesi bölündükten sonra yapılır. Veri artırma ve diğer tüm ön işlemler, doğrulama veya test kümelerinden gelen bilgilerin model eğitimini etkilemesini önlemek için yalnızca eğitim kümesine uygulanmalıdır.
Sınıfları Dengeleme: Dengesiz veri kümeleri için, eğitim kümesinde azınlık sınıfını aşırı örnekleme veya çoğunluk sınıfını eksik örnekleme gibi teknikleri göz önünde bulundurun.

Veri Artırma (Data Augmentation) nedir?

En sık tartışılan veri ön işleme adımı, veri artırmadır. Veri artırma, görüntülerin değiştirilmiş versiyonlarını oluşturarak veri kümesinin boyutunu yapay olarak artırır. Verilerinizi artırarak aşırı öğrenmeyi azaltabilir ve model genellemesini iyileştirebilirsiniz.

İşte veri artırmanın diğer bazı faydaları:

Daha Güçlü Bir Veri Kümesi Oluşturur: Veri artırma, modeli girdi verilerindeki varyasyonlara ve bozulmalara karşı daha güçlü hale getirebilir. Bu, aydınlatma, yönlendirme ve ölçekteki değişiklikleri içerir.
Uygun Maliyetli: Veri artırma, yeni veri toplama ve etiketleme yapmadan eğitim verisi miktarını artırmanın uygun maliyetli bir yoludur.
Verinin Daha İyi Kullanımı: Mevcut her veri noktası, yeni varyasyonlar oluşturularak maksimum potansiyeliyle kullanılır.

Veri Artırma Yöntemleri

Yaygın artırma teknikleri arasında çevirme, döndürme, ölçekleme ve renk ayarlamaları bulunur. Albumentations, Imgaug ve TensorFlow'un ImageDataGenerator'ı gibi çeşitli kitaplıklar bu artırmaları oluşturabilir.

Veri Artırmalarına Genel Bakış

YOLO26 özelinde, veri seti yapılandırma dosyasını, yani bir .yaml dosyasını değiştirerek özel veri setinizi artırabilirsiniz. Bu dosyada, verilerinizi nasıl artırmak istediğinizi belirten parametrelerle bir artırma bölümü ekleyebilirsiniz.

Ultralytics YOLO26 deposu geniş bir veri artırma yelpazesini destekler. Çeşitli dönüşümler uygulayabilirsiniz, örneğin:

Rastgele Kırpmalar
Çevirme: Görüntüler yatay veya dikey olarak çevrilebilir.
Döndürme: Görüntüler belirli açılarla döndürülebilir.
Bozulma

Ayrıca, daha fazla veri çeşitliliği oluşturmak için bu artırma tekniklerinin yoğunluğunu belirli parametreler aracılığıyla ayarlayabilirsiniz.

Ön İşleme Örnek Olay İncelemesi

YOLO26 kullanarak trafik görüntülerindeki farklı araç türlerini detect ve classify etmeye yönelik bir model geliştirmeyi amaçlayan bir proje düşünün. Trafik görüntüleri topladık ve bunları sınırlayıcı kutular ve etiketlerle işaretledik.

İşte bu proje için ön işlemenin her adımının nasıl görüneceği:

Görüntüleri Yeniden Boyutlandırma: YOLO26 esnek giriş boyutlarını işlediği ve yeniden boyutlandırmayı otomatik olarak gerçekleştirdiği için manuel yeniden boyutlandırma gerekli değildir. Model, eğitim sırasında belirtilen 'imgsz' parametresine göre görüntü boyutunu ayarlayacaktır.
Piksel Değerlerini Normalleştirme: YOLO26, ön işleme sırasında piksel değerlerini otomatik olarak 0 ile 1 aralığına normalleştirir, bu nedenle bu işlem gerekli değildir.
Veri Kümesini Bölme: Scikit-learn gibi araçları kullanarak veri kümesini eğitim (%70), doğrulama (%20) ve test (%10) kümelerine ayırın.
Veri Artırma: Rastgele kırpmalar, yatay çevirmeler ve parlaklık ayarlamaları gibi veri artırma tekniklerini dahil etmek için veri kümesi yapılandırma dosyasını (.yaml) değiştirin.

Bu adımlar, veri kümesinin herhangi bir potansiyel sorun olmadan hazırlanmasını ve Keşifsel Veri Analizi (EDA) için hazır olmasını sağlar.

Keşifsel Veri Analizi Teknikleri

Veri kümenizi ön işleme ve artırmadan sonraki adım, Keşifsel Veri Analizi yoluyla içgörü kazanmaktır. EDA, verilerinizdeki kalıpları ve dağılımları anlamak için istatistiksel teknikler ve görselleştirme araçları kullanır. Sınıf dengesizlikleri veya aykırı değerler gibi sorunları belirleyebilir ve daha fazla veri ön işleme veya model eğitimi ayarlamaları hakkında bilinçli kararlar verebilirsiniz.

İstatistiksel EDA Teknikleri

İstatistiksel teknikler genellikle ortalama, medyan, standart sapma ve aralık gibi temel metriklerin hesaplanmasıyla başlar. Bu metrikler, piksel yoğunluğu dağılımları gibi görüntü veri kümenizin özelliklerine hızlı bir genel bakış sağlar. Bu temel istatistikleri anlamak, verilerinizin genel kalitesini ve özelliklerini anlamanıza yardımcı olur ve herhangi bir düzensizliği erkenden tespit etmenizi sağlar.

Görsel EDA Teknikleri

Görselleştirmeler, görüntü veri kümeleri için EDA'da önemlidir. Örneğin, sınıf dengesizliği analizi, EDA'nın bir diğer hayati yönüdür. Veri kümenizde belirli sınıfların yeterince temsil edilip edilmediğini belirlemeye yardımcı olur. Farklı görüntü sınıflarının veya kategorilerinin dağılımını çubuk grafikler kullanarak görselleştirmek, herhangi bir dengesizliği hızla ortaya çıkarabilir. Benzer şekilde, aykırı değerler, piksel yoğunluğundaki veya özellik dağılımlarındaki anormallikleri vurgulayan kutu grafikleri gibi görselleştirme araçları kullanılarak belirlenebilir. Aykırı değer tespiti, alışılmadık veri noktalarının sonuçlarınızı çarpıtmasını önler.

Görselleştirmeler için yaygın araçlar şunlardır:

Histogramlar ve Kutu Grafikleri: Piksel değerlerinin dağılımını anlamak ve aykırı değerleri belirlemek için kullanışlıdır.
Saçılım Grafikleri: Görüntü özellikleri veya açıklamaları arasındaki ilişkileri keşfetmek için faydalıdır.
Isı Haritaları: Görüntülerdeki piksel yoğunluklarının dağılımını veya açıklama eklenmiş özelliklerin uzamsal dağılımını görselleştirmek için etkilidir.

EDA için Ultralytics Kullanımı

EDA için kod yazmaya gerek olmayan bir yaklaşım için veri setinizi Ultralytics Platform. Veri kümesinin Charts sekmesi, yukarıda açıklanan görselleştirmeleri otomatik olarak oluşturur: bölünmüş dağılım, en sık görülen sınıf sayıları, görüntü genişliği/yüksekliği histogramları ve etiket konumları ile görüntü boyutlarının 2B ısı haritaları. Images Bu sekme, verilerinizi açıklama katmanlarıyla birlikte ızgara, kompakt veya tablo görünümlerinde taramanıza olanak tanır; böylece tek bir satır kod yazmadan bile yanlış etiketlenmiş örnekleri veya dengesiz sınıfları kolayca tespit edebilirsiniz.

Ulaşın ve Bağlantı Kurun

Projeniz hakkında diğer bilgisayar görüşü meraklılarıyla tartışmak, farklı bakış açılarından yeni fikirler verebilir. İşte öğrenmek, sorun gidermek ve ağ kurmak için bazı harika yollar:

Toplulukla Bağlantı Kurma Kanalları

GitHub Sorunları: YOLO26 GitHub deposunu ziyaret edin ve sorular sormak, hataları bildirmek ve özellikler önermek için Sorunlar sekmesini kullanın. Topluluk ve sürdürücüler, karşılaştığınız her türlü sorunda size yardımcı olmak için oradadır.
Ultralytics Discord Sunucusu: Diğer kullanıcılar ve geliştiricilerle bağlantı kurmak, destek almak, bilgi paylaşmak ve fikir alışverişinde bulunmak için Ultralytics Discord sunucusuna katılın.

Resmi Belgelendirme

Ultralytics YOLO26 Dokümantasyonu: Çok sayıda bilgisayar görüşü görevi ve projesi hakkında kapsamlı kılavuzlar ve değerli bilgiler için resmi YOLO26 dokümantasyonuna başvurun.

Veri Kümeniz Hazır!

Düzgün yeniden boyutlandırılmış, normalleştirilmiş ve artırılmış veriler, gürültüyü azaltarak ve genellemeyi iyileştirerek model performansını artırır. Bu kılavuzda özetlenen ön işleme tekniklerini ve en iyi uygulamaları izleyerek sağlam bir veri kümesi oluşturabilirsiniz. Önceden işlenmiş veri kümeniz hazır olduğunda, projenizdeki sonraki adımlara güvenle geçebilirsiniz.

SSS

Bilgisayar görüşü projelerinde veri ön işlemenin önemi nedir?

Veri ön işleme, bilgisayar görüşü projelerinde çok önemlidir çünkü verilerin temiz, tutarlı ve model eğitimi için en uygun biçimde olmasını sağlar. Ham verilerdeki gürültü, tutarsızlık ve dengesizlik gibi sorunları ele alarak, yeniden boyutlandırma, normalleştirme, artırma ve veri kümesi bölme gibi ön işleme adımları, hesaplama yükünü azaltmaya ve model performansını artırmaya yardımcı olur. Daha fazla ayrıntı için, bir bilgisayar görüşü projesinin adımlarını ziyaret edin.

Veri artırma için Ultralytics YOLO'yu nasıl kullanabilirim?

Ultralytics YOLO26 ile veri artırma için veri seti yapılandırma dosyasını (.yaml) değiştirmeniz gerekir. Bu dosyada, rastgele kırpmalar, yatay çevirmeler ve parlaklık ayarlamaları gibi çeşitli artırma tekniklerini belirtebilirsiniz. Bu, burada açıklanan eğitim yapılandırmaları kullanılarak etkili bir şekilde yapılabilir. Veri artırma, daha sağlam bir veri seti oluşturmaya, aşırı uyumu azaltmaya ve model genellemesini iyileştirmeye yardımcı olur.

Bilgisayarlı görü verileri için en iyi veri normalleştirme teknikleri nelerdir?

Normalleştirme, eğitim sırasında daha hızlı yakınsama ve gelişmiş performans için piksel değerlerini standart bir aralığa ölçeklendirir. Yaygın teknikler şunları içerir:

Min-Max Ölçeklendirme: Piksel değerlerini 0 ile 1 aralığına ölçeklendirir.
Z-Skoru Normalizasyonu: Piksel değerlerini ortalama ve standart sapmalarına göre ölçeklendirir.

YOLO26 için normalizasyon, RGB'ye dönüştürme ve piksel değeri ölçeklendirme dahil olmak üzere otomatik olarak ele alınır. Daha fazla bilgiyi model eğitimi bölümünde bulabilirsiniz.

Etiketlenmiş veri kümemi eğitim için nasıl bölmeliyim?

Veri kümenizi bölmek için, yaygın bir uygulama, onu %70 eğitim, %20 doğrulama ve %10 test için bölmektir. Bu bölmeler arasında sınıfların veri dağılımını korumak ve yalnızca eğitim kümesinde artırma gerçekleştirerek veri sızıntısını önlemek önemlidir. Veri kümesi bölme için scikit-learn veya TensorFlow gibi araçları kullanın. veri kümesi hazırlama hakkındaki ayrıntılı kılavuza bakın.

YOLO26'da değişen görüntü boyutlarını manuel yeniden boyutlandırma yapmadan işleyebilir miyim?

Evet, Ultralytics YOLO26, model eğitimi sırasında 'imgsz' parametresi aracılığıyla değişen görüntü boyutlarını işleyebilir. Bu parametre, görüntülerin en büyük boyutları belirtilen boyuta (örn. 640 piksel) uyacak şekilde yeniden boyutlandırılmasını sağlarken, en boy oranını korur. Daha esnek giriş işleme ve otomatik ayarlamalar için model eğitimi bölümünü inceleyin.

📅 1 yıl önce oluşturuldu ✏️ 11 gün önce güncellendi