Link to this sectionBilgisayarlı Görü için Veri Toplama ve Etiketleme Stratejileri#
Link to this sectionGiriş#
Herhangi bir bilgisayarlı görü projesinde başarının anahtarı, etkili veri toplama ve etiketleme stratejileriyle başlar. Veri kalitesi model performansını doğrudan etkilediğinden, veri toplama ve veri etiketleme ile ilgili en iyi uygulamaları anlamak önemlidir.
Watch: How to Build Effective Data Collection and Annotation Strategies for Computer Vision 🚀
Verilerle ilgili her değerlendirme, projenin hedefleriyle yakından uyumlu olmalıdır. Etiketleme stratejilerindeki değişiklikler projenin odağını veya verimliliğini değiştirebilir ve bunun tersi de geçerlidir. Bunu göz önünde bulundurarak, veri toplama ve etiketlemeye yaklaşmanın en iyi yollarına daha yakından bakalım.
Link to this sectionSınıfları Ayarlama ve Veri Toplama#
Bir bilgisayarlı görü projesi için görüntü ve video toplamak; sınıf sayısını tanımlamayı, veriyi kaynaklandırmayı ve etik sonuçları değerlendirmeyi içerir. Verilerinizi toplamaya başlamadan önce şunlar hakkında net olmanız gerekir:
Link to this sectionProjeniz İçin Doğru Sınıfları Seçmek#
Bir bilgisayarlı görü projesine başlarken ilk sorulardan biri kaç sınıfın dahil edileceğidir. Modelinizin tanımasını ve ayırt etmesini istediğiniz farklı kategorileri veya etiketleri içeren sınıf üyeliğini belirlemeniz gerekir. Sınıf sayısı, projenizin özel hedefleri tarafından belirlenmelidir.
Örneğin, trafiği izlemek istiyorsanız sınıflarınız "araba", "kamyon", "otobüs", "motosiklet" ve "bisiklet" içerebilir. Öte yandan, bir mağazadaki ürünleri takip etmek için sınıflarınız "meyveler", "sebzeler", "içecekler" ve "atıştırmalıklar" olabilir. Sınıfları proje hedeflerinize göre tanımlamak, veri kümenizi alakalı ve odaklanmış tutmanıza yardımcı olur.
Sınıflarınızı tanımlarken yapılması gereken bir diğer önemli ayrım, kaba veya ince sınıf sayılarını seçip seçmeyeceğinizdir. 'Sayı', ilgilendiğiniz farklı sınıfların sayısını ifade eder. Bu karar, verinizin ayrıntı düzeyini ve modelinizin karmaşıklığını etkiler. Her yaklaşım için dikkate alınması gerekenler şunlardır:
- Kaba Sınıf Sayısı: Bunlar, "araç" ve "araç olmayan" gibi daha geniş ve daha kapsayıcı kategorilerdir. Etiketlemeyi basitleştirir ve daha az hesaplama kaynağı gerektirirler ancak daha az ayrıntılı bilgi sağlarlar, bu da modelin karmaşık senaryolardaki etkinliğini sınırlayabilir.
- İnce Sınıf Sayısı: "sedan", "SUV", "kamyonet" ve "motosiklet" gibi daha ince ayrımlara sahip daha fazla kategori. Daha ayrıntılı bilgi yakalayarak model doğruluğunu ve performansını artırırlar. Ancak, etiketlenmeleri daha fazla zaman alır ve daha fazla emek gerektirir, ayrıca daha fazla hesaplama kaynağına ihtiyaç duyarlar.
Özellikle ayrıntıların önemli olduğu karmaşık projelerde daha spesifik sınıflarla başlamak çok yardımcı olabilir. Daha spesifik sınıflar, daha ayrıntılı veriler toplamanıza, daha derin içgörüler kazanmanıza ve kategoriler arasında daha net ayrımlar oluşturmanıza olanak tanır. Bu sadece modelin doğruluğunu artırmakla kalmaz, aynı zamanda gerekirse modeli daha sonra ayarlamayı da kolaylaştırarak hem zamandan hem de kaynaklardan tasarruf sağlar.
Link to this sectionVeri Kaynakları#
Genel veri kümelerini kullanabilir veya kendi özel verilerinizi toplayabilirsiniz. Kaggle ve Google Dataset Search Engine üzerindekiler gibi genel veri kümeleri, iyi etiketlenmiş ve standartlaştırılmış veriler sunarak modelleri eğitmek ve doğrulamak için harika başlangıç noktaları oluşturur.
Öte yandan, özel veri toplama, veri kümenizi özel ihtiyaçlarınıza göre özelleştirmenize olanak tanır. Kameralar veya dronlarla görüntü ve video yakalayabilir, web'den görüntü kazıyabilir veya kuruluşunuzdan mevcut dahili verileri kullanabilirsiniz. Özel veriler, kalitesi ve uygunluğu üzerinde size daha fazla kontrol sağlar. Hem genel hem de özel veri kaynaklarını birleştirmek, çeşitli ve kapsamlı bir veri kümesi oluşturmaya yardımcı olur.
Link to this sectionVeri Toplamada Önyargıdan Kaçınmak#
Önyargı, belirli gruplar veya senaryolar veri kümenizde az temsil edildiğinde veya aşırı temsil edildiğinde ortaya çıkar. Bu, bazı verilerde iyi, bazılarında ise kötü performans gösteren bir modele yol açar. Bilgisayarlı görü modelinizin çeşitli senaryolarda iyi performans gösterebilmesi için yapay zekada önyargıdan kaçınmak çok önemlidir.
İşte veri toplarken önyargıdan nasıl kaçınabileceğiniz:
- Çeşitli Kaynaklar: Farklı bakış açılarını ve senaryoları yakalamak için verileri birçok kaynaktan toplayın.
- Dengeli Temsil: İlgili tüm gruplardan dengeli temsil dahil edin. Örneğin, farklı yaşları, cinsiyetleri ve etnik kökenleri göz önünde bulundurun.
- Sürekli İzleme: Ortaya çıkan önyargıları belirlemek ve ele almak için veri kümenizi düzenli olarak gözden geçirin ve güncelleyin.
- Önyargı Azaltma Teknikleri: Az temsil edilen sınıfları aşırı örnekleme, veri artırma ve adalet odaklı algoritmalar gibi yöntemler kullanın.
Bu uygulamaları takip etmek, gerçek dünya uygulamalarında iyi genelleme yapabilen daha sağlam ve adil bir model oluşturmaya yardımcı olur.
Link to this sectionVeri Etiketleme Nedir?#
Veri etiketleme, makine öğrenimi modellerini eğitmek için verileri kullanılabilir hale getirme sürecidir. Bilgisayarlı görüde bu, görüntüleri veya videoları, bir modelin öğrenebilmesi için gereken bilgilerle etiketlemek anlamına gelir. Düzgün etiketlenmiş veriler olmadan modeller, girdiler ve çıktılar arasındaki ilişkileri doğru bir şekilde öğrenemez.
Link to this sectionVeri Etiketleme Türleri#
Bir bilgisayarlı görü görevinin özel gereksinimlerine bağlı olarak farklı veri etiketleme türleri vardır. İşte bazı örnekler:
- Sınırlayıcı Kutular (Bounding Boxes): Nesne algılama görevleri için birincil olarak kullanılan, bir görüntüdeki nesnelerin etrafına çizilen dikdörtgen kutular. Bu kutular sol üst ve sağ alt koordinatlarıyla tanımlanır.
- Çokgenler (Polygons): Sınırlayıcı kutulardan daha hassas etiketlemeye olanak tanıyan, nesneler için ayrıntılı ana hatlar. Çokgenler, nesnenin şeklinin önemli olduğu örnek segmentasyonu gibi görevlerde kullanılır.
- Maskeler: Her pikselin ya bir nesnenin parçası ya da arka plan olduğu ikili maskeler. Maskeler, piksel düzeyinde ayrıntı sağlamak için anlamsal segmentasyon görevlerinde kullanılır.
- Anahtar Noktalar (Keypoints): İlgi duyulan konumları belirlemek için bir görüntü içinde işaretlenmiş belirli noktalar. Anahtar noktalar, poz tahmini ve yüz özniteliği algılama gibi görevlerde kullanılır.
Link to this sectionYaygın Etiketleme Biçimleri#
Bir etiketleme türü seçtikten sonra, etiketleri saklamak ve paylaşmak için uygun biçimi seçmek önemlidir.
Commonly used formats include COCO, which supports various annotation types like object detection, keypoint detection, stuff segmentation, panoptic segmentation, and image captioning, stored in JSON. Pascal VOC uses XML files and is popular for object detection tasks. YOLO, on the other hand, creates a .txt file for each image, containing annotations like object class, coordinates, height, and width, making it suitable for object detection.
Link to this sectionEtiketleme Teknikleri#
Artık bir etiketleme türü ve biçimi seçtiğinizi varsayarsak, net ve objektif etiketleme kuralları oluşturma zamanı geldi. Bu kurallar, etiketleme süreci boyunca tutarlılık ve doğruluk için bir yol haritası gibidir. Bu kuralların temel yönleri şunlardır:
- Netlik ve Ayrıntı: Talimatlarınızın net olduğundan emin olun. Nelerin beklendiğini göstermek için örnekler ve çizimler kullanın.
- Tutarlılık: Etiketlerinizi tek tip tutun. Farklı veri türlerini etiketlemek için standart kriterler belirleyin, böylece tüm etiketler aynı kuralları takip eder.
- Önyargıyı Azaltma: Tarafsız kalın. Adil etiketlemeyi sağlamak için objektif olmayı öğrenin ve kişisel önyargılarınızı en aza indirin.
- Verimlilik: Daha çok değil, daha akıllı çalışın. Tekrarlayan görevleri otomatikleştiren araçlar ve iş akışları kullanarak etiketleme sürecini daha hızlı ve verimli hale getirin.
Etiketleme kurallarınızı düzenli olarak gözden geçirmek ve güncellemek, etiketlerinizin doğru, tutarlı ve proje hedeflerinizle uyumlu kalmasına yardımcı olacaktır.
Link to this sectionPopüler Etiketleme Araçları#
Artık etiketlemeye hazır olduğunuzu varsayalım. Veri etiketleme sürecini kolaylaştırmaya yardımcı olacak birkaç açık kaynaklı araç mevcuttur. İşte bazı kullanışlı açık etiketleme araçları:
- Label Studio: Çok çeşitli etiketleme görevlerini destekleyen ve projeleri yönetmek ve kalite kontrolü için özellikler içeren esnek bir araç.
- CVAT: Çeşitli etiketleme biçimlerini ve özelleştirilebilir iş akışlarını destekleyen, karmaşık projeler için uygun güçlü bir araç.
- Labelme: Görüntülerin çokgenlerle hızlı bir şekilde etiketlenmesine olanak tanıyan, basit ve kullanımı kolay bir araç, basit görevler için idealdir.
- LabelImg: Özellikle YOLO formatında sınırlayıcı kutu etiketleri oluşturmak için iyi olan, kullanımı kolay bir grafik görüntü etiketleme aracı.
These open-source tools are budget-friendly and provide a range of features to meet different annotation needs. Ultralytics Platform also provides a built-in annotation editor supporting detection, instance segmentation, pose, OBB, and classification annotations with SAM-powered smart annotation for spatial tasks.
Link to this sectionVerileri Etiketlemeden Önce Dikkate Alınması Gereken Birkaç Şey Daha#
Verilerinizi etiketlemeye başlamadan önce aklınızda bulundurmanız gereken birkaç şey daha var. Verilerinizi verimsiz bir şekilde etiketlemekten kaçınmak için doğruluk, hassasiyet, aykırı değerler ve kalite kontrolü hakkında bilgi sahibi olmalısınız.
Link to this sectionDoğruluk ve Hassasiyeti Anlamak#
Doğruluk ve hassasiyet arasındaki farkı ve bunun etiketlemeyle nasıl ilişkili olduğunu anlamak önemlidir. Doğruluk, etiketlenmiş verilerin gerçek değerlere ne kadar yakın olduğunu ifade eder. Etiketlerin gerçek dünya senaryolarını ne kadar iyi yansıttığını ölçmemize yardımcı olur. Hassasiyet, etiketlerin tutarlılığını gösterir. Veri kümesi boyunca aynı nesneye veya özelliğe aynı etiketi verip vermediğinizi kontrol eder. Yüksek doğruluk ve hassasiyet, gürültüyü azaltarak ve modelin eğitim verilerinden genelleme yeteneğini geliştirerek daha iyi eğitilmiş modellere yol açar.
Link to this sectionAykırı Değerleri Belirleme#
Aykırı değerler, veri kümesindeki diğer gözlemlerden biraz sapan veri noktalarıdır. Etiketler açısından bir aykırı değer, yanlış etiketlenmiş bir görüntü veya veri kümesinin geri kalanına uymayan bir etiket olabilir. Aykırı değerler endişe vericidir çünkü modelin öğrenme sürecini bozabilir, yanlış tahminlere ve kötü genellemeye yol açabilirler.
Aykırı değerleri tespit etmek ve düzeltmek için çeşitli yöntemler kullanabilirsiniz:
- İstatistiksel Teknikler: Piksel değerleri, sınırlayıcı kutu koordinatları veya nesne boyutları gibi sayısal özelliklerdeki aykırı değerleri tespit etmek için kutu grafikleri, histogramlar veya z-skorları gibi yöntemler kullanabilirsiniz.
- Görsel Teknikler: Nesne sınıfları, renkler veya şekiller gibi kategorik özelliklerdeki anormallikleri tespit etmek için görüntüleri, etiketleri veya ısı haritalarını çizmek gibi görsel yöntemler kullanın.
- Algoritmik Yöntemler: Veri dağılımı kalıplarına göre aykırı değerleri belirlemek için kümeleme (örneğin K-ortalamalar kümeleme, DBSCAN) ve anomali tespiti algoritmaları gibi araçlar kullanın.
Link to this sectionEtiketlenmiş Verilerin Kalite Kontrolü#
Diğer teknik projeler gibi, etiketlenmiş veriler için kalite kontrolü de bir zorunluluktur. Etiketlerin doğru ve tutarlı olduğundan emin olmak için bunları düzenli olarak kontrol etmek iyi bir uygulamadır. Bu birkaç farklı yolla yapılabilir:
- Etiketlenmiş verilerin örneklerini incelemek
- Yaygın hataları tespit etmek için otomatik araçlar kullanmak
- Başka bir kişinin etiketleri tekrar kontrol etmesini sağlamak
Birden fazla kişiyle çalışıyorsanız, farklı etiketleyiciler arasındaki tutarlılık önemlidir. İyi bir etiketleyiciler arası uyum, kılavuzların net olduğu ve herkesin bunları aynı şekilde takip ettiği anlamına gelir. Herkesi aynı sayfada ve etiketleri tutarlı tutar.
İncelerken hata bulursanız, bunları düzeltin ve gelecekteki hataları önlemek için kılavuzları güncelleyin. Etiketleyicilere geri bildirim sağlayın ve hataları azaltmaya yardımcı olmak için düzenli eğitimler sunun. Hataları ele almak için güçlü bir sürece sahip olmak, veri kümenizi doğru ve güvenilir tutar.
Link to this sectionVerimli Veri Etiketleme Stratejileri#
Veri etiketleme sürecini daha sorunsuz ve daha etkili hale getirmek için şu stratejileri uygulamayı düşünün:
- Net Etiketleme Kılavuzları: Tüm etiketleyicilerin görevleri tutarlı bir şekilde yorumlamasını sağlamak için örneklerle ayrıntılı talimatlar sağlayın. Örneğin, kuşları etiketlerken, tüm kuşu mu yoksa sadece belirli bölümleri mi dahil edeceğinizi belirtin.
- Düzenli Kalite Kontrolleri: Kriterler belirleyin ve çalışmayı gözden geçirmek için belirli metrikler kullanın, sürekli geri bildirim yoluyla yüksek standartları koruyun.
- Ön Etiketleme Araçlarını Kullanın: Birçok modern etiketleme platformu, insanların daha sonra iyileştirebileceği ilk etiketleri otomatik olarak oluşturarak süreci önemli ölçüde hızlandırabilen yapay zeka destekli ön etiketleme özellikleri sunar.
- Aktif Öğrenmeyi Uygulayın: Bu yaklaşım, en bilgilendirici örnekleri önce etiketlemeye öncelik verir, bu da model performansını korurken gereken toplam etiket sayısını azaltabilir.
- Toplu İşleme: Tutarlılığı korumak ve verimliliği artırmak için benzer görüntüleri etiketleme için gruplandırın.
Bu stratejiler, etiketleme süreci için gereken süreyi ve kaynakları azaltırken yüksek kaliteli etiketleri korumaya yardımcı olabilir.
Link to this sectionDüşüncelerinizi Toplulukla Paylaşın#
Fikirlerinizi ve sorularınızı diğer bilgisayarlı görü meraklılarına danışmak projelerinizi hızlandırmaya yardımcı olabilir. İşte öğrenmek, sorun gidermek ve ağ kurmak için bazı harika yollar:
Link to this sectionNereden Yardım ve Destek Alabilirsiniz#
- GitHub Issues: YOLO26 GitHub deposunu ziyaret edin ve sorular sormak, hataları bildirmek ve özellikler önermek için Issues sekmesini kullanın. Topluluk ve sürdürücüler, karşılaştığınız her türlü sorunda yardımcı olmak için oradalar.
- Ultralytics Discord Sunucusu: Diğer kullanıcılar ve geliştiricilerle bağlantı kurmak, destek almak, bilgi paylaşmak ve fikir alışverişinde bulunmak için Ultralytics Discord sunucusuna katılın.
Link to this sectionResmi Dokümantasyon#
- Ultralytics YOLO26 Dokümantasyonu: Çok sayıda bilgisayarlı görü görevi ve projesi hakkında kapsamlı kılavuzlar ve değerli içgörüler için resmi YOLO26 dokümantasyonuna başvurun.
Link to this sectionSonuç#
Veri toplama ve etiketleme için en iyi uygulamaları takip ederek, önyargıdan kaçınarak ve doğru araç ve teknikleri kullanarak modelinizin performansını önemli ölçüde artırabilirsiniz. Toplulukla etkileşim kurmak ve mevcut kaynakları kullanmak sizi bilgili tutacak ve sorunları etkili bir şekilde gidermenize yardımcı olacaktır. Unutmayın, kaliteli veri başarılı bir projenin temelidir ve doğru stratejiler sağlam ve güvenilir modeller oluşturmanıza yardımcı olacaktır.
Link to this sectionSSS#
Link to this sectionBilgisayarlı görü projeleri için veri toplamada önyargıdan kaçınmanın en iyi yolu nedir?#
Veri toplamada önyargıdan kaçınmak, bilgisayarlı görü modelinizin çeşitli senaryolarda iyi performans göstermesini sağlar. Önyargıyı en aza indirmek için farklı bakış açılarını ve senaryoları yakalamak amacıyla verileri çeşitli kaynaklardan toplamayı düşünün. Farklı yaşlar, cinsiyetler ve etnik kökenler gibi ilgili tüm gruplar arasında dengeli temsil sağlayın. Ortaya çıkan önyargıları belirlemek ve ele almak için veri kümenizi düzenli olarak gözden geçirin ve güncelleyin. Az temsil edilen sınıfları aşırı örnekleme, veri artırma ve adalet odaklı algoritmalar gibi teknikler de önyargıyı azaltmaya yardımcı olabilir. Bu stratejileri kullanarak, modelinizin genelleme yeteneğini artıran sağlam ve adil bir veri kümesini korumuş olursunuz.
Link to this sectionVeri etiketlemede yüksek tutarlılığı ve doğruluğu nasıl sağlayabilirim?#
Veri etiketlemede yüksek tutarlılığı ve doğruluğu sağlamak, net ve objektif etiketleme kılavuzları oluşturmayı içerir. Talimatlarınız, beklentileri netleştirmek için örnekler ve çizimlerle ayrıntılı olmalıdır. Tutarlılık, çeşitli veri türlerini etiketlemek için standart kriterler belirlenerek ve tüm etiketlerin aynı kuralları takip etmesi sağlanarak elde edilir. Kişisel önyargıları azaltmak için etiketleyicileri tarafsız ve objektif kalmaları için eğitin. Etiketleme kurallarının düzenli olarak gözden geçirilmesi ve güncellenmesi, doğruluğu ve proje hedefleriyle uyumu korumaya yardımcı olur. Tutarlılığı kontrol etmek için otomatik araçlar kullanmak ve diğer etiketleyicilerden geri bildirim almak da yüksek kaliteli etiketleri korumaya katkıda bulunur.
Link to this sectionUltralytics YOLO modellerini eğitmek için kaç görüntüye ihtiyacım var?#
Ultralytics YOLO modelleri ile etkili transfer öğrenimi ve nesne algılama için sınıf başına en az birkaç yüz etiketlenmiş nesne ile başlayın. Sadece bir sınıf için eğitim yapıyorsanız, en az 100 etiketlenmiş görüntü ile başlayın ve yaklaşık 100 epoch boyunca eğitin. Daha karmaşık görevler, yüksek güvenilirlik ve performans elde etmek için sınıf başına binlerce görüntü gerektirebilir. Kaliteli etiketler çok önemlidir, bu nedenle veri toplama ve etiketleme süreçlerinizin titiz olduğundan ve projenizin özel hedefleriyle uyumlu olduğundan emin olun. YOLO26 eğitim kılavuzunda ayrıntılı eğitim stratejilerini keşfedin.
Link to this sectionVeri etiketleme için bazı popüler araçlar nelerdir?#
Veri etiketleme sürecini kolaylaştırabilecek birkaç popüler açık kaynaklı araç şunlardır:
- Label Studio: Çeşitli etiketleme görevlerini, proje yönetimini ve kalite kontrol özelliklerini destekleyen esnek bir araç.
- CVAT: Karmaşık projeler için uygun, birden fazla etiketleme biçimi ve özelleştirilebilir iş akışları sunar.
- Labelme: Çokgenlerle hızlı ve basit görüntü etiketleme için idealdir.
- LabelImg: Basit bir arayüzle YOLO formatında sınırlayıcı kutu etiketleri oluşturmak için mükemmeldir.
Bu araçlar, etiketleme iş akışlarınızın verimliliğini ve doğruluğunu artırmaya yardımcı olabilir. Kapsamlı özellik listeleri ve kılavuzlar için veri etiketleme araçları dokümantasyonumuza bakın.
Link to this sectionBilgisayarlı görüde yaygın olarak hangi veri etiketleme türleri kullanılır?#
Farklı veri etiketleme türleri, çeşitli bilgisayarlı görü görevlerine hitap eder:
- Sınırlayıcı Kutular (Bounding Boxes): Öncelikle nesne algılama için kullanılan, bir görüntüdeki nesnelerin etrafındaki dikdörtgen kutulardır.
- Çokgenler (Polygons): Örnek segmentasyonu görevleri için uygun, daha hassas nesne ana hatları sağlar.
- Maskeler: Piksel düzeyinde detay sunar ve semantik segmentasyonda nesneleri arka plandan ayırmak için kullanılır.
- Anahtar Noktalar: Görüntü içindeki belirli ilgi noktalarını tanımlar; poz tahmini ve yüz işareti algılama gibi görevler için kullanışlıdır.
Uygun etiketleme türünü seçmek, projenin gereksinimlerine bağlıdır. Bu etiketlerin nasıl uygulanacağı ve formatları hakkında daha fazla bilgiyi veri etiketleme kılavuzumuzda bulabilirsin.