مجموعة بيانات ImageWoof
مجموعة بيانات ImageWoof هي مجموعة فرعية من ImageNet تتكون من 10 فئات يصعب تصنيفها، نظرًا لأنها جميعها سلالات كلاب. تم إنشاؤها كمهارة أكثر صعوبة لخوارزميات تصنيف الصور لحلها، بهدف تشجيع تطوير نماذج أكثر تقدمًا.
الميزات الرئيسية
- تحتوي ImageWoof على صور لـ 10 سلالات مختلفة من الكلاب: تيريير أسترالي، تيريير بوردر، سامويد، بيغل، شيه تزو، كلب صيد الثعالب الإنجليزي، روديسيان ريدجباك، دينغو، جولدن ريتريفر، وكلب الراعي الإنجليزي القديم.
- توفر مجموعة البيانات صورًا بدقة مختلفة (الحجم الكامل، 320 بكسل، 160 بكسل)، مما يلبي احتياجات الحوسبة المختلفة ومتطلبات البحث.
- تتضمن أيضًا نسخة ذات تصنيفات ضجيج (noisy labels)، مما يوفر سيناريو أكثر واقعية حيث قد لا تكون التصنيفات دقيقة دائمًا.
هيكل مجموعة البيانات
يعتمد هيكل مجموعة بيانات ImageWoof على فئات سلالات الكلاب، حيث تمتلك كل سلالة دليلها الخاص من الصور. وعلى غرار مجموعات بيانات التصنيف الأخرى، فهي تتبع تنسيق تقسيم المجلدات مع وجود مجلدات منفصلة لمجموعات التدريب والتحقق.
التطبيقات
تُستخدم مجموعة بيانات ImageWoof على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام تصنيف الصور، خاصة عندما يتعلق الأمر بالفئات الأكثر تعقيدًا وتشابهًا. تكمن صعوبة مجموعة البيانات في الاختلافات الدقيقة بين سلالات الكلاب، مما يدفع حدود أداء النموذج والتعميم. وهي ذات قيمة خاصة لـ:
- قياس أداء نموذج التصنيف على فئات دقيقة
- اختبار متانة النموذج ضد الفئات المتشابهة في المظهر
- تطوير خوارزميات يمكنها تمييز الاختلافات البصرية الدقيقة
- تقييم قدرات التعلم بنقل المعرفة من المجالات العامة إلى المحددة
الاستخدام
لتدريب نموذج CNN على مجموعة بيانات ImageWoof لمدة 100 حقبة بحجم صورة 224x224، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، راجع صفحة التدريب الخاصة بالنموذج.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)متغيرات مجموعة البيانات
تأتي مجموعة بيانات ImageWoof بثلاثة أحجام مختلفة لتلائم احتياجات البحث المتنوعة والقدرات الحوسبية:
-
الحجم الكامل (imagewoof): هذا هو الإصدار الأصلي من مجموعة بيانات ImageWoof. يحتوي على صور بالحجم الكامل وهو مثالي للتدريب النهائي وقياس الأداء.
-
الحجم المتوسط (imagewoof320): يحتوي هذا الإصدار على صور تم تغيير حجمها لتكون ذات طول حافة أقصى يبلغ 320 بكسل. إنه مناسب لتدريب أسرع دون التضحية بشكل كبير بأداء النموذج.
-
الحجم الصغير (imagewoof160): يحتوي هذا الإصدار على صور تم تغيير حجمها لتكون ذات طول حافة أقصى يبلغ 160 بكسل. إنه مصمم للنماذج الأولية السريعة والتجارب حيث تكون سرعة التدريب أولوية.
لاستخدام هذه المتغيرات في تدريبك، ما عليك سوى استبدال 'imagewoof' في وسيطة مجموعة البيانات بـ 'imagewoof320' أو 'imagewoof160'. على سبيل المثال:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)
# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)من المهم ملاحظة أن استخدام صور أصغر سيؤدي على الأرجح إلى أداء أقل من حيث دقة التصنيف. ومع ذلك، فهي طريقة ممتازة للتكرار بسرعة في المراحل المبكرة من تطوير النموذج والنماذج الأولية.
صور وعينات تعليقات توضيحية
تحتوي مجموعة بيانات ImageWoof على صور ملونة لسلالات مختلفة من الكلاب، مما يوفر مجموعة بيانات صعبة لمهام تصنيف الصور. إليك بعض الأمثلة للصور من مجموعة البيانات:

يعرض المثال الاختلافات والتشابهات الدقيقة بين سلالات الكلاب المختلفة في مجموعة بيانات ImageWoof، مما يسلط الضوء على تعقيد وصعوبة مهمة التصنيف.
الاقتباسات والشكر
إذا كنت تستخدم مجموعة بيانات ImageWoof في عملك البحثي أو التطويري، فيرجى التأكد من الإشارة إلى منشئي مجموعة البيانات من خلال الرابط المؤدي إلى مستودع مجموعة البيانات الرسمي.
نود أن نشكر فريق FastAI لإنشاء وصيانة مجموعة بيانات ImageWoof كمورد قيم لمجتمع أبحاث التعلم الآلي ورؤية الكمبيوتر. لمزيد من المعلومات حول مجموعة بيانات ImageWoof، تفضل بزيارة مستودع مجموعة بيانات ImageWoof.
الأسئلة الشائعة
ما هي مجموعة بيانات ImageWoof في Ultralytics؟
مجموعة بيانات ImageWoof هي مجموعة فرعية صعبة من ImageNet تركز على 10 سلالات محددة من الكلاب. تم إنشاؤها لدفع حدود نماذج تصنيف الصور، وهي تتميز بسلالات مثل بيغل، شيه تزو، وجولدن ريتريفر. تتضمن مجموعة البيانات صورًا بدقة مختلفة (الحجم الكامل، 320 بكسل، 160 بكسل) وحتى تصنيفات ضجيج لسيناريوهات تدريب أكثر واقعية. هذا التعقيد يجعل ImageWoof مثالية لتطوير نماذج تعلم عميق أكثر تقدمًا.
كيف يمكنني تدريب نموذج باستخدام مجموعة بيانات ImageWoof مع Ultralytics YOLO؟
لتدريب نموذج شبكة عصبية تلافيفية (CNN) على مجموعة بيانات ImageWoof باستخدام Ultralytics YOLO لمدة 100 حقبة وبحجم صورة 224x224، يمكنك استخدام الكود التالي:
from ultralytics import YOLO
model = YOLO("yolo26n-cls.pt") # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)لمزيد من التفاصيل حول وسيطات التدريب المتاحة، راجع صفحة التدريب.
ما هي إصدارات مجموعة بيانات ImageWoof المتاحة؟
تأتي مجموعة بيانات ImageWoof بثلاثة أحجام:
- الحجم الكامل (imagewoof): مثالي للتدريب النهائي وقياس الأداء، ويحتوي على صور بالحجم الكامل.
- الحجم المتوسط (imagewoof320): صور تم تغيير حجمها بحيث يكون طول الحافة الأقصى 320 بكسل، وهي مناسبة لتدريب أسرع.
- الحجم الصغير (imagewoof160): صور تم تغيير حجمها بحيث يكون طول الحافة الأقصى 160 بكسل، وهي مثالية للنماذج الأولية السريعة.
استخدم هذه الإصدارات عن طريق استبدال 'imagewoof' في وسيطة مجموعة البيانات وفقًا لذلك. لاحظ، مع ذلك، أن الصور الأصغر قد تؤدي إلى دقة تصنيف أقل ولكنها يمكن أن تكون مفيدة للتكرارات الأسرع.
كيف تفيد تصنيفات الضجيج في مجموعة بيانات ImageWoof عملية التدريب؟
تحاكي تصنيفات الضجيج في مجموعة بيانات ImageWoof ظروف العالم الحقيقي حيث قد لا تكون التصنيفات دقيقة دائمًا. يساعد تدريب النماذج بهذه البيانات في تطوير المتانة والتعميم في مهام تصنيف الصور. هذا يهيئ النماذج للتعامل بفعالية مع البيانات الغامضة أو المصنفة بشكل خاطئ، وهو أمر غالبًا ما يتم مواجهته في التطبيقات العملية.
ما هي التحديات الرئيسية لاستخدام مجموعة بيانات ImageWoof؟
يكمن التحدي الرئيسي لمجموعة بيانات ImageWoof في الاختلافات الدقيقة بين سلالات الكلاب التي تتضمنها. نظرًا لأنها تركز على 10 سلالات وثيقة الصلة، فإن التمييز بينها يتطلب نماذج تصنيف صور أكثر تقدمًا وضبطًا دقيقًا. وهذا يجعل ImageWoof معيارًا ممتازًا لاختبار قدرات وتحسينات نماذج التعلم العميق.