انتقل إلى المحتوى

مجموعة بيانات ImageWoof

مجموعة بيانات ImageWoof هي مجموعة فرعية من ImageNet تتكون من 10 فئات يصعب تصنيفها ، نظرا لأنها كلها سلالات. تم إنشاؤه كمهمة أكثر صعوبة لحلها لخوارزميات تصنيف الصور ، بهدف تشجيع تطوير نماذج أكثر تقدما.

الميزات الرئيسية

  • يحتوي ImageWoof على صور ل 10 سلالات مختلفة من: جحر أسترالي ، جحر الحدود ، Samoyed ، Beagle ، Shih-Tzu ، English foxhound ، روديسيا، ريدجباك روديسي، دينغو، المسترد الذهبي، والقديم English الراعي.
  • توفر مجموعة البيانات صورا بدقة مختلفة (الحجم الكامل ، 320 بكسل ، 160 بكسل) ، تستوعب القدرات الحسابية المختلفة والاحتياجات البحثية.
  • يتضمن أيضا إصدارا به ملصقات صاخبة ، مما يوفر سيناريو أكثر واقعية حيث قد لا تكون الملصقات موثوقة دائما.

هيكل مجموعة البيانات

يعتمد هيكل مجموعة بيانات ImageWoof على فئات سلالات ، حيث يكون لكل سلالة دليل الصور الخاص بها.

التطبيقات

تستخدم مجموعة بيانات ImageWoof على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام تصنيف الصور ، خاصة عندما يتعلق الأمر بفئات أكثر تعقيدا ومتشابهة. يكمن التحدي الذي تواجهه مجموعة البيانات في الاختلافات الدقيقة بين سلالات ، مما يدفع حدود أداء النموذج وتعميمه.

استخدام

لتدريب نموذج CNN على مجموعة بيانات ImageWoof ل 100 حقبة بحجم صورة 224 × 224 ، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة نموذج التدريب .

مثال القطار

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

متغيرات مجموعة البيانات

تأتي مجموعة بيانات ImageWoof بثلاثة أحجام مختلفة لاستيعاب الاحتياجات البحثية المختلفة والقدرات الحسابية:

  1. الحجم الكامل (imagewoof): هذه هي النسخة الأصلية من مجموعة بيانات ImageWoof. يحتوي على صور كاملة الحجم وهو مثالي للتدريب النهائي وقياس الأداء.

  2. الحجم المتوسط (imagewoof320): يحتوي هذا الإصدار على صور تم تغيير حجمها ليبلغ الحد الأقصى لطول الحافة 320 بكسل. إنه مناسب للتدريب بشكل أسرع دون التضحية بشكل كبير بأداء النموذج.

  3. حجم صغير (imagewoof160): يحتوي هذا الإصدار على صور تم تغيير حجمها ليبلغ الحد الأقصى لطول الحافة 160 بكسل. إنه مصمم للنماذج الأولية السريعة والتجريب حيث تكون سرعة التدريب أولوية.

لاستخدام هذه المتغيرات في تدريبك ، ما عليك سوى استبدال "imagewoof" في وسيطة مجموعة البيانات ب "imagewoof320" أو "imagewoof160". على سبيل المثال:

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

من المهم ملاحظة أن استخدام صور أصغر من المحتمل أن يؤدي إلى أداء أقل من حيث دقة التصنيف. ومع ذلك ، فهي طريقة ممتازة للتكرار بسرعة في المراحل المبكرة من تطوير النموذج والنماذج الأولية.

عينة من الصور والتعليقات التوضيحية

تحتوي مجموعة بيانات ImageWoof على صور ملونة لسلالات المختلفة ، مما يوفر مجموعة بيانات صعبة لمهام تصنيف الصور. فيما يلي بعض الأمثلة على الصور من مجموعة البيانات:

صورة عينة مجموعة البيانات

يعرض المثال الاختلافات الدقيقة والتشابهات بين سلالات المختلفة في مجموعة بيانات ImageWoof ، مما يسلط الضوء على تعقيد وصعوبة مهمة التصنيف.

الاستشهادات والشكر

إذا كنت تستخدم مجموعة بيانات ImageWoof في أعمال البحث أو التطوير الخاصة بك ، فيرجى التأكد من الاعتراف بمنشئي مجموعة البيانات من خلال الارتباط بمستودع مجموعة البيانات الرسمي.

نود أن نعرب عن تقديرنا لفريق FastAI لإنشاء مجموعة بيانات ImageWoof وصيانتها كمورد قيم لمجتمع أبحاث التعلم الآلي ورؤية الكمبيوتر. لمزيد من المعلومات حول مجموعة بيانات ImageWoof، تفضل بزيارة مستودع مجموعة بيانات ImageWoof.



تم الإنشاء 2023-11-12-2023، تم التحديث 2024-05-18
المؤلفون: جلين-جوتشر (4)

التعليقات