تخطي إلى المحتوى

مجموعة بيانات ImageWoof

مجموعة بيانات ImageWoof عبارة عن مجموعة فرعية من ImageNet تتكون من 10 فئات يصعب تصنيفها، حيث إنها جميعًا من سلالات الكلاب. تم إنشاؤها كمهمة أكثر صعوبة على خوارزميات تصنيف الصور لحلها، بهدف تشجيع تطوير نماذج أكثر تقدمًا.

الميزات الرئيسية

  • تحتوي ImageWoof على صور لـ 10 سلالات مختلفة من الكلاب: الجحر الأسترالي، وجحر البوردر، والسامويد، والبيغل، وشيه تزو، English كلب صيد الثعالب، وروديسيان ريدجباك، ودينجو، والمسترد الذهبي، وكلب الراعي English القديم.
  • توفر مجموعة البيانات صورًا بدقة مختلفة (بالحجم الكامل، 320 بكسل، 160 بكسل، 160 بكسل)، بما يتناسب مع القدرات الحاسوبية المختلفة والاحتياجات البحثية.
  • ويتضمن أيضًا إصدارًا يحتوي على ملصقات صاخبة، مما يوفر سيناريو أكثر واقعية حيث قد لا تكون الملصقات موثوقة دائمًا.

هيكلية مجموعة البيانات

تستند بنية مجموعة بيانات ImageWoof على فئات سلالات الكلاب، حيث يكون لكل سلالة دليل صور خاص بها.

التطبيقات

تُستخدم مجموعة بيانات ImageWoof على نطاق واسع لتدريب وتقييم نماذج التعلّم العميق في مهام تصنيف الصور، خاصةً عندما يتعلق الأمر بفئات أكثر تعقيداً وتشابهاً. يكمن التحدي الذي تواجهه مجموعة البيانات في الاختلافات الدقيقة بين سلالات الكلاب، مما يدفع حدود أداء النموذج وتعميمه.

الاستخدام

لتدريب نموذج CNN على مجموعة بيانات ImageWoof لـ 100 حقبة تدريبية بحجم صورة 224 × 224، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسائط المتاحة، راجع صفحة تدريب النموذج.

مثال على القطار

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

متغيرات مجموعة البيانات

تأتي مجموعة بيانات ImageWoof بثلاثة أحجام مختلفة لاستيعاب الاحتياجات البحثية والقدرات الحاسوبية المختلفة:

  1. الحجم الكامل (Imagewoof): هذه هي النسخة الأصلية من مجموعة بيانات ImageWoof. تحتوي على صور بالحجم الكامل وهي مثالية للتدريب النهائي وقياس الأداء.

  2. متوسط الحجم (imagewoof320): يحتوي هذا الإصدار على صور تم تغيير حجمها بحيث يكون الحد الأقصى لطول الحافة 320 بكسل. وهو مناسب لتدريب أسرع دون التضحية بأداء النموذج بشكل كبير.

  3. حجم صغير (imagewoof160): يحتوي هذا الإصدار على صور تم تغيير حجمها بحيث يكون الحد الأقصى لطول الحافة 160 بكسل. وهو مصمم للنماذج الأولية والتجارب السريعة حيث تكون سرعة التدريب أولوية.

لاستخدام هذه المتغيرات في تدريبك، ما عليك سوى استبدال "imagewoof" في وسيطة مجموعة البيانات ب "imagewoof320" أو "imagewoof160". على سبيل المثال:

مثال على ذلك

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)
# Load a pretrained model and train on the small-sized dataset
yolo classify train model=yolo11n-cls.pt data=imagewoof320 epochs=100 imgsz=224

من المهم ملاحظة أن استخدام الصور الأصغر حجمًا سيؤدي على الأرجح إلى أداء أقل من حيث دقة التصنيف. ومع ذلك، فهي طريقة ممتازة للتكرار السريع في المراحل المبكرة من تطوير النموذج والنماذج الأولية.

عينة من الصور والتعليقات التوضيحية

تحتوي مجموعة بيانات ImageWoof على صور ملونة لسلالات مختلفة من الكلاب، مما يوفر مجموعة بيانات صعبة لمهام تصنيف الصور. فيما يلي بعض الأمثلة لصور من مجموعة البيانات:

صورة عينة مجموعة البيانات

يعرض هذا المثال الاختلافات الدقيقة وأوجه التشابه بين سلالات الكلاب المختلفة في مجموعة بيانات ImageWoof، مما يسلط الضوء على تعقيد وصعوبة مهمة التصنيف.

الاستشهادات والشكر والتقدير

إذا كنت تستخدم مجموعة بيانات ImageWoof في أعمال البحث أو التطوير الخاصة بك، يرجى التأكد من الإقرار بمنشئي مجموعة البيانات من خلال الارتباط بمستودع مجموعة البيانات الرسمي.

نودّ أن نشكر فريق FastAI على إنشاء مجموعة بيانات ImageWoof وصيانتها كمصدر قيّم لمجتمع أبحاث التعلم الآلي والرؤية الحاسوبية. للمزيد من المعلومات حول مجموعة بيانات ImageWoof، يرجى زيارة مستودع مجموعة بيانات ImageWoof.

الأسئلة الشائعة

ما هي مجموعة بيانات ImageWoof في Ultralytics ؟

مجموعة بيانات ImageWoof عبارة عن مجموعة فرعية صعبة من ImageNet تركز على 10 سلالات محددة من الكلاب. تم إنشاؤها لدفع حدود نماذج تصنيف الصور، وهي تضم سلالات مثل البيجل وشيه تزو والمسترد الذهبي. تشتمل مجموعة البيانات على صور بدقة مختلفة (بالحجم الكامل، 320 بكسل و160 بكسل) وحتى تسميات صاخبة لسيناريوهات تدريب أكثر واقعية. هذا التعقيد يجعل ImageWoof مثاليًا لتطوير نماذج تعلم عميق أكثر تقدمًا.

كيف يمكنني تدريب نموذج باستخدام مجموعة بيانات ImageWoof مع Ultralytics YOLO ؟

لتدريب نموذج الشبكة العصبية التلافيفية (CNN) على مجموعة بيانات ImageWoof باستخدام Ultralytics YOLO لـ 100 حقبة زمنية بحجم صورة 224 × 224، يمكنك استخدام الكود التالي:

مثال على القطار

from ultralytics import YOLO

model = YOLO("yolo11n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

لمزيد من التفاصيل حول وسائط التدريب المتاحة، راجع صفحة التدريب.

ما هي إصدارات مجموعة بيانات ImageWoof المتوفرة؟

تأتي مجموعة بيانات ImageWoof بثلاثة أحجام:

  1. الحجم الكامل (Imagewoof): مثالية للتدريب النهائي والقياس، وتحتوي على صور بالحجم الكامل.
  2. متوسط الحجم (Imagewoof320): صور تم تغيير حجمها بأقصى طول حافة 320 بكسل، وهي مناسبة للتدريب الأسرع.
  3. حجم صغير (imagewoof160): صور تم تغيير حجمها بحد أقصى لطول الحافة يبلغ 160 بكسل، وهي مثالية للنماذج الأولية السريعة.

استخدم هذه الإصدارات عن طريق استبدال "imagewoof" في وسيطة مجموعة البيانات وفقًا لذلك. لاحظ، مع ذلك، أن الصور الأصغر حجمًا قد تؤدي إلى دقة تصنيف أقل ولكن يمكن أن تكون مفيدة في التكرارات الأسرع.

كيف تستفيد التسميات المشوشة في مجموعة بيانات ImageWoof من التدريب؟

تحاكي التسميات الصاخبة في مجموعة بيانات ImageWoof ظروف العالم الحقيقي حيث قد لا تكون التسميات دقيقة دائمًا. تساعد نماذج التدريب باستخدام هذه البيانات على تطوير المتانة والتعميم في مهام تصنيف الصور. هذا يهيئ النماذج للتعامل مع البيانات الغامضة أو ذات التسميات الخاطئة بشكل فعال، والتي غالبًا ما تتم مواجهتها في التطبيقات العملية.

ما هي التحديات الرئيسية لاستخدام مجموعة بيانات ImageWoof؟

يكمن التحدي الأساسي في مجموعة بيانات ImageWoof في الاختلافات الدقيقة بين سلالات الكلاب التي تتضمنها. ونظراً لأنها تركز على 10 سلالات متقاربة، فإن التمييز بينها يتطلب نماذج تصنيف صور أكثر تقدماً ودقة. وهذا يجعل من ImageWoof معياراً ممتازاً لاختبار قدرات وتحسينات نماذج التعلم العميق.

📅 تم إنشاؤها منذ 1 سنة مضت ✏️ تم التحديث منذ 3 أشهر

التعليقات