انتقل إلى المحتوى

مجموعة بيانات ImageWoof

مجموعة بيانات ImageWoof هي مجموعة فرعية من ImageNet تتكون من 10 فئات يصعب تصنيفها ، نظرا لأنها كلها سلالات. تم إنشاؤه كمهمة أكثر صعوبة لحلها لخوارزميات تصنيف الصور ، بهدف تشجيع تطوير نماذج أكثر تقدما.

الميزات الرئيسية

  • يحتوي ImageWoof على صور ل 10 سلالات مختلفة من: جحر أسترالي ، جحر الحدود ، Samoyed ، Beagle ، Shih-Tzu ، English foxhound ، روديسيا، ريدجباك روديسي، دينغو، المسترد الذهبي، والقديم English الراعي.
  • توفر مجموعة البيانات صورا بدقة مختلفة (الحجم الكامل ، 320 بكسل ، 160 بكسل) ، تستوعب القدرات الحسابية المختلفة والاحتياجات البحثية.
  • يتضمن أيضا إصدارا به ملصقات صاخبة ، مما يوفر سيناريو أكثر واقعية حيث قد لا تكون الملصقات موثوقة دائما.

هيكل مجموعة البيانات

يعتمد هيكل مجموعة بيانات ImageWoof على فئات سلالات ، حيث يكون لكل سلالة دليل الصور الخاص بها.

التطبيقات

تستخدم مجموعة بيانات ImageWoof على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام تصنيف الصور ، خاصة عندما يتعلق الأمر بفئات أكثر تعقيدا ومتشابهة. يكمن التحدي الذي تواجهه مجموعة البيانات في الاختلافات الدقيقة بين سلالات ، مما يدفع حدود أداء النموذج وتعميمه.

استخدام

لتدريب نموذج CNN على مجموعة بيانات ImageWoof ل 100 حقبة بحجم صورة 224 × 224 ، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة نموذج التدريب .

مثال القطار

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

متغيرات مجموعة البيانات

تأتي مجموعة بيانات ImageWoof بثلاثة أحجام مختلفة لاستيعاب الاحتياجات البحثية المختلفة والقدرات الحسابية:

  1. الحجم الكامل (imagewoof): هذه هي النسخة الأصلية من مجموعة بيانات ImageWoof. يحتوي على صور كاملة الحجم وهو مثالي للتدريب النهائي وقياس الأداء.

  2. الحجم المتوسط (imagewoof320): يحتوي هذا الإصدار على صور تم تغيير حجمها ليبلغ الحد الأقصى لطول الحافة 320 بكسل. إنه مناسب للتدريب بشكل أسرع دون التضحية بشكل كبير بأداء النموذج.

  3. حجم صغير (imagewoof160): يحتوي هذا الإصدار على صور تم تغيير حجمها ليبلغ الحد الأقصى لطول الحافة 160 بكسل. إنه مصمم للنماذج الأولية السريعة والتجريب حيث تكون سرعة التدريب أولوية.

لاستخدام هذه المتغيرات في تدريبك ، ما عليك سوى استبدال "imagewoof" في وسيطة مجموعة البيانات ب "imagewoof320" أو "imagewoof160". على سبيل المثال:

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

من المهم ملاحظة أن استخدام صور أصغر من المحتمل أن يؤدي إلى أداء أقل من حيث دقة التصنيف. ومع ذلك ، فهي طريقة ممتازة للتكرار بسرعة في المراحل المبكرة من تطوير النموذج والنماذج الأولية.

عينة من الصور والتعليقات التوضيحية

تحتوي مجموعة بيانات ImageWoof على صور ملونة لسلالات المختلفة ، مما يوفر مجموعة بيانات صعبة لمهام تصنيف الصور. فيما يلي بعض الأمثلة على الصور من مجموعة البيانات:

صورة عينة مجموعة البيانات

يعرض المثال الاختلافات الدقيقة والتشابهات بين سلالات المختلفة في مجموعة بيانات ImageWoof ، مما يسلط الضوء على تعقيد وصعوبة مهمة التصنيف.

الاستشهادات والشكر

إذا كنت تستخدم مجموعة بيانات ImageWoof في أعمال البحث أو التطوير الخاصة بك ، فيرجى التأكد من الاعتراف بمنشئي مجموعة البيانات من خلال الارتباط بمستودع مجموعة البيانات الرسمي.

نود أن نعرب عن تقديرنا لفريق FastAI لإنشاء مجموعة بيانات ImageWoof وصيانتها كمورد قيم لمجتمع أبحاث التعلم الآلي ورؤية الكمبيوتر. لمزيد من المعلومات حول مجموعة بيانات ImageWoof، تفضل بزيارة مستودع مجموعة بيانات ImageWoof.

الأسئلة المتداولة

ما هي مجموعة بيانات ImageWoof في Ultralytics ؟

مجموعة بيانات ImageWoof عبارة عن مجموعة فرعية صعبة من ImageNet تركز على 10 سلالات محددة من الكلاب. تم إنشاؤها لدفع حدود نماذج تصنيف الصور، وهي تضم سلالات مثل البيجل وشيه تزو والمسترد الذهبي. تشتمل مجموعة البيانات على صور بدقة مختلفة (بالحجم الكامل، 320 بكسل و160 بكسل) وحتى تسميات صاخبة لسيناريوهات تدريب أكثر واقعية. هذا التعقيد يجعل ImageWoof مثاليًا لتطوير نماذج تعلم عميق أكثر تقدمًا.

كيف يمكنني تدريب نموذج باستخدام مجموعة بيانات ImageWoof مع Ultralytics YOLO ؟

لتدريب نموذج الشبكة العصبية التلافيفية (CNN) على مجموعة بيانات ImageWoof باستخدام Ultralytics YOLO لـ 100 حقبة زمنية بحجم صورة 224 × 224، يمكنك استخدام الكود التالي:

مثال القطار

from ultralytics import YOLO

model = YOLO("yolov8n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

لمزيد من التفاصيل حول وسائط التدريب المتاحة، راجع صفحة التدريب.

ما هي إصدارات مجموعة بيانات ImageWoof المتوفرة؟

تأتي مجموعة بيانات ImageWoof بثلاثة أحجام:

  1. الحجم الكامل (Imagewoof): مثالية للتدريب النهائي والقياس، وتحتوي على صور بالحجم الكامل.
  2. متوسط الحجم (Imagewoof320): صور تم تغيير حجمها بأقصى طول حافة 320 بكسل، وهي مناسبة للتدريب الأسرع.
  3. حجم صغير (imagewoof160): صور تم تغيير حجمها بحد أقصى لطول الحافة يبلغ 160 بكسل، وهي مثالية للنماذج الأولية السريعة.

استخدم هذه الإصدارات عن طريق استبدال "imagewoof" في وسيطة مجموعة البيانات وفقًا لذلك. لاحظ، مع ذلك، أن الصور الأصغر حجمًا قد تؤدي إلى دقة تصنيف أقل ولكن يمكن أن تكون مفيدة في التكرارات الأسرع.

كيف تستفيد التسميات المشوشة في مجموعة بيانات ImageWoof من التدريب؟

تحاكي التسميات الصاخبة في مجموعة بيانات ImageWoof ظروف العالم الحقيقي حيث قد لا تكون التسميات دقيقة دائمًا. تساعد نماذج التدريب باستخدام هذه البيانات على تطوير المتانة والتعميم في مهام تصنيف الصور. هذا يهيئ النماذج للتعامل مع البيانات الغامضة أو ذات التسميات الخاطئة بشكل فعال، والتي غالبًا ما تتم مواجهتها في التطبيقات العملية.

ما هي التحديات الرئيسية لاستخدام مجموعة بيانات ImageWoof؟

يكمن التحدي الأساسي في مجموعة بيانات ImageWoof في الاختلافات الدقيقة بين سلالات الكلاب التي تتضمنها. ونظراً لأنها تركز على 10 سلالات متقاربة، فإن التمييز بينها يتطلب نماذج تصنيف صور أكثر تقدماً ودقة. وهذا يجعل من ImageWoof معياراً ممتازاً لاختبار قدرات وتحسينات نماذج التعلم العميق.



تم الإنشاء 2023-11-12-2023، تم التحديث 2024-07-04-2024
المؤلفون: جلين-جوتشر (6)

التعليقات