مجموعة بيانات ImageNet10
مجموعة بيانات ImageNet10 عبارة عن مجموعة فرعية صغيرة الحجم من قاعدة بيانات ImageNet، تم تطويرها بواسطة Ultralytics وهي مصممة لاختبارات CI، وفحوصات التعقّل، والاختبار السريع لخطوط أنابيب التدريب. تتكون مجموعة البيانات هذه من الصورة الأولى في مجموعة التدريب والصورة الأولى من مجموعة التحقق من صحة أول 10 فئات في ImageNet. على الرغم من أنها أصغر بكثير، إلا أنها تحتفظ ببنية وتنوع مجموعة بيانات ImageNet الأصلية.
الميزات الرئيسية
- ImageNet10 هي نسخة مدمجة من ImageNet، تضم 20 صورة تمثل أول 10 فئات من مجموعة البيانات الأصلية.
- تم تنظيم مجموعة البيانات وفقًا للتسلسل الهرمي لشبكة WordNet، مما يعكس بنية مجموعة بيانات ImageNet الكاملة.
- وهو مناسب بشكل مثالي لاختبارات CI، وفحوصات التعقُّل، والاختبار السريع لخطوط أنابيب التدريب في مهام الرؤية الحاسوبية.
- على الرغم من أنه ليس مصممًا لقياس أداء النموذج، إلا أنه يمكن أن يوفر مؤشرًا سريعًا على الوظائف الأساسية للنموذج وصحته.
هيكلية مجموعة البيانات
يتم تنظيم مجموعة بيانات ImageNet10، مثل ImageNet الأصلية، باستخدام التسلسل الهرمي ل WordNet. يتم وصف كل فئة من الفئات العشرة في ImageNet10 من خلال مجموعة مترادفات (مجموعة من المصطلحات المترادفة). يتم شرح الصور في ImageNet10 بمجموعة مترادفات واحدة أو أكثر، مما يوفر موردًا مضغوطًا لاختبار النماذج للتعرف على الكائنات المختلفة وعلاقاتها.
التطبيقات
تُعد مجموعة بيانات ImageNet10 مفيدة لاختبار نماذج الرؤية الحاسوبية وخطوط الأنابيب وتصحيحها بسرعة. يسمح صغر حجمها بالتكرار السريع، مما يجعلها مثالية لاختبارات التكامل المستمر وفحوصات التعقل. كما يمكن استخدامه أيضًا للاختبار الأولي السريع للنماذج الجديدة أو التغييرات على النماذج الحالية قبل الانتقال إلى الاختبار على نطاق واسع مع مجموعة بيانات ImageNet الكاملة.
الاستخدام
لاختبار نموذج التعلّم العميق على مجموعة بيانات ImageNet10 بحجم صورة 224x224، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسائط المتاحة، راجع صفحة تدريب النموذج.
مثال للاختبار
عينة من الصور والتعليقات التوضيحية
تحتوي مجموعة بيانات ImageNet10 على مجموعة فرعية من الصور من مجموعة بيانات ImageNet الأصلية. تم اختيار هذه الصور لتمثيل أول 10 فئات في مجموعة البيانات، مما يوفر مجموعة بيانات متنوعة وصغيرة الحجم للاختبار والتقييم السريع.
يعرض هذا المثال تنوع الصور وتعقيدها في مجموعة بيانات ImageNet10، مما يسلط الضوء على فائدتها في التحقق من سلامة الصور واختبار نماذج الرؤية الحاسوبية بسرعة.
الاستشهادات والشكر والتقدير
إذا كنت تستخدم مجموعة بيانات ImageNet10 في عملك البحثي أو التطويري، يُرجى الاستشهاد بورقة ImageNet الأصلية:
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}
نود أن نعرب عن تقديرنا لفريق ImageNet، بقيادة أولغا روساكوفسكي وجيا دينغ ولي فاي-فاي، لإنشاء مجموعة بيانات ImageNet وصيانتها. على الرغم من أن مجموعة بيانات ImageNet10 هي مجموعة فرعية مضغوطة، إلا أنها مورد قيّم للاختبار السريع وتصحيح الأخطاء في مجتمع أبحاث التعلم الآلي والرؤية الحاسوبية. لمزيد من المعلومات حول مجموعة بيانات ImageNet ومنشئيها، يرجى زيارة موقع ImageNet على الويب.
الأسئلة الشائعة
ما هي مجموعة بيانات ImageNet10 وكيف تختلف عن مجموعة بيانات ImageNet الكاملة؟
مجموعة بيانات ImageNet10 عبارة عن مجموعة فرعية مدمجة من قاعدة بيانات ImageNet الأصلية، تم إنشاؤها بواسطة Ultralytics لإجراء اختبارات سريعة للمعلوماتية وفحوصات الصحة وتقييمات خط أنابيب التدريب. تضم ImageNet10 20 صورة فقط، تمثل الصورة الأولى في مجموعات التدريب والتحقق من صحة أول 10 فئات في ImageNet. على الرغم من صغر حجمها، إلا أنها تحافظ على بنية وتنوع مجموعة البيانات الكاملة، مما يجعلها مثالية للاختبار السريع ولكن ليس لقياس النماذج.
كيف يمكنني استخدام مجموعة بيانات ImageNet10 لاختبار نموذج التعلم العميق الخاص بي؟
لاختبار نموذج التعلّم العميق الخاص بك على مجموعة بيانات ImageNet10 بحجم صورة 224x224، استخدم مقتطفات التعليمات البرمجية التالية.
مثال للاختبار
راجع صفحة التدريب للحصول على قائمة شاملة بالوسائط المتاحة.
لماذا يجب أن أستخدم مجموعة بيانات ImageNet10 لاختبارات CI وفحوصات التعقل؟
صُمِّمت مجموعة بيانات ImageNet10 خصيصًا لاختبارات التكامل المستمر، وفحوصات التعقّل، والتقييمات السريعة في خطوط أنابيب التعلّم العميق. يسمح صغر حجمها بالتكرار والاختبار السريع، مما يجعلها مثالية لعمليات التكامل المستمر حيث تكون السرعة أمرًا بالغ الأهمية. من خلال الحفاظ على التعقيد الهيكلي والتنوع في مجموعة بيانات ImageNet الأصلية، توفر ImageNet10 مؤشرًا موثوقًا للوظائف الأساسية للنموذج وصحته دون الحاجة إلى معالجة مجموعة بيانات كبيرة.
ما هي الميزات الرئيسية لمجموعة بيانات ImageNet10؟
تحتوي مجموعة بيانات ImageNet10 على العديد من الميزات الرئيسية:
- حجم صغير: مع 20 صورة فقط، يسمح بالاختبار والتصحيح السريع.
- التنظيم الهيكلي: يتبع التسلسل الهرمي ل WordNet، على غرار مجموعة بيانات ImageNet الكاملة.
- اختبارات التكامل المستمر وفحوصات التعقل: مناسب بشكل مثالي لاختبارات التكامل المستمر وفحوصات التعقل.
- ليس للمقارنة المعيارية: في حين أنه مفيد لتقييمات النماذج السريعة، إلا أنه غير مصمم للمقارنة المعيارية الشاملة.
أين يمكنني تنزيل مجموعة بيانات ImageNet10؟
يمكنك تنزيل مجموعة بيانات ImageNet10 من صفحة إصدارات GitHub Ultralytics . لمزيد من المعلومات التفصيلية حول بنيتها وتطبيقاتها، راجع صفحة مجموعة بيانات ImageNet10.