مجموعة بيانات ImageNet10
تعد مجموعة بيانات ImageNet10 مجموعة فرعية صغيرة الحجم من قاعدة بيانات ImageNet، طورتها Ultralytics ومصممة لاختبارات CI، وفحوصات السلامة، والاختبار السريع لخطوط أنابيب التدريب. تتكون مجموعة البيانات هذه من الصورة الأولى في مجموعة التدريب والصورة الأولى من مجموعة التحقق لأول 10 فئات في ImageNet. وعلى الرغم من كونها أصغر بكثير، إلا أنها تحتفظ ببنية وتنوع مجموعة بيانات ImageNet الأصلية.
الميزات الرئيسية
- ImageNet10 هي نسخة مضغوطة من ImageNet، تحتوي على 20 صورة تمثل أول 10 فئات من مجموعة البيانات الأصلية.
- تم تنظيم مجموعة البيانات وفقًا لتسلسل WordNet الهرمي، مما يعكس بنية مجموعة بيانات ImageNet الكاملة.
- إنها مناسبة تماماً لاختبارات CI، وفحوصات السلامة، والاختبار السريع لخطوط أنابيب التدريب في مهام الرؤية الحاسوبية.
- على الرغم من أنها ليست مصممة لقياس أداء النماذج، إلا أنها يمكن أن توفر مؤشراً سريعاً على الوظائف الأساسية للنموذج وصحته.
هيكل مجموعة البيانات
يتم تنظيم مجموعة بيانات ImageNet10، مثل ImageNet الأصلية، باستخدام تسلسل WordNet الهرمي. يتم وصف كل فئة من الفئات العشر في ImageNet10 بواسطة مجموعة مرادفات (synset) (مجموعة من المصطلحات المترادفة). يتم تدوين الصور في ImageNet10 باستخدام مجموعة واحدة أو أكثر من مجموعات المرادفات، مما يوفر مورداً مضغوطاً لاختبار النماذج للتعرف على مختلف الكائنات وعلاقاتها.
التطبيقات
تعد مجموعة بيانات ImageNet10 مفيدة لاختبار وتصحيح نماذج وخطوط أنابيب الرؤية الحاسوبية بسرعة. يسمح حجمها الصغير بالتكرار السريع، مما يجعلها مثالية لاختبارات التكامل المستمر (CI) وفحوصات السلامة. يمكن استخدامها أيضاً للاختبار الأولي السريع للنماذج الجديدة أو التغييرات على النماذج الحالية قبل الانتقال إلى الاختبار الكامل باستخدام مجموعة بيانات ImageNet الكاملة.
الاستخدام
لاختبار نموذج تعلم عميق على مجموعة بيانات ImageNet10 بحجم صورة 224x224، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة تدريب النموذج.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)صور وعينات تعليقات توضيحية
تحتوي مجموعة بيانات ImageNet10 على مجموعة فرعية من الصور من مجموعة بيانات ImageNet الأصلية. يتم اختيار هذه الصور لتمثيل أول 10 فئات في مجموعة البيانات، مما يوفر مجموعة بيانات متنوعة ومدمجة للاختبار والتقييم السريع.

يعرض المثال تنوع وتعقيد الصور في مجموعة بيانات ImageNet10، مما يسلط الضوء على فائدتها لفحوصات السلامة والاختبار السريع لنماذج الرؤية الحاسوبية.
الاقتباسات والشكر
إذا كنت تستخدم مجموعة بيانات ImageNet10 في بحثك أو عملك التطويري، فيرجى الاستشهاد بورقة ImageNet الأصلية:
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}نود أن نعرب عن تقديرنا لفريق ImageNet، بقيادة أولغا روساكوفسكي، وجيا دينغ، ولي في-في، لإنشاء وصيانة مجموعة بيانات ImageNet. تعد مجموعة بيانات ImageNet10، على الرغم من كونها مجموعة فرعية مضغوطة، مورداً قيماً للاختبار والتصحيح السريع في مجتمع أبحاث التعلم الآلي والرؤية الحاسوبية. لمزيد من المعلومات حول مجموعة بيانات ImageNet ومبتكريها، تفضل بزيارة موقع ImageNet الإلكتروني.
الأسئلة الشائعة
ما هي مجموعة بيانات ImageNet10 وكيف تختلف عن مجموعة بيانات ImageNet الكاملة؟
مجموعة بيانات ImageNet10 هي مجموعة فرعية مضغوطة من قاعدة بيانات ImageNet الأصلية، أنشأتها Ultralytics لاختبارات CI السريعة، وفحوصات السلامة، وتقييمات خطوط أنابيب التدريب. تتكون ImageNet10 من 20 صورة فقط، تمثل الصورة الأولى في مجموعات التدريب والتحقق لأول 10 فئات في ImageNet. على الرغم من صغر حجمها، فإنها تحافظ على بنية وتنوع مجموعة البيانات الكاملة، مما يجعلها مثالية للاختبار السريع ولكن ليس لقياس أداء النماذج.
كيف يمكنني استخدام مجموعة بيانات ImageNet10 لاختبار نموذج التعلم العميق الخاص بي؟
لاختبار نموذج التعلم العميق الخاص بك على مجموعة بيانات ImageNet10 بحجم صورة 224x224، استخدم مقتطفات الكود التالية.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)راجع صفحة التدريب للحصول على قائمة شاملة بالوسائط المتاحة.
لماذا يجب علي استخدام مجموعة بيانات ImageNet10 لاختبارات CI وفحوصات السلامة؟
تم تصميم مجموعة بيانات ImageNet10 خصيصاً لاختبارات CI، وفحوصات السلامة، والتقييمات السريعة في خطوط أنابيب التعلم العميق. يسمح حجمها الصغير بالتكرار والاختبار السريع، مما يجعلها مثالية لعمليات التكامل المستمر حيث تكون السرعة أمراً حاسماً. من خلال الحفاظ على التعقيد الهيكلي وتنوع مجموعة بيانات ImageNet الأصلية، توفر ImageNet10 مؤشراً موثوقاً على الوظائف الأساسية للنموذج وصحته دون الحاجة إلى معالجة مجموعة بيانات كبيرة.
ما هي الميزات الرئيسية لمجموعة بيانات ImageNet10؟
تحتوي مجموعة بيانات ImageNet10 على العديد من الميزات الرئيسية:
- حجم مضغوط: بوجود 20 صورة فقط، فإنها تسمح بالاختبار والتصحيح السريع.
- تنظيم هيكلي: تتبع تسلسل WordNet الهرمي، على غرار مجموعة بيانات ImageNet الكاملة.
- اختبارات CI وفحوصات السلامة: مناسبة تماماً لاختبارات التكامل المستمر وفحوصات السلامة.
- ليست لقياس الأداء: على الرغم من فائدتها للتقييمات السريعة للنماذج، إلا أنها ليست مصممة لقياس الأداء على نطاق واسع.
كيف تقارن ImageNet10 بمجموعات البيانات الصغيرة الأخرى مثل ImageNette؟
بينما تعتبر كل من ImageNet10 وImageNette مجموعات فرعية من ImageNet، إلا أنهما تخدمان أغراضاً مختلفة. تحتوي ImageNet10 على 20 صورة فقط (صورتان لكل فئة) من أول 10 فئات في ImageNet، مما يجعلها خفيفة للغاية لاختبارات CI وفحوصات السلامة السريعة. في المقابل، تحتوي ImageNette على آلاف الصور عبر 10 فئات يسهل تمييزها، مما يجعلها أكثر ملاءمة للتدريب الفعلي للنماذج والتطوير. تم تصميم ImageNet10 للتحقق من وظائف خط الأنابيب، بينما تعد ImageNette أفضل لتجارب التدريب الهادفة ولكن الأسرع من ImageNet الكاملة.