مجموعة بيانات ImageNet10
تعتبر مجموعة بيانات ImageNet10 مجموعة فرعية صغيرة النطاق من قاعدة بيانات ImageNet، تم تطويرها بواسطة Ultralytics ومصممة لاختبارات CI وفحوصات السلامة والاختبار السريع لخطوط أنابيب التدريب. تتكون مجموعة البيانات هذه من الصورة الأولى في مجموعة التدريب والصورة الأولى من مجموعة التحقق من الصحة للفئات العشر الأولى في ImageNet. على الرغم من أنها أصغر بكثير، إلا أنها تحتفظ بهيكل وتنوع مجموعة بيانات ImageNet الأصلية.
الميزات الرئيسية
- ImageNet10 هي نسخة مضغوطة من ImageNet، مع 20 صورة تمثل أول 10 فئات من مجموعة البيانات الأصلية.
- تم تنظيم مجموعة البيانات وفقًا لتسلسل WordNet الهرمي، مما يعكس هيكل مجموعة بيانات ImageNet الكاملة.
- إنه مثالي لاختبارات التكامل المستمر (CI)، وفحوصات السلامة، والاختبار السريع لخطوط أنابيب التدريب في مهام الرؤية الحاسوبية.
- على الرغم من أنه غير مصمم ليكون معيارًا لتقييم النماذج، إلا أنه يمكن أن يوفر مؤشرًا سريعًا للوظائف الأساسية للنموذج وصحته.
هيكل مجموعة البيانات
مجموعة بيانات ImageNet10، مثل ImageNet الأصلية، منظمة باستخدام التسلسل الهرمي WordNet. يتم وصف كل فئة من الفئات العشر في ImageNet10 بواسطة مجموعة متشابهة (مجموعة من المصطلحات المترادفة). يتم تزويد الصور في ImageNet10 بتعليقات توضيحية مع مجموعة متشابهة واحدة أو أكثر، مما يوفر موردًا مضغوطًا لاختبار النماذج للتعرف على الكائنات المختلفة وعلاقاتها.
التطبيقات
تعد مجموعة بيانات ImageNet10 مفيدة للاختبار السريع وتصحيح أخطاء نماذج وخطوط أنابيب رؤية الكمبيوتر. يسمح حجمها الصغير بالتكرار السريع، مما يجعلها مثالية لاختبارات التكامل المستمر وفحوصات السلامة. يمكن استخدامه أيضًا للاختبار الأولي السريع للنماذج الجديدة أو التغييرات في النماذج الحالية قبل الانتقال إلى الاختبار واسع النطاق مع مجموعة بيانات ImageNet الكاملة.
الاستخدام
لاختبار نموذج التعلم العميق على مجموعة بيانات ImageNet10 بحجم صورة 224 × 224، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالحجج المتاحة، راجع صفحة التدريب الخاصة بالنموذج.
مثال للاختبار
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224
عينات من الصور والشروحات التوضيحية
تحتوي مجموعة بيانات ImageNet10 على مجموعة فرعية من الصور من مجموعة بيانات ImageNet الأصلية. تم اختيار هذه الصور لتمثيل الفئات العشر الأولى في مجموعة البيانات، مما يوفر مجموعة بيانات متنوعة ولكنها مضغوطة للاختبار والتقييم السريع.

يُظهر هذا المثال تنوع وتعقيد الصور في مجموعة بيانات ImageNet10، مع تسليط الضوء على فائدتها في إجراء فحوصات التحقق السريع واختبار نماذج رؤية الكمبيوتر.
الاقتباسات والإقرارات
إذا كنت تستخدم مجموعة بيانات ImageNet10 في بحثك أو عملك التطويري، فيرجى الاستشهاد بورقة ImageNet الأصلية:
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}
نود أن نتقدم بالشكر إلى فريق ImageNet، بقيادة أولغا روساكوفسكي وجيا دينغ ولي فاي-فاي، لإنشاء مجموعة بيانات ImageNet والحفاظ عليها. تعد مجموعة بيانات ImageNet10، على الرغم من كونها مجموعة فرعية مضغوطة، موردًا قيمًا للاختبار السريع وتصحيح الأخطاء في مجتمع التعلم الآلي وأبحاث رؤية الكمبيوتر. لمزيد من المعلومات حول مجموعة بيانات ImageNet ومنشئيها، تفضل بزيارة موقع ImageNet.
الأسئلة الشائعة
ما هي مجموعة بيانات ImageNet10 وكيف تختلف عن مجموعة بيانات ImageNet الكاملة؟
تعتبر مجموعة بيانات ImageNet10 مجموعة فرعية مضغوطة من قاعدة بيانات ImageNet الأصلية، تم إنشاؤها بواسطة Ultralytics لاختبارات CI السريعة وفحوصات السلامة وتقييمات خط أنابيب التدريب. تشتمل ImageNet10 على 20 صورة فقط، تمثل الصورة الأولى في مجموعات التدريب والتحقق من الصحة للفئات العشر الأولى في ImageNet. على الرغم من صغر حجمها، إلا أنها تحافظ على هيكل وتنوع مجموعة البيانات الكاملة، مما يجعلها مثالية للاختبار السريع ولكن ليس لتقييم النماذج.
كيف يمكنني استخدام مجموعة بيانات ImageNet10 لاختبار نموذج التعلم العميق الخاص بي؟
لاختبار نموذج التعلم العميق الخاص بك على مجموعة بيانات ImageNet10 بحجم صورة 224 × 224، استخدم مقتطفات التعليمات البرمجية التالية.
مثال للاختبار
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224
راجع صفحة التدريب للحصول على قائمة شاملة بالحجج المتاحة.
لماذا يجب عليّ استخدام مجموعة بيانات ImageNet10 لاختبارات التكامل المستمر (CI) والتحقق من السلامة؟
تم تصميم مجموعة بيانات ImageNet10 خصيصًا لاختبارات CI وفحوصات السلامة والتقييمات السريعة في خطوط أنابيب التعلم العميق. يسمح حجمها الصغير بالتكرار والاختبار السريع، مما يجعلها مثالية لعمليات التكامل المستمر حيث السرعة أمر بالغ الأهمية. من خلال الحفاظ على التعقيد الهيكلي وتنوع مجموعة بيانات ImageNet الأصلية، توفر ImageNet10 مؤشرًا موثوقًا للوظائف الأساسية للنموذج وصحته دون الحاجة إلى معالجة مجموعة بيانات كبيرة.
ما هي الميزات الرئيسية لمجموعة بيانات ImageNet10؟
تتميز مجموعة بيانات ImageNet10 بعدة ميزات رئيسية:
- حجم صغير: مع 20 صورة فقط، فإنه يسمح بإجراء اختبارات وتصحيح الأخطاء بسرعة.
- تنظيم منظم: يتبع التسلسل الهرمي لـ WordNet، على غرار مجموعة بيانات ImageNet الكاملة.
- CI وعمليات التحقق من السلامة: مناسبة بشكل مثالي لاختبارات التكامل المستمر وعمليات التحقق من السلامة.
- ليس لغرض القياس: على الرغم من أنه مفيد لتقييمات النموذج السريعة، إلا أنه غير مصمم لإجراء قياسات شاملة.
كيف تتم مقارنة ImageNet10 بمجموعات البيانات الصغيرة الأخرى مثل ImageNette؟
في حين أن كلاً من ImageNet10 و ImageNette هما مجموعتان فرعيتان من ImageNet، إلا أنهما تخدمان أغراضًا مختلفة. تحتوي ImageNet10 على 20 صورة فقط (2 لكل فئة) من أول 10 فئات من ImageNet، مما يجعلها خفيفة الوزن للغاية لاختبار CI وعمليات التحقق السريعة. في المقابل، تحتوي ImageNette على آلاف الصور عبر 10 فئات يسهل تمييزها، مما يجعلها أكثر ملاءمة لتدريب النموذج الفعلي وتطويره. تم تصميم ImageNet10 للتحقق من وظائف خط الأنابيب، في حين أن ImageNette أفضل لتجارب التدريب الهادفة ولكن الأسرع من ImageNet الكامل.