انتقل إلى المحتوى

مجموعة بيانات ImageNet10

مجموعة بيانات ImageNet10 هي مجموعة فرعية صغيرة الحجم من قاعدة بيانات ImageNet ، تم تطويرها بواسطة Ultralytics ومصممة لاختبارات CI وفحوصات السلامة والاختبار السريع لخطوط أنابيب التدريب. تتكون مجموعة البيانات هذه من الصورة الأولى في مجموعة التدريب والصورة الأولى من مجموعة التحقق من صحة أول 10 فصول في ImageNet. على الرغم من أنه أصغر بكثير ، إلا أنه يحتفظ بهيكل وتنوع مجموعة بيانات ImageNet الأصلية.

الميزات الرئيسية

  • ImageNet10 هي نسخة مضغوطة من ImageNet ، مع 20 صورة تمثل أول 10 فئات من مجموعة البيانات الأصلية.
  • يتم تنظيم مجموعة البيانات وفقا للتسلسل الهرمي ل WordNet ، مما يعكس بنية مجموعة بيانات ImageNet الكاملة.
  • إنه مناسب بشكل مثالي لاختبارات CI وفحوصات السلامة والاختبار السريع لخطوط أنابيب التدريب في مهام رؤية الكمبيوتر.
  • على الرغم من أنه غير مصمم لقياس أداء النموذج ، إلا أنه يمكن أن يوفر مؤشرا سريعا على الوظائف الأساسية للنموذج وصحته.

هيكل مجموعة البيانات

يتم تنظيم مجموعة بيانات ImageNet10 ، مثل ImageNet الأصلية ، باستخدام التسلسل الهرمي ل WordNet. يتم وصف كل فئة من الفئات العشر في ImageNet10 بواسطة synset (مجموعة من المصطلحات المترادفة). يتم إضافة تعليقات توضيحية إلى الصور في ImageNet10 باستخدام مجموعة توليفات واحدة أو أكثر، مما يوفر موردا مضغوطا لاختبار النماذج للتعرف على الكائنات المختلفة وعلاقاتها.

التطبيقات

تعد مجموعة بيانات ImageNet10 مفيدة لاختبار نماذج رؤية الكمبيوتر وخطوط الأنابيب وتصحيحها بسرعة. يسمح حجمها الصغير بالتكرار السريع ، مما يجعلها مثالية لاختبارات التكامل المستمرة وفحوصات السلامة. يمكن استخدامه أيضا للاختبار الأولي السريع للنماذج الجديدة أو التغييرات على النماذج الحالية قبل الانتقال إلى الاختبار على نطاق واسع باستخدام مجموعة بيانات ImageNet الكاملة.

استخدام

لاختبار نموذج تعلم عميق على مجموعة بيانات ImageNet10 بحجم صورة 224 × 224، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة نموذج التدريب .

مثال على الاختبار

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

عينة من الصور والتعليقات التوضيحية

تحتوي مجموعة بيانات ImageNet10 على مجموعة فرعية من الصور من مجموعة بيانات ImageNet الأصلية. يتم اختيار هذه الصور لتمثيل أول 10 فئات في مجموعة البيانات ، مما يوفر مجموعة بيانات متنوعة ومضغوطة للاختبار والتقييم السريع.

صور عينة من مجموعة البيانات يعرض المثال تنوع وتعقيد الصور في مجموعة بيانات ImageNet10 ، مما يسلط الضوء على فائدتها في فحوصات السلامة والاختبار السريع لنماذج رؤية الكمبيوتر.

الاستشهادات والشكر

إذا كنت تستخدم مجموعة بيانات ImageNet10 في أعمال البحث أو التطوير الخاصة بك ، فيرجى الاستشهاد بورقة ImageNet الأصلية:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

نود أن نعرب عن تقديرنا لفريق ImageNet ، بقيادة أولغا روساكوفسكي وجيا دينغ ولي فاي فاي ، لإنشاء مجموعة بيانات ImageNet وصيانتها. تعد مجموعة بيانات ImageNet10، على الرغم من كونها مجموعة فرعية مضغوطة، موردا قيما للاختبار السريع وتصحيح الأخطاء في مجتمع أبحاث التعلم الآلي ورؤية الكمبيوتر. لمزيد من المعلومات حول مجموعة بيانات ImageNet ومنشئيها، تفضل بزيارة موقع ImageNet على الويب.

الأسئلة المتداولة

ما هي مجموعة بيانات ImageNet10 وكيف تختلف عن مجموعة بيانات ImageNet الكاملة؟

مجموعة بيانات ImageNet10 عبارة عن مجموعة فرعية مدمجة من قاعدة بيانات ImageNet الأصلية، تم إنشاؤها بواسطة Ultralytics لإجراء اختبارات سريعة للمعلوماتية وفحوصات الصحة وتقييمات خط أنابيب التدريب. تضم ImageNet10 20 صورة فقط، تمثل الصورة الأولى في مجموعات التدريب والتحقق من صحة أول 10 فئات في ImageNet. على الرغم من صغر حجمها، إلا أنها تحافظ على بنية وتنوع مجموعة البيانات الكاملة، مما يجعلها مثالية للاختبار السريع ولكن ليس لقياس النماذج.

كيف يمكنني استخدام مجموعة بيانات ImageNet10 لاختبار نموذج التعلم العميق الخاص بي؟

لاختبار نموذج التعلّم العميق الخاص بك على مجموعة بيانات ImageNet10 بحجم صورة 224x224، استخدم مقتطفات التعليمات البرمجية التالية.

مثال على الاختبار

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

راجع صفحة التدريب للحصول على قائمة شاملة بالوسائط المتاحة.

لماذا يجب أن أستخدم مجموعة بيانات ImageNet10 لاختبارات CI وفحوصات التعقل؟

صُمِّمت مجموعة بيانات ImageNet10 خصيصًا لاختبارات التكامل المستمر، وفحوصات التعقّل، والتقييمات السريعة في خطوط أنابيب التعلّم العميق. يسمح صغر حجمها بالتكرار والاختبار السريع، مما يجعلها مثالية لعمليات التكامل المستمر حيث تكون السرعة أمرًا بالغ الأهمية. من خلال الحفاظ على التعقيد الهيكلي والتنوع في مجموعة بيانات ImageNet الأصلية، توفر ImageNet10 مؤشرًا موثوقًا للوظائف الأساسية للنموذج وصحته دون الحاجة إلى معالجة مجموعة بيانات كبيرة.

ما هي الميزات الرئيسية لمجموعة بيانات ImageNet10؟

تحتوي مجموعة بيانات ImageNet10 على العديد من الميزات الرئيسية:

  • حجم صغير: مع 20 صورة فقط، يسمح بالاختبار والتصحيح السريع.
  • التنظيم الهيكلي: يتبع التسلسل الهرمي ل WordNet، على غرار مجموعة بيانات ImageNet الكاملة.
  • اختبارات التكامل المستمر وفحوصات التعقل: مناسب بشكل مثالي لاختبارات التكامل المستمر وفحوصات التعقل.
  • ليس للمقارنة المعيارية: في حين أنه مفيد لتقييمات النماذج السريعة، إلا أنه غير مصمم للمقارنة المعيارية الشاملة.

أين يمكنني تنزيل مجموعة بيانات ImageNet10؟

يمكنك تنزيل مجموعة بيانات ImageNet10 من صفحة إصدارات GitHub Ultralytics . لمزيد من المعلومات التفصيلية حول بنيتها وتطبيقاتها، راجع صفحة مجموعة بيانات ImageNet10.



تم الإنشاء 2023-11-12-2023، تم التحديث 2024-07-10
المؤلفون: جلين-جوتشر (8)

التعليقات