انتقل إلى المحتوى

مجموعة بيانات ImageNet

ImageNet هي قاعدة بيانات واسعة النطاق للصور المشروحة المصممة للاستخدام في أبحاث التعرف على الكائنات المرئية. يحتوي على أكثر من 14 مليون صورة ، مع كل صورة مشروحة باستخدام توليفات WordNet ، مما يجعلها واحدة من أكثر الموارد المتاحة شمولا لتدريب نماذج التعلم العميق في مهام رؤية الكمبيوتر.

نماذج ImageNet المدربة مسبقا

نموذج حجم
(بكسل)
لجنه التنسيق الاداريه
أعلى 1
لجنه التنسيق الاداريه
أعلى 5
سرعة
وحده المعالجه المركزيه ONNX
(مللي ثانية)
سرعة
أ 100 TensorRT
(مللي ثانية)
المعلمات
(م)
يتخبط
(ب) عند 640
YOLOv8n-سي إل إس 224 69.0 88.3 12.9 0.31 2.7 4.3
YOLOv8s-سي إل إس 224 73.8 91.7 23.4 0.35 6.4 13.5
YOLOv8m-سي إل إس 224 76.8 93.5 85.4 0.62 17.0 42.7
YOLOv8l-سي إل إس 224 76.8 93.5 163.0 0.87 37.5 99.7
YOLOv8x-سي إل إس 224 79.0 94.6 232.0 1.01 57.4 154.8

الميزات الرئيسية

  • يحتوي ImageNet على أكثر من 14 مليون صورة عالية الدقة تغطي آلاف فئات الكائنات.
  • يتم تنظيم مجموعة البيانات وفقا للتسلسل الهرمي ل WordNet ، حيث تمثل كل مجموعة توليفة فئة.
  • يستخدم ImageNet على نطاق واسع للتدريب وقياس الأداء في مجال رؤية الكمبيوتر ، وخاصة لتصنيف الصور ومهام الكشف عن الكائنات.
  • كان تحدي التعرف البصري على نطاق واسع ImageNet السنوي (ILSVRC) مفيدا في تطوير أبحاث رؤية الكمبيوتر.

هيكل مجموعة البيانات

يتم تنظيم مجموعة بيانات ImageNet باستخدام التسلسل الهرمي ل WordNet. تمثل كل عقدة في التسلسل الهرمي فئة ، ويتم وصف كل فئة بواسطة مجموعة توليفة (مجموعة من المصطلحات المترادفة). يتم شرح الصور في ImageNet بواحد أو أكثر من synsets ، مما يوفر موردا غنيا لنماذج التدريب للتعرف على الكائنات المختلفة وعلاقاتها.

تحدي التعرف البصري واسع النطاق من ImageNet (ILSVRC)

كان تحدي التعرف البصري على نطاق واسع ImageNet السنوي (ILSVRC) حدثا مهما في مجال رؤية الكمبيوتر. وقد وفرت منصة للباحثين والمطورين لتقييم خوارزمياتهم ونماذجهم على مجموعة بيانات واسعة النطاق مع مقاييس تقييم موحدة. أدى ILSVRC إلى تطورات كبيرة في تطوير نماذج التعلم العميق لتصنيف الصور واكتشاف الأشياء ومهام رؤية الكمبيوتر الأخرى.

التطبيقات

تستخدم مجموعة بيانات ImageNet على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام رؤية الكمبيوتر المختلفة ، مثل تصنيف الصور واكتشاف الكائنات وتوطين الكائنات. تم تطوير بعض معماريات التعلم العميق الشائعة ، مثل AlexNet و VGG و ResNet ، وقياسها باستخدام مجموعة بيانات ImageNet.

استخدام

لتدريب نموذج تعلم عميق على مجموعة بيانات ImageNet ل 100 حقبة بحجم صورة 224 × 224، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة نموذج التدريب .

مثال القطار

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet model=yolov8n-cls.pt epochs=100 imgsz=224

عينة من الصور والتعليقات التوضيحية

تحتوي مجموعة بيانات ImageNet على صور عالية الدقة تغطي آلاف فئات الكائنات ، مما يوفر مجموعة بيانات متنوعة وشاملة للتدريب وتقييم نماذج رؤية الكمبيوتر. فيما يلي بعض الأمثلة على الصور من مجموعة البيانات:

صور عينة من مجموعة البيانات

يعرض المثال تنوع وتعقيد الصور في مجموعة بيانات ImageNet ، مما يسلط الضوء على أهمية مجموعة البيانات المتنوعة لتدريب نماذج رؤية الكمبيوتر القوية.

الاستشهادات والشكر

إذا كنت تستخدم مجموعة بيانات ImageNet في أعمال البحث أو التطوير الخاصة بك ، فيرجى الاستشهاد بالورقة التالية:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

نود أن نعرب عن تقديرنا لفريق ImageNet ، بقيادة أولغا روساكوفسكي وجيا دينغ ولي فاي فاي ، لإنشاء مجموعة بيانات ImageNet وصيانتها كمورد قيم لمجتمع أبحاث التعلم الآلي ورؤية الكمبيوتر. لمزيد من المعلومات حول مجموعة بيانات ImageNet ومنشئيها، تفضل بزيارة موقع ImageNet على الويب.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (7), RizwanMunawar (1)

التعليقات