انتقل إلى المحتوى

مجموعة بيانات ImageNet

ImageNet هي قاعدة بيانات واسعة النطاق للصور المشروحة المصممة للاستخدام في أبحاث التعرف على الكائنات المرئية. يحتوي على أكثر من 14 مليون صورة ، مع كل صورة مشروحة باستخدام توليفات WordNet ، مما يجعلها واحدة من أكثر الموارد المتاحة شمولا لتدريب نماذج التعلم العميق في مهام رؤية الكمبيوتر.

نماذج ImageNet المدربة مسبقا

نموذج حجم
(بكسل)
لجنه التنسيق الاداريه
أعلى 1
لجنه التنسيق الاداريه
أعلى 5
السرعة
CPU ONNX
(مللي ثانية)
سرعة
أ 100 TensorRT
(مللي ثانية)
المعلمات
(م)
يتخبط
(ب) عند 640
YOLOv8n-سي إل إس 224 69.0 88.3 12.9 0.31 2.7 4.3
YOLOv8s-سي إل إس 224 73.8 91.7 23.4 0.35 6.4 13.5
YOLOv8m-سي إل إس 224 76.8 93.5 85.4 0.62 17.0 42.7
YOLOv8l-سي إل إس 224 76.8 93.5 163.0 0.87 37.5 99.7
YOLOv8x-سي إل إس 224 79.0 94.6 232.0 1.01 57.4 154.8

الميزات الرئيسية

  • يحتوي ImageNet على أكثر من 14 مليون صورة عالية الدقة تغطي آلاف فئات الكائنات.
  • يتم تنظيم مجموعة البيانات وفقا للتسلسل الهرمي ل WordNet ، حيث تمثل كل مجموعة توليفة فئة.
  • يستخدم ImageNet على نطاق واسع للتدريب وقياس الأداء في مجال رؤية الكمبيوتر ، وخاصة لتصنيف الصور ومهام الكشف عن الكائنات.
  • كان تحدي التعرف البصري على نطاق واسع ImageNet السنوي (ILSVRC) مفيدا في تطوير أبحاث رؤية الكمبيوتر.

هيكل مجموعة البيانات

يتم تنظيم مجموعة بيانات ImageNet باستخدام التسلسل الهرمي ل WordNet. تمثل كل عقدة في التسلسل الهرمي فئة ، ويتم وصف كل فئة بواسطة مجموعة توليفة (مجموعة من المصطلحات المترادفة). يتم شرح الصور في ImageNet بواحد أو أكثر من synsets ، مما يوفر موردا غنيا لنماذج التدريب للتعرف على الكائنات المختلفة وعلاقاتها.

تحدي التعرف البصري واسع النطاق من ImageNet (ILSVRC)

كان تحدي التعرف البصري على نطاق واسع ImageNet السنوي (ILSVRC) حدثا مهما في مجال رؤية الكمبيوتر. وقد وفرت منصة للباحثين والمطورين لتقييم خوارزمياتهم ونماذجهم على مجموعة بيانات واسعة النطاق مع مقاييس تقييم موحدة. أدى ILSVRC إلى تطورات كبيرة في تطوير نماذج التعلم العميق لتصنيف الصور واكتشاف الأشياء ومهام رؤية الكمبيوتر الأخرى.

التطبيقات

تستخدم مجموعة بيانات ImageNet على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام رؤية الكمبيوتر المختلفة ، مثل تصنيف الصور واكتشاف الكائنات وتوطين الكائنات. تم تطوير بعض معماريات التعلم العميق الشائعة ، مثل AlexNet و VGG و ResNet ، وقياسها باستخدام مجموعة بيانات ImageNet.

استخدام

لتدريب نموذج تعلم عميق على مجموعة بيانات ImageNet ل 100 حقبة بحجم صورة 224 × 224، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة نموذج التدريب .

مثال القطار

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet model=yolov8n-cls.pt epochs=100 imgsz=224

عينة من الصور والتعليقات التوضيحية

تحتوي مجموعة بيانات ImageNet على صور عالية الدقة تغطي آلاف فئات الكائنات ، مما يوفر مجموعة بيانات متنوعة وشاملة للتدريب وتقييم نماذج رؤية الكمبيوتر. فيما يلي بعض الأمثلة على الصور من مجموعة البيانات:

صور عينة من مجموعة البيانات

يعرض المثال تنوع وتعقيد الصور في مجموعة بيانات ImageNet ، مما يسلط الضوء على أهمية مجموعة البيانات المتنوعة لتدريب نماذج رؤية الكمبيوتر القوية.

الاستشهادات والشكر

إذا كنت تستخدم مجموعة بيانات ImageNet في أعمال البحث أو التطوير الخاصة بك ، فيرجى الاستشهاد بالورقة التالية:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

نود أن نعرب عن تقديرنا لفريق ImageNet ، بقيادة أولغا روساكوفسكي وجيا دينغ ولي فاي فاي ، لإنشاء مجموعة بيانات ImageNet وصيانتها كمورد قيم لمجتمع أبحاث التعلم الآلي ورؤية الكمبيوتر. لمزيد من المعلومات حول مجموعة بيانات ImageNet ومنشئيها، تفضل بزيارة موقع ImageNet على الويب.

الأسئلة المتداولة

ما هي مجموعة بيانات ImageNet وكيف يتم استخدامها في الرؤية الحاسوبية؟

مجموعة بيانات ImageNet عبارة عن قاعدة بيانات واسعة النطاق تتكون من أكثر من 14 مليون صورة عالية الدقة مصنفة باستخدام مجموعات مترادفات WordNet. تُستخدم على نطاق واسع في أبحاث التعرف على الكائنات المرئية، بما في ذلك تصنيف الصور واكتشاف الكائنات. توفر شروح مجموعة البيانات وحجمها الهائل موردًا ثريًا لتدريب نماذج التعلم العميق. والجدير بالذكر أنه تم تدريب نماذج مثل AlexNet وVGG وResNet وقياسها باستخدام ImageNet، مما يبرز دورها في تطوير الرؤية الحاسوبية.

كيف يمكنني استخدام نموذج YOLO المدرب مسبقًا لتصنيف الصور على مجموعة بيانات ImageNet؟

لاستخدام نموذج Ultralytics YOLO المدرب مسبقًا لتصنيف الصور على مجموعة بيانات ImageNet، اتبع الخطوات التالية:

مثال القطار

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet model=yolov8n-cls.pt epochs=100 imgsz=224

لمزيد من التعليمات التدريبية المتعمقة، راجع صفحة التدريب لدينا.

لماذا يجب أن أستخدم النماذج التي تم تدريبها مسبقًا على Ultralytics YOLOv8 لمشاريع مجموعة بيانات ImageNet الخاصة بي؟

Ultralytics YOLOv8 تقدم النماذج المدربة مسبقًا أحدث أداء من حيث السرعة والدقة لمختلف مهام الرؤية الحاسوبية. على سبيل المثال، تم تحسين نموذج YOLOv8n-cls، الذي تبلغ دقته من الدرجة الأولى 69.0% ومن الدرجة الخامسة 88.3% للتطبيقات في الوقت الفعلي. تعمل النماذج المدربة مسبقًا على تقليل الموارد الحسابية المطلوبة للتدريب من البداية وتسريع دورات التطوير. تعرف على المزيد حول مقاييس الأداء لنماذج YOLOv8 في قسم نماذج ImageNet سابقة التدريب في قسم نماذج ImageNet سابقة التدريب.

كيف يتم تنظيم مجموعة بيانات ImageNet، ولماذا هي مهمة؟

يتم تنظيم مجموعة بيانات ImageNet باستخدام التسلسل الهرمي لشبكة WordNet، حيث تمثل كل عقدة في التسلسل الهرمي فئة موصوفة بواسطة مجموعة مترادفات (مجموعة من المصطلحات المترادفة). تسمح هذه البنية بوضع شروح مفصّلة، مما يجعلها مثالية لتدريب النماذج للتعرف على مجموعة واسعة من الكائنات. إن التنوع والثراء التوضيحي ل ImageNet يجعلها مجموعة بيانات قيّمة لتطوير نماذج تعلّم عميق قوية وقابلة للتعميم. يمكن الاطلاع على المزيد حول هذا التنظيم في قسم بنية مجموعة البيانات.

ما الدور الذي تلعبه مسابقة ImageNet للتعرف على المرئيات على نطاق واسع (ILSVRC) في مجال الرؤية الحاسوبية؟

لعبت مسابقة ImageNet السنوية للتعرف على الصور على نطاق واسع (ILSVRC ) دورًا محوريًا في دفع عجلة التقدم في مجال الرؤية الحاسوبية من خلال توفير منصة تنافسية لتقييم الخوارزميات على مجموعة بيانات موحدة واسعة النطاق. ويوفر هذا التحدي مقاييس تقييم موحدة، مما يعزز الابتكار والتطوير في مجالات مثل تصنيف الصور واكتشاف الأجسام وتجزئة الصور. لقد دفع التحدي باستمرار حدود ما هو ممكن مع تقنيات التعلم العميق والرؤية الحاسوبية.



تم الإنشاء 2023-11-12-2023، تم التحديث 2024-07-04
المؤلفون: جلين-جوتشر (8)، رضوان منور (1)

التعليقات