Link to this sectionمجموعة بيانات ImageNet#

Name: مجموعة بيانات تصنيف صور ImageNet
Creator: ImageNet
License: https://www.image-net.org/download.php
Keywords: ImageNet, ILSVRC-2012, تصنيف الصور, التعلم العميق, الرؤية الحاسوبية, نماذج مدربة مسبقاً, YOLO, مجموعة بيانات, WordNet

مجموعة بيانات Ultralytics ImageNet (data="imagenet") هي مجموعة فرعية من ImageNet-1k / ILSVRC-2012 تُستخدم لتدريب وتقييم نماذج تصنيف الصور. تحتوي على 1,000 فئة كائنات مع 1,281,167 صورة تدريب و 50,000 صورة تحقق بحجم 224x224 بكسل، ويبلغ حجم تنزيلها حوالي 144 جيجابايت. قاعدة بيانات ImageNet الأوسع أكبر بكثير — حيث تضم أكثر من 14 مليون صورة عالية الدقة مُصنفة باستخدام مجموعات مرادفات WordNet عبر أكثر من 20,000 فئة — ولكن Ultralytics تتدرب على مجموعة ILSVRC القياسية المكونة من 1,000 فئة والتي أصبحت المعيار الفعلي لـ التعلم العميق في رؤية الكمبيوتر.

Link to this sectionنماذج ImageNet المدربة مسبقاً#

النموذج	الحجم ^(بكسل)	acc ^top1	acc ^top5	السرعة ^{CPU ONNX (ms)}	السرعة ^{T4 TensorRT10 (ms)}	المعلمات ^(M)	FLOPs ^{(B) عند 224}
YOLO26n-cls	224	71.4	90.1	5.0 ± 0.3	1.1 ± 0.0	2.8	0.5
YOLO26s-cls	224	76.0	92.9	7.9 ± 0.2	1.3 ± 0.0	6.7	1.6
YOLO26m-cls	224	78.1	94.2	17.2 ± 0.4	2.0 ± 0.0	11.6	4.9
YOLO26l-cls	224	79.0	94.6	23.2 ± 0.3	2.8 ± 0.0	14.1	6.2
YOLO26x-cls	224	79.9	95.0	41.4 ± 0.9	3.8 ± 0.0	29.6	13.6

Link to this sectionالميزات الرئيسية#

توفر مجموعة بيانات Ultralytics imagenet 1,000 فئة مع 1,281,167 صورة تدريب و 50,000 صورة تحقق (ILSVRC-2012)، وهو معيار التدريب المسبق القياسي لتصنيف الصور.
يتم تنظيم الفئات وفقًا لتسلسل WordNet الهرمي، حيث تتوافق كل فئة مع مجموعة مرادفات (مجموعة من المصطلحات المترادفة).
يتم تدريب الصور بدقة 224x224، ومجموعة البيانات الكاملة عبارة عن تنزيل كبير بحجم ~144 جيجابايت.
لقد كان تحدي التعرف البصري واسع النطاق السنوي من ImageNet (ILSVRC) فعالاً في دفع أبحاث الرؤية الحاسوبية قدماً.

Link to this sectionهيكل مجموعة البيانات#

تستخدم مجموعة بيانات Ultralytics ImageNet تقسيم ILSVRC-2012:

التقسيم (Split)	الصور	الفئات
التدريب	1,281,167	1,000
التحقق	50,000	1,000

يتم تخزين الصور في مجلدات لكل فئة مسماة بمعرف مجموعة مرادفات WordNet (على سبيل المثال، n01440764)، وهو التخطيط الذي يتوقعه تدريب التصنيف في Ultralytics. ترتبط كل فئة من الفئات الـ 1,000 بمجموعة مرادفات WordNet، ولا يوجد تقسيم منفصل للاختبار، لذا يتم استخدام مجموعة التحقق المكونة من 50,000 صورة لقياس الدقة.

حجم التنزيل

يبلغ حجم تنزيل ImageNet-1k حوالي ~144 جيجابايت، لذا تأكد من توفر مساحة كافية على القرص قبل التدريب. للتجارب السريعة، تستخدم المجموعات الفرعية الأصغر ImageNette و ImageNet10 نفس تنسيق المجلد وتستغرق وقتًا أقل بكثير للتدريب.

Link to this sectionتحدي التعرف البصري واسع النطاق من ImageNet (ILSVRC)#

سمحت مسابقة ImageNet Large Scale Visual Recognition Challenge (ILSVRC) السنوية للباحثين بقياس الخوارزميات على مجموعة بيانات واسعة النطاق وموحدة باستخدام مقاييس تقييم متسقة. وقد دفعت نحو تحقيق تقدم كبير في التعلم العميق لتصنيف الصور، واكتشاف الكائنات، ومهام الرؤية الأخرى — وأبرزها فوز AlexNet في عام 2012، والذي ساعد في إطلاق عصر التعلم العميق الحديث.

Link to this sectionالتطبيقات#

تُستخدم مجموعة بيانات ImageNet على نطاق واسع لتدريب وتقييم نماذج التعلم العميق لتصنيف الصور، واكتشاف الكائنات، وتحديد مواقع الكائنات. طُورت المعماريات البارزة مثل AlexNet و VGG و ResNet وتم قياس أدائها على ImageNet، ولا تزال الأوزان المدربة مسبقًا على ImageNet نقطة انطلاق شائعة لتعلم النقل عبر مهام الرؤية.

Link to this sectionالاستخدام#

لتدريب نموذج تصنيف YOLO على ImageNet لمدة 100 عصر بدقة 224x224، استخدم مقتطفات التعليمات البرمجية أدناه. للحصول على قائمة شاملة بالوسيطات المتاحة، ارجع إلى صفحة التدريب الخاصة بالنموذج.

مثال على التدريب

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

يمكنك أيضًا إدارة مجموعات بيانات التصنيف وتشغيل التدريب في السحابة باستخدام Ultralytics Platform.

Link to this sectionصور وشروحات توضيحية عينة#

تغطي مجموعة بيانات ImageNet فئات ILSVRC-2012 البالغ عددها 1,000 فئة، مما يوفر موردًا متنوعًا وشاملًا لتدريب وتقييم نماذج رؤية الكمبيوتر. إليك بعض الصور النموذجية من مجموعة البيانات:

صور عينة من مجموعة بيانات تصنيف ImageNet

Link to this sectionالاقتباسات والشكر#

إذا كنت تستخدم مجموعة بيانات ImageNet في عملك البحثي أو التطويري، فيرجى الاستشهاد بالورقة البحثية التالية:

اقتباس

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

نود أن نعرب عن تقديرنا لفريق ImageNet، بقيادة أولغا روساكوفسكي، وجيا دينغ، ولي في-في، لإنشاء والحفاظ على مجموعة بيانات ImageNet كمورد قيم لمجتمع أبحاث التعلم الآلي والرؤية الحاسوبية. لمزيد من المعلومات حول مجموعة بيانات ImageNet ومبتكريها، تفضل بزيارة موقع ImageNet الإلكتروني.

Link to this sectionالأسئلة الشائعة#

Link to this sectionما هي مجموعة بيانات ImageNet وكيف تُستخدم في الرؤية الحاسوبية؟#

تعد مجموعة بيانات ImageNet قاعدة بيانات صور واسعة النطاق، حيث تضم مجموعتها الأوسع أكثر من 14 مليون صورة عالية الدقة مُصنفة باستخدام مجموعات مرادفات WordNet. في Ultralytics، تقوم data="imagenet" بالتدريب على مجموعة ILSVRC-2012 الفرعية القياسية المكونة من 1,000 فئة، والتي تُعد المعيار الفعلي للتدريب المسبق على تصنيف الصور. تم تدريب وقياس أداء النماذج البارزة مثل AlexNet و VGG و ResNet على ImageNet، مما يؤكد دورها في تطوير رؤية الكمبيوتر.

Link to this sectionكم عدد الفئات والصور التي تحتوي عليها مجموعة بيانات ImageNet؟#

تستخدم مجموعة بيانات Ultralytics imagenet مجموعة ILSVRC-2012 الفرعية مع 1,000 فئة، و 1,281,167 صورة تدريب، و 50,000 صورة تحقق بدقة 224x224، بإجمالي تنزيل يبلغ حوالي 144 جيجابايت. قاعدة بيانات ImageNet الكاملة أكبر بكثير (أكثر من 14 مليون صورة عبر أكثر من 20,000 مجموعة مرادفات WordNet)، ولكن المجموعة الفرعية المكونة من 1,000 فئة هي المستخدمة لتدريب التصنيف وقياس الأداء.

Link to this sectionكيف يمكنني تدريب نموذج YOLO لتصنيف الصور على مجموعة بيانات ImageNet؟#

لتدريب نموذج Ultralytics YOLO على ImageNet، قم بتحميل نموذج تصنيف مدرب مسبقًا ووجه data إلى imagenet:

مثال على التدريب

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

لمزيد من تعليمات التدريب المتعمقة، راجع صفحة التدريب الخاصة بنا.

Link to this sectionلماذا يجب علي استخدام نماذج Ultralytics YOLO26 المدربة مسبقاً لمشاريع مجموعة بيانات ImageNet الخاصة بي؟#

توفر نماذج Ultralytics YOLO26 المدربة مسبقاً أداءً متطوراً من حيث السرعة والدقة لمهام الرؤية الحاسوبية المختلفة. على سبيل المثال، نموذج YOLO26n-cls، بدقة top-1 تبلغ 71.4% ودقة top-5 تبلغ 90.1%، مُحسّن للتطبيقات في الوقت الفعلي. تقلل النماذج المدربة مسبقاً من الموارد الحسابية المطلوبة للتدريب من الصفر وتسرع دورات التطوير. تعرف على المزيد حول مقاييس أداء نماذج YOLO26 في قسم نماذج ImageNet المدربة مسبقاً.

Link to this sectionما هو الدور الذي يلعبه تحدي التعرف البصري واسع النطاق من ImageNet (ILSVRC) في الرؤية الحاسوبية؟#

دفعت مسابقة ImageNet Large Scale Visual Recognition Challenge (ILSVRC) السنوية نحو التقدم في رؤية الكمبيوتر من خلال توفير منصة تنافسية لتقييم الخوارزميات على مجموعة بيانات واسعة النطاق وموحدة. عززت مقاييس التقييم المتسقة الخاصة بها الابتكار في تصنيف الصور، واكتشاف الكائنات، وتقسيم الصور، مما دفع باستمرار حدود التعلم العميق ورؤية الكمبيوتر.

المساهمون

GLglenn-jocher¹⁶ RIRizwanMunawar² RAraimbekovm¹ AMambitious-octopus¹ MAMatthewNoyce¹ JKjk4e¹

تم الإنشاء 12 نوفمبر 2023تم التحديث أول أمس