Meet YOLO26: next-gen vision AI.

Link to this sectionمجموعة بيانات ImageNet#

ImageNet هي قاعدة بيانات واسعة النطاق للصور المشروحة مصممة للاستخدام في أبحاث التعرف البصري على الأشياء. تحتوي على أكثر من 14 مليون صورة، حيث يتم شرح كل صورة باستخدام مجموعات مترادفات WordNet، مما يجعلها واحدة من أكثر الموارد شمولاً المتاحة لتدريب نماذج التعلم العميق في مهام الرؤية الحاسوبية.

Link to this sectionنماذج ImageNet المدربة مسبقاً#

النموذجالحجم
(بكسل)
acc
top1
acc
top5
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B) عند 224
YOLO26n-cls22471.490.15.0 ± 0.31.1 ± 0.02.80.5
YOLO26s-cls22476.092.97.9 ± 0.21.3 ± 0.06.71.6
YOLO26m-cls22478.194.217.2 ± 0.42.0 ± 0.011.64.9
YOLO26l-cls22479.094.623.2 ± 0.32.8 ± 0.014.16.2
YOLO26x-cls22479.995.041.4 ± 0.93.8 ± 0.029.613.6

Link to this sectionالميزات الرئيسية#

  • تحتوي ImageNet على أكثر من 14 مليون صورة عالية الدقة تغطي آلاف فئات الأشياء.
  • يتم تنظيم مجموعة البيانات وفقاً لتسلسل WordNet الهرمي، حيث تمثل كل مجموعة مترادفات فئة معينة.
  • تُستخدم ImageNet على نطاق واسع للتدريب والقياس المرجعي في مجال الرؤية الحاسوبية، لا سيما في مهام تصنيف الصور واكتشاف الأشياء.
  • لقد كان تحدي التعرف البصري واسع النطاق السنوي من ImageNet (ILSVRC) فعالاً في دفع أبحاث الرؤية الحاسوبية قدماً.

Link to this sectionهيكل مجموعة البيانات#

يتم تنظيم مجموعة بيانات ImageNet باستخدام تسلسل WordNet الهرمي. يمثل كل عقدة في التسلسل الهرمي فئة، ويتم وصف كل فئة بواسطة مجموعة مترادفات (مجموعة من المصطلحات المترادفة). يتم شرح الصور في ImageNet بواحدة أو أكثر من مجموعات المترادفات، مما يوفر مورداً غنياً لتدريب النماذج على التعرف على كائنات مختلفة وعلاقاتها.

Link to this sectionتحدي التعرف البصري واسع النطاق من ImageNet (ILSVRC)#

كان تحدي التعرف البصري واسع النطاق السنوي من ImageNet (ILSVRC) حدثاً مهماً في مجال الرؤية الحاسوبية. وقد وفر منصة للباحثين والمطورين لتقييم خوارزمياتهم ونماذجهم على مجموعة بيانات واسعة النطاق مع مقاييس تقييم موحدة. أدى ILSVRC إلى تقدم كبير في تطوير نماذج التعلم العميق لتصنيف الصور، واكتشاف الأشياء، ومهام الرؤية الحاسوبية الأخرى.

Link to this sectionالتطبيقات#

تُستخدم مجموعة بيانات ImageNet على نطاق واسع لتدريب وتقييم نماذج التعلم العميق في مهام الرؤية الحاسوبية المختلفة، مثل تصنيف الصور، واكتشاف الأشياء، وتحديد مواقع الأشياء. تم تطوير وقياس أداء بعض بنيات التعلم العميق الشهيرة، مثل AlexNet وVGG وResNet، باستخدام مجموعة بيانات ImageNet.

Link to this sectionالاستخدام#

لتدريب نموذج تعلم عميق على مجموعة بيانات ImageNet لمدة 100 عصر (epoch) بحجم صورة 224x224، يمكنك استخدام مقتطفات التعليمات البرمجية التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، راجع صفحة التدريب الخاصة بالنموذج.

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

Link to this sectionصور وشروحات توضيحية عينة#

تحتوي مجموعة بيانات ImageNet على صور عالية الدقة تغطي آلاف فئات الأشياء، مما يوفر مجموعة بيانات متنوعة وشاملة لتدريب وتقييم نماذج الرؤية الحاسوبية. فيما يلي بعض الأمثلة على الصور من مجموعة البيانات:

صور عينة من مجموعة بيانات تصنيف ImageNet

يعرض المثال تنوع وتعقيد الصور في مجموعة بيانات ImageNet، مما يبرز أهمية وجود مجموعة بيانات متنوعة لتدريب نماذج رؤية حاسوبية قوية.

Link to this sectionالاقتباسات والشكر#

إذا كنت تستخدم مجموعة بيانات ImageNet في عملك البحثي أو التطويري، فيرجى الاستشهاد بالورقة البحثية التالية:

اقتباس
@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

نود أن نعرب عن تقديرنا لفريق ImageNet، بقيادة أولغا روساكوفسكي، وجيا دينغ، ولي في-في، لإنشاء والحفاظ على مجموعة بيانات ImageNet كمورد قيم لمجتمع أبحاث التعلم الآلي والرؤية الحاسوبية. لمزيد من المعلومات حول مجموعة بيانات ImageNet ومبتكريها، تفضل بزيارة موقع ImageNet الإلكتروني.

Link to this sectionأسئلة شائعة#

Link to this sectionما هي مجموعة بيانات ImageNet وكيف تُستخدم في الرؤية الحاسوبية؟#

مجموعة بيانات ImageNet هي قاعدة بيانات واسعة النطاق تتكون من أكثر من 14 مليون صورة عالية الدقة مصنفة باستخدام مجموعات مترادفات WordNet. تُستخدم على نطاق واسع في أبحاث التعرف البصري على الأشياء، بما في ذلك تصنيف الصور واكتشاف الأشياء. توفر شروحات مجموعة البيانات وحجمها الهائل مورداً غنياً لتدريب نماذج التعلم العميق. والجدير بالذكر أنه تم تدريب وقياس أداء نماذج مثل AlexNet وVGG وResNet باستخدام ImageNet، مما يظهر دورها في تطوير الرؤية الحاسوبية.

Link to this sectionكيف يمكنني استخدام نموذج YOLO مدرب مسبقاً لتصنيف الصور على مجموعة بيانات ImageNet؟#

لاستخدام نموذج Ultralytics YOLO مدرب مسبقاً لتصنيف الصور على مجموعة بيانات ImageNet، اتبع الخطوات التالية:

مثال على التدريب
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

لمزيد من تعليمات التدريب المتعمقة، راجع صفحة التدريب الخاصة بنا.

Link to this sectionلماذا يجب علي استخدام نماذج Ultralytics YOLO26 المدربة مسبقاً لمشاريع مجموعة بيانات ImageNet الخاصة بي؟#

توفر نماذج Ultralytics YOLO26 المدربة مسبقاً أداءً متطوراً من حيث السرعة والدقة لمهام الرؤية الحاسوبية المختلفة. على سبيل المثال، نموذج YOLO26n-cls، بدقة top-1 تبلغ 71.4% ودقة top-5 تبلغ 90.1%، مُحسّن للتطبيقات في الوقت الفعلي. تقلل النماذج المدربة مسبقاً من الموارد الحسابية المطلوبة للتدريب من الصفر وتسرع دورات التطوير. تعرف على المزيد حول مقاييس أداء نماذج YOLO26 في قسم نماذج ImageNet المدربة مسبقاً.

Link to this sectionكيف يتم تنظيم مجموعة بيانات ImageNet، ولماذا تعتبر مهمة؟#

يتم تنظيم مجموعة بيانات ImageNet باستخدام تسلسل WordNet الهرمي، حيث يمثل كل عقدة في التسلسل الهرمي فئة موصوفة بواسطة مجموعة مترادفات (مجموعة من المصطلحات المترادفة). يسمح هذا الهيكل بشروحات تفصيلية، مما يجعله مثالياً لتدريب النماذج على التعرف على مجموعة واسعة من الأشياء. إن تنوع وثراء شرح ImageNet يجعلها مجموعة بيانات قيمة لتطوير نماذج تعلم عميق قوية وقابلة للتعميم. يمكن العثور على المزيد حول هذا التنظيم في قسم هيكل مجموعة البيانات.

Link to this sectionما هو الدور الذي يلعبه تحدي التعرف البصري واسع النطاق من ImageNet (ILSVRC) في الرؤية الحاسوبية؟#

كان تحدي التعرف البصري واسع النطاق السنوي من ImageNet (ILSVRC) محورياً في دفع عجلة التقدم في الرؤية الحاسوبية من خلال توفير منصة تنافسية لتقييم الخوارزميات على مجموعة بيانات واسعة النطاق وموحدة. إنه يوفر مقاييس تقييم موحدة، مما يعزز الابتكار والتطوير في مجالات مثل تصنيف الصور، واكتشاف الأشياء، وتجزئة الصور. لقد دفع التحدي باستمرار حدود ما هو ممكن باستخدام تقنيات التعلم العميق والرؤية الحاسوبية.

التعليقات