تخطي إلى المحتوى

YOLO26 مقابل YOLOv5: تطوير الكشف عن الكائنات في الوقت الفعلي

تطور اكتشاف الأجسام تميز بإنجازات مهمة، ومقارنة YOLO26 مع الأسطوري YOLOv5 تقدم رؤية واضحة لمدى التقدم الذي أحرزته الرؤية الحاسوبية. في حين أن YOLOv5 معيار الصناعة للاستخدام والتوازن في عام 2020، فإن YOLO26 يمثل أحدث ما توصلت إليه أبحاث الذكاء الاصطناعي التوليدي والرؤية في عام 2026. يحلل هذا الدليل هياكلهما ومقاييس الأداء وسيناريوهات النشر المثالية لمساعدتك في اختيار الأداة المناسبة لمشروعك.

ملخص تنفيذي

YOLOv5، الصادر عن Ultralytics في عام 2020، جعلت الذكاء الاصطناعي متاحًا للجميع من خلال جعل اكتشاف الكائنات سهلًا وسريعًا وسهل التدريب. ولا يزال هذا النظام أداة موثوقة للأنظمة القديمة.

يستند YOLO26، الذي تم إصداره في يناير 2026، إلى هذا الإرث من خلال بنية أصلية شاملة تقضي على عدم القمع الأقصى (NMS). ويقدم مُحسِّن MuSGD المستوحى من نماذج اللغة الكبيرة (LLMs)، مما يؤدي إلى تقارب أسرع ودقة محسّنة بشكل ملحوظ، خاصة بالنسبة للأجسام الصغيرة والأجهزة الطرفية.

ميزةYOLO26YOLOv5
البنيةNMS طرف إلى طرفمثبتة بواسطة NMS
المحسّنMuSGD (مستوحى من LLM)SGD Adam
سرعة الاستدلالأسرع بنسبة تصل إلى 43٪ على CPUقياسي في الوقت الحقيقي
المهامdetect، segment، classify، تقدير الوضعيات، obbDetect, Segment, Classify
الأفضل لـالذكاء الاصطناعي الحدي، وحدة معالجة الألغاز/CPU في الوقت الفعلي، الروبوتاتالأغراض العامة، الدعم القديم

معايير الأداء

الجدول التالي يقارن النماذج على COCO . يظهر YOLO26 مكاسب كبيرة في كل من الدقة (mAP) وسرعة الاستدلال، خاصة على CPU حيث تعتبر المعالجة الفعالة أمرًا بالغ الأهمية.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

ملاحظة الأداء

يوفر YOLO26n تحسناً هائلاً بنسبة 46٪ في mAP مقارنةً بـ YOLOv5n، مع تشغيل أسرع بنحو ضعفين على وحدات المعالجة المركزية. وهذا يجعله الخيار الأمثل للتطبيقات المحمولة والذكاء الاصطناعي المتطور.

YOLO26: المعيار الجديد للذكاء الاصطناعي على الحافة

تم تصميم YOLO26 لمعالجة تعقيدات خطوط النشر الحديثة. من خلال إزالة الحاجة إلى NMS وفقدان التركيز التوزيعي (DFL)، يبسط النموذج التصدير إلى تنسيقات مثل ONNX و TensorRT مما يقلل من تقلب زمن الاستجابة.

الابتكارات المعمارية الرئيسية

  1. NMS من البداية إلى النهاية: تتنبأ بنية النموذج بمربع حدود واحد لكل كائن مباشرةً، مما يلغي NMS الاستدلالية. وهذا يقلل من العبء الحسابي أثناء الاستدلال، وهي تقنية تم ابتكارها لأول مرة في YOLOv10.
  2. MuSGD Optimizer: من خلال تكييف الابتكارات من تدريب LLM، يستخدم YOLO26 مزيجًا من SGD Muon (مستوحى من Kimi K2 من Moonshot AI). ينتج عن ذلك ديناميكيات تدريب أكثر استقرارًا وتقاربًا أسرع، مما يقلل من تكلفة تدريب النماذج المخصصة.
  3. ProgLoss + STAL: يؤدي دمج Progressive Loss و Soft-Target Anchor Loss إلى تحسين كبير في اكتشاف الأجسام الصغيرة، وهو مطلب أساسي لصور الطائرات بدون طيار والمركبات ذاتية القيادة.
  4. الكفاءة: بفضل CPU الأسرع بنسبة تصل إلى 43٪، تم تحسين YOLO26 للأجهزة التي تفتقر إلى وحدات معالجة رسومات قوية، مثل أجهزة الكمبيوتر المحمولة القياسية و Raspberry Pi.

تعرف على المزيد حول YOLO26

YOLOv5: إرث قابلية الاستخدام

YOLOv5 أحدثت تحولاً في مجال الرؤية الحاسوبية من خلال إعطاء الأولوية لتجربة المستخدم. وقد وضعت PyTorch البديهية ونظامها البيئي القوي معايير جديدة لتطوير الذكاء الاصطناعي "من الصفر إلى القمة".

  • سهولة الاستخدام: يشتهر YOLOv5 ببساطة بنية الدليل وواجهة "train.py"، YOLOv5 المفضل للأغراض التعليمية والنماذج الأولية السريعة.
  • توافق واسع النطاق: يضمن الدعم الشامل لتنسيقات التصدير تشغيله على أي جهاز تقريبًا، من Apple CoreML إلى Android TFLite.
  • دعم المجتمع: سنوات من التطوير النشط قد خلقت مكتبة ضخمة من البرامج التعليمية، والتكاملات من أطراف ثالثة، وإصلاحات المجتمع.

تعرف على المزيد حول YOLOv5

مقارنة حالات الاستخدام

يعتمد الاختيار بين هذه النماذج على القيود المحددة الخاصة بك فيما يتعلق بالأجهزة والدقة وتعقيد المهمة.

السيناريوهات المثالية لـ YOLO26

  • الحوسبة الطرفية وإنترنت الأشياء: إزالة DFL و NMS YOLO26 سريعًا للغاية على وحدات المعالجة المركزية ووحدات المعالجة العصبية. وهو مثالي للكاميرات الذكية وتحليلات البيع بالتجزئة وأجهزة الاستشعار الصناعية.
  • الروبوتات والملاحة: يوفر التصميم الشامل زمن انتقال حتمي، وهو أمر بالغ الأهمية لدورات التحكم في الوقت الفعلي في مجال الروبوتات.
  • المهام المتقدمة: إذا كنت بحاجة إلى تقدير الوضع باستخدام تقدير الاحتمالية اللوغاريتمية المتبقية (RLE) أو الكشف عالي الدقة عن الصندوق المحيط الموجه (OBB) للصور الجوية، فإن YOLO26 يوفر رؤوسًا معمارية متخصصة YOLOv5 .
  • الكشف عن الأجسام الصغيرة: بفضل ProgLoss، يتفوق YOLO26 في الكشف عن العناصر الصغيرة مثل عيوب التصنيع أو الأجسام البعيدة في لقطات كاميرات المراقبة.

السيناريوهات المثالية لـ YOLOv5

  • الأنظمة القديمة: قد تجد المشاريع التي تم دمجها بالفعل بشكل عميق مع YOLOv5 أنه من المجدٍ اقتصاديًا الحفاظ على النموذج الحالي إذا كان الأداء يلبي المتطلبات.
  • ورش عمل تعليمية: قاعدة الكود البسيطة الخاصة بها ممتازة لتعليم أساسيات الشبكات العصبية التلافيفية (CNNs).

التدريب والنظام البيئي

يستفيد كلا النموذجين من Ultralytics القوي، لكن YOLO26 يقدم كفاءات حديثة.

كفاءة التدريب

يستخدم YOLO26 مُحسِّن MuSGD، الذي يعمل على استقرار التدريب عبر أحجام الدُفعات ومعدلات التعلم المتفاوتة. وغالبًا ما يؤدي ذلك إلى تقليل عدد الدورات اللازمة للوصول إلى التقارب مقارنةً SGD القياسي YOLOv5 مما يوفر تكاليف GPU .

متطلبات الذاكرة

تشتهر Ultralytics بكفاءتها. ويواصل YOLO26 هذا الاتجاه، حيث يتطلب CUDA أقل بكثير من البدائل القائمة على المحولات مثل RT-DETR. وهذا يتيح للمطورين تدريب نماذج أكبر على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين مثل NVIDIA 3060 أو 4090.

Ultralytics

كلا النموذجين متكاملان تمامًا مع Ultralytics ، التي تعمل على تبسيط سير العمل بأكمله:

  • إدارة مجموعة البيانات: تحميل البيانات وتوضيحها بمساعدة الذكاء الاصطناعي.
  • التدريب بنقرة واحدة: تدرب على السحابة دون الحاجة إلى إدارة البنية التحتية.
  • النشر: التصدير تلقائيًا إلى TensorRT و OpenVINO والمزيد للإنتاج.

الخلاصة

بينما YOLOv5 لا يزال نموذجًا كلاسيكيًا مرموقًا حدد معالم جيل من أجهزة الكشف عن الأجسام، فإن YOLO26 هو الخيار الأفضل للمشاريع الجديدة في عام 2026. تقدم تطوراته المعمارية — ولا سيما التصميم NMS ومحسّن MuSGD — نموذجًا أسرع وأكثر دقة وأسهل في النشر على الأجهزة الطرفية.

بالنسبة للمطورين الذين يبحثون عن أفضل توازن بين السرعة والدقة، يوفر YOLO26 أساسًا مستقبليًا. نوصي بترحيل YOLOv5 القديم إلى YOLO26 للاستفادة من هذه المكاسب الكبيرة في الأداء.

المؤلفون والمراجع

YOLO26

YOLOv5

  • المؤلفون: Glenn Jocher
  • المؤسسة:Ultralytics
  • التاريخ: 2020-06-26
  • الوثائق:YOLOv5

للمهتمين باستكشاف هياكل معمارية حديثة أخرى، يمكنكم الاطلاع على YOLO11 للمهام البصرية العامة أو RT-DETR للكشف القائم على المحولات.


تعليقات