مقارنة بين YOLOv8 و YOLO26: تطور الذكاء الاصطناعي للرؤية في الوقت الفعلي
تطور مشهد الرؤية الحاسوبية بسرعة، حيث يضع كل جيل من عائلة You Only Look Once (YOLO) معايير جديدة للسرعة والدقة. يمثل Ultralytics YOLOv8 و Ultralytics YOLO26 المتطور مرحلتين حاسمتين في هذا التطور. بينما أرسى YOLOv8 نظامًا بيئيًا قويًا وقدرة متعددة المهام يعتمد عليها قادة الصناعة، يقدم YOLO26 تغييرات معمارية رائدة مثل الاستدلال الشامل والتحسين لأجهزة الحافة.
يقدم هذا الدليل مقارنة فنية مفصلة لمساعدة الباحثين والمطورين على اختيار النموذج المناسب لاحتياجات النشر الخاصة بهم، بدءًا من التحليل المستند إلى السحابة وصولاً إلى تطبيقات إنترنت الأشياء ذات الموارد المحدودة.
نظرات عامة على النموذج
Ultralytics YOLOv8
صدر YOLOv8 في يناير 2023، وشكل تحولًا كبيرًا نحو إطار عمل موحد يدعم مهام object detection و instance segmentation و pose estimation و classification و oriented bounding box (OBB). وقد قدم اكتشافًا خاليًا من المراسي ووظيفة خسارة جديدة، مما يجعله خيارًا متعدد الاستخدامات لمختلف الصناعات.
- المؤلفون: Glenn Jocher و Ayush Chaurasia و Jing Qiu
- المؤسسة:Ultralytics
- التاريخ: 2023-01-10
- GitHub:Ultralytics Repository
Ultralytics YOLO26
تم إطلاق YOLO26 في يناير 2026، ويمثل القفزة التالية في الكفاءة والأداء. لقد تم تصميمه ليكون شاملًا (E2E) بشكل أصلي، مما يلغي الحاجة إلى Non-Maximum Suppression (NMS) أثناء الاستدلال. وينتج عن ذلك سرعات أعلى، خاصة على وحدات CPU وأجهزة الحافة. ومع إزالة Distribution Focal Loss (DFL) وتقديم مُحسِّن MuSGD، تم تبسيط YOLO26 ليناسب قيود النشر الحديثة.
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2026-01-14
- GitHub:Ultralytics Repository
الاختلافات المعمارية
يتضمن الانتقال من YOLOv8 إلى YOLO26 تغييرات هيكلية أساسية تهدف إلى تقليل زمن الوصول وتحسين استقرار التدريب.
تصميم شامل خالٍ من NMS
تعد خطوة المعالجة اللاحقة المعروفة باسم NMS، والتي تقوم بتصفية الصناديق المحيطة المتداخلة، إحدى أهم الاختناقات في الكاشفات التقليدية مثل YOLOv8.
- YOLOv8: يستخدم خطوة NMS محسّنة للغاية ولكنها ضرورية. يمكن أن يؤدي ذلك إلى تعقيد مسارات النشر، خاصة عند التصدير إلى تنسيقات مثل ONNX أو TensorRT حيث يختلف دعم مكون NMS الإضافي الفعال.
- YOLO26: يعتمد بنية خالية من NMS رائدة من قبل YOLOv10. من خلال إنشاء تنبؤات فردية مباشرة من الشبكة، فإنه يبسط منطق التصدير ويقلل من زمن وصول الاستدلال، مما يجعله مثاليًا للتطبيقات في الوقت الفعلي على Raspberry Pi أو الأجهزة المحمولة.
دوال الخسارة والتحسين
يقدم YOLO26 العديد من المكونات الجديدة لوصفة التدريب:
- مُحسِّن MuSGD: مزيج من SGD و Muon، مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (LLM). يعمل هذا المُحسِّن على استقرار زخم التدريب، مما يؤدي إلى تقارب أسرع مقارنة بـ AdamW أو SGD القياسي المستخدم في الإصدارات السابقة.
- إزالة DFL: تعمل إزالة Distribution Focal Loss على تبسيط رأس الانحدار. يعد هذا التخفيض في التعقيد عاملًا رئيسيًا في قدرة YOLO26 على العمل أسرع بنسبة تصل إلى 43% على وحدات CPU.
- ProgLoss + STAL: يعمل Progressive Loss Balancing و Small-Target-Aware Label Assignment (STAL) على تحسين الأداء بشكل كبير على الكائنات الصغيرة، مما يعالج نقطة ضعف شائعة في الكاشفات للأغراض العامة المستخدمة في الصور الجوية أو الفحص الصناعي.
تنبيه: النشر على أجهزة الحافة
إن إزالة NMS و DFL في YOLO26 تجعله سهل الاستخدام بشكل استثنائي للكمّي 8 بت. إذا كنت تقوم بالنشر على أجهزة الحافة باستخدام TFLite أو CoreML، فإن YOLO26 غالبًا ما يحتفظ بدقة أعلى عند دقة أقل مقارنة بـ YOLOv8.
مقاييس الأداء
يقارن الجدول التالي أداء نماذج YOLOv8 و YOLO26 على مجموعة بيانات COCO. يُظهر YOLO26 سرعة ودقة فائقتين عبر جميع مقاييس النموذج، لا سيما في بيئات CPU حيث تتألق تحسيناته المعمارية.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
ملاحظة: يشير الخط العريض إلى مقياس الأداء الأفضل (mAP أعلى، سرعة/معلمات/FLOPs أقل).
كفاءة التدريب وسهولة الاستخدام
يستفيد كلا النموذجين من نظام Ultralytics البيئي الناضج، والمعروف ببساطته "من الصفر إلى البطل".
واجهة برمجة تطبيقات مبسطة
سواء كنت تستخدم YOLOv8 أو YOLO26، تظل واجهة برمجة تطبيقات python متسقة. يتيح ذلك للمطورين التبديل بين البنى بتغيير سطر واحد من التعليمات البرمجية، مما يسهل عملية المقارنة واختبار A/B.
from ultralytics import YOLO
# Load a YOLOv8 model
model_v8 = YOLO("yolov8n.pt")
# Load a YOLO26 model
model_26 = YOLO("yolo26n.pt")
# Train YOLO26 on your custom dataset
results = model_26.train(data="coco8.yaml", epochs=100, imgsz=640)
الذاكرة والموارد
يُعد YOLO26 أكثر كفاءة في استخدام الذاكرة بشكل كبير أثناء التدريب مقارنة بالنماذج القائمة على المحولات مثل RT-DETR أو إصدارات YOLO الأقدم. تسمح بنية الخسارة المبسطة ومُحسِّن MuSGD بأحجام دفعات أكبر على نفس أجهزة GPU، مما يقلل التكلفة الإجمالية لامتلاك البنية التحتية للتدريب. يمكن للمستخدمين ذوي VRAM المحدود ضبط yolo26s أو yolo26m النماذج بسهولة على وحدات GPU الاستهلاكية القياسية.
حالات الاستخدام المثالية
يعتمد الاختيار بين YOLOv8 و YOLO26 على قيودك المحددة وبيئة النشر.
متى تختار YOLOv8
- التوافق مع الأنظمة القديمة: إذا كانت لديك مسارات عمل حالية مدمجة بشكل كبير مع منطق المعالجة اللاحقة الخاص بـ YOLOv8 ولا يمكن تحديثها بسهولة.
- إضافات مجتمعية محددة: قد لا تزال بعض الأدوات القديمة التابعة لجهات خارجية أو الأنظمة المدمجة بعمق تعتمد بشكل صارم على تنسيقات تصدير YOLOv8، على الرغم من أن وحدة تصدير Ultralytics تتعامل مع معظم التحويلات بسلاسة.
متى تختار YOLO26
- الحوسبة الطرفية: للتطبيقات على NVIDIA Jetson، أو الهواتف المحمولة، أو وحدات CPU المدمجة حيث كل مللي ثانية من زمن الاستجابة مهمة. يُعد تسريع أداء CPU بنسبة 43% بمثابة تغيير جذري للأجهزة التي تعمل بالبطارية.
- اكتشاف الكائنات الصغيرة: تجعل تحسينات ProgLoss و STAL من YOLO26 الخيار الأمثل لمراقبة الطائرات بدون طيار أو الفحص الزراعي حيث تكون الأهداف غالبًا بعيدة وصغيرة جدًا.
- نشر مبسط: إذا كنت ترغب في تجنب عناء تطبيق NMS في البيئات غير القياسية (مثل FPGAs المخصصة أو مسرعات الذكاء الاصطناعي المتخصصة)، فإن الطبيعة الشاملة لـ YOLO26 مثالية.
- المهام عالية الأداء: للمهام التي تتطلب أعلى دقة ممكنة، مثل التصوير الطبي أو مكونات القيادة الذاتية الحساسة للسلامة.
الخلاصة
بينما يظل YOLOv8 أداة قوية وموثوقة في ترسانة الرؤية الحاسوبية، يمثل YOLO26 مستقبل الاكتشاف الفعال وعالي الأداء. تحل ابتكاراته المعمارية نقاط الاحتكاك القديمة في النشر مثل NMS مع توفير دقة متطورة.
للمطورين الذين يتطلعون إلى البقاء في طليعة التقدم، توفر الترقية إلى YOLO26 فوائد فورية في السرعة وحجم النموذج دون التضحية بسهولة الاستخدام التي تميز تجربة Ultralytics. نوصي ببدء المشاريع الجديدة باستخدام YOLO26 للاستفادة الكاملة من هذه التطورات.
نماذج أخرى للاستكشاف
- YOLO11: السلف المباشر لـ YOLO26، يقدم توازنًا بين الأداء والميزات لأولئك الذين ينتقلون من الإصدارات الأقدم.
- YOLOv10: النموذج الذي كان رائدًا في النهج الخالي من NMS، ومفيد للدراسة الأكاديمية للانتقال المعماري.
- YOLO-World: كاشف مفتوح المفردات مثالي لتحديد الكائنات دون تدريب على مجموعات بيانات مخصصة، باستخدام مطالبات نصية لـ detect.