YOLOv5 YOLO: دراسة تقنية متعمقة لتطور اكتشاف الأجسام
في عالم الرؤية الحاسوبية سريع التطور، يعد اختيار نموذج الكشف عن الأجسام المناسب أمراً بالغ الأهمية لنجاح المشروع. يقارن هذا الدليل بين YOLOv5، المستودع الأسطوري الذي جعل الذكاء الاصطناعي في متناول الجميع، و YOLO وهي بنية تركز على البحث من فريق TinyVision التابع لشركة Alibaba. في حين أن كلا النموذجين يهدفان إلى تحقيق كفاءة عالية، إلا أنهما يتعاملان مع المشكلة بفلسفتين مختلفتين فيما يتعلق بالبنية وسهولة الاستخدام وجاهزية النشر.
نظرة عامة على النموذج والأصول
YOLOv5
صدر في منتصف عام 2020 عن Ultralytics، YOLOv5 معيارًا صناعيًا ليس فقط بسبب بنيته، ولكن أيضًا بسبب هندسته. فقد ركز على سهولة الاستخدام، وخطوط التدريب القوية، وقابلية التصدير السلسة. ولا يزال أحد أكثر نماذج الذكاء الاصطناعي البصري انتشارًا على مستوى العالم.
- المؤلفون: Glenn Jocher
- المؤسسة:Ultralytics
- التاريخ: 2020-06-26
- GitHub:ultralytics/yolov5
DAMO-YOLO
اقترحته مجموعة Alibaba في أواخر عام 2022، يدمجYOLO نموذج التقطير المعزز) تقنيات متطورة مثل البحث في البنية العصبية (NAS) و Reparameterized Generalized-FPN (RepGFPN) الفعال، ويعتمد بشكل كبير على التقطير لتعزيز الأداء.
- المؤلفون: Xianzhe Xu، Yiqi Jiang، وآخرون.
- المنظمة: مجموعة علي بابا
- التاريخ: 2022-11-23
- Arxiv:2211.15444v2
- GitHub:tinyvision/DAMO-YOLO
مقارنة البنية التقنية
تسلط الاختلافات المعمارية بين هذين النموذجين الضوء على التحول من التصاميم الاستدلالية "التي تضم مجموعة من الميزات المجانية" إلى البنى الآلية القائمة على البحث.
YOLOv5: معيار CSP-Darknet
YOLOv5 شبكة أساسية CSP-Darknet53 معدلة متصلة بشبكة تجميع المسارات (PANet). وتكمن قوته الأساسية في تصميمه المعياري و"حزمة المزايا المجانية" المطبقة أثناء التدريب، مثل تعزيز Mosaic وتطور المعلمات الفائقة للخوارزمية الجينية.
- العمود الفقري: CSP-Darknet
- العنق: PANet مع كتل CSP
- الرأس: رأس مزدوج قائم على مرساة من طراز YOLOv3
YOLO: NAS والتقطير
YOLO عن التصميمات اليدوية القياسية من خلال استخدام البحث عن البنية العصبية (NAS) للعثور على الهيكل الأساسي الأمثل (MAE-NAS).
- العمود الفقري: MAE-NAS (قائم على البحث)
- العنق: RepGFPN (Reparameterized Generalized FPN) مما يسمح بدمج الميزات بكفاءة.
- الرأس: ZeroHead (طبقات عرض مزدوجة المهام) مقترنة بـ AlignedOTA لتعيين التسميات.
- التقطير: مكون أساسي حيث يوجه نموذج "المعلم" الأكبر حجمًا تدريب نموذج "الطالب" الأصغر حجمًا، مما يضيف تعقيدًا إلى مسار التدريب ولكنه يحسن الدقة النهائية.
تعقيد التقطير
في حين أن التقطير يحسن دقةYOLO إلا أنه يعقد بشكل كبير سير عمل التدريب مقارنةً بـ YOLOv5. غالبًا ما يتعين على المستخدمين تدريب أو تنزيل نموذج معلم أولاً، مما يزيد من صعوبة الدخول إلى مجموعات البيانات المخصصة.
مقاييس الأداء
يُقارن الجدول التالي أداء نماذج مختلفة على مجموعة بيانات COCO . في حينYOLO نتائج قوية في المقاييس الأكاديمية، YOLOv5 منافسًا في الإنتاجية وتنوع الاستخدامات.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
تحليل النتائج
- الكفاءة: يظل YOLOv5n (Nano) ملك الاستدلال الخفيف الوزن، مع عدد معلمات أقل بكثير (2.6 مليون مقابل 8.5 مليون) وعمليات FLOPs مقارنة بـYOLO مما يجعله أكثر ملاءمة للحالات القصوى على وحدات المعالجة المركزية القياسية.
- الدقة:YOLO خط أنابيب التقطير الخاص به للحصول على دقة أعلى mAP من عدد المعلمات المماثلة، خاصة في النطاقات الصغيرة والمتوسطة.
- سرعة الاستدلال: يوفر YOLOv5 CPU أسرع CPU عبر ONNX بفضل كتل هندسية أبسط ومُحسّنة للغاية في المكتبات القياسية.
التدريب وسهولة الاستخدام
هذا هو العامل الأساسي الذي يميز المطورين. يولي Ultralytics الأولوية لتجربة "من الصفر إلى القمة"، في حين أن مستودعات الأبحاث غالبًا ما تتطلب تكوينًا مكثفًا.
YOLOv5: تجربة مبسطة
YOLOv5 واجهة سطر أوامر سهلة الاستخدام Python التي أصبحت المعيار الصناعي. يتطلب التدريب على مجموعة بيانات مخصصة إعدادات بسيطة للغاية.
import torch
# Load a model
model = torch.hub.load("ultralytics/yolov5", "yolov5s")
# Train via CLI (simplified)
# !python train.py --data coco.yaml --epochs 100 --weights yolov5s.pt
YOLO: تعقيد البحث
YOLO يتطلب تدريبYOLO نظام تكوين أكثر تعقيدًا. ويعني الاعتماد على جدول التقطير أن المستخدمين غالبًا ما يحتاجون إلى إدارة نموذجين (المعلم والطالب) خلال مرحلة التدريب، مما يزيد منمتطلبات ذاكرة GPU وتكاليف التكوين.
Ultralytics : النظام البيئي والتنوع
في حين أنYOLO كاشف كائنات قوي بحت، فإن Ultralytics يوفر مجموعة أوسع من القدرات التي تتطلبها مشاريع الذكاء الاصطناعي الحديثة.
- تعدد الاستخدامات: بالإضافة إلى المربعات المحددة البسيطة، Ultralytics تقسيم الحالات وتقدير الوضع والتصنيف واكتشاف المربعات المحددة الموجهة (OBB).YOLO بشكل أساسي على الاكتشاف القياسي.
- النشر: يتم تصدير Ultralytics بسلاسة إلى تنسيقات مثل TensorRTو CoreML و TFLite و OpenVINO أمر واحد.
- دعم المجتمع: مع ملايين المستخدمين، يوفر Ultralytics موارد شاملة وبرامج تعليمية وتكاملات مع أطراف ثالثة لا يمكن لمستودعات الأبحاث أن تضاهيها.
الجيل القادم: YOLO26
بالنسبة للمطورين الذين أعجبوا بكفاءة النماذج القائمة على NAS ولكنهم يحتاجون إلى سهولة استخدام YOLOv5 فإن YOLO26 هو الخلف الموصى به. تم إصداره في عام 2026، وهو يجمع بين أفضل ما في كلا العالمين.
- NMS من البداية إلى النهاية: مثل الاختراقات الأكاديمية الحديثة، تزيل YOLO26 تقنية Non-Maximum Suppression (NMS)، مما يبسط عمليات النشر.
- مُحسِّن MuSGD: مستوحى من تدريب نماذج اللغات الكبيرة (LLM)، يضمن هذا المُحسِّن الهجين تقاربًا مستقرًا.
- تحسين الحافة: YOLO26 أسرع بنسبة تصل إلى 43٪ على وحدات المعالجة المركزية (CPU)، مما يجعله الخيار الأفضل للحوسبة الطرفية مقارنةً بـ YOLOv5 YOLO.
الخلاصة
YOLO هو مساهمة ممتازة في مجال أبحاث الرؤية الحاسوبية، حيث يبرهن على قوة البحث في الهندسة العصبية والتقطير. وهو خيار قوي للباحثين الذين يسعون إلى دراسة أساليب البحث المتقدمة في الهندسة أو الحصول على أقصى دقة من قيود الأجهزة المحددة حيث لا تشكل تعقيدات التدريب عائقًا.
YOLOv5، وخليفته الحديثة YOLO26، لا يزالان الخيار المفضل لجميع عمليات النشر الإنتاجية تقريبًا. يضمن الجمع بين الاستخدام المنخفض للذاكرة، والدعم الشامل للمهام (التجزئة، الوضع، OBB)، Ultralytics القوية انتقال المشاريع من مرحلة النموذج الأولي إلى مرحلة الإنتاج بأقل قدر من الصعوبات.
بالنسبة لأولئك الذين يحتاجون إلى أحدث ما توصلت إليه التكنولوجيا من حيث الأداء والميزات، نوصي بشدة باستكشاف YOLO26، الذي يوفر الكفاءة الشاملة التي يحبها الباحثون مع سهولة الاستخدام Ultralytics بها Ultralytics
مزيد من القراءة
- استكشف أحدث وثائق YOLO26.
- تحقق من مستودع YOLOv5 .
- تعرف على أساسيات الكشف عن الكائنات في الوقت الفعلي.
- قارن بين طرازات أخرى مثل RT-DETR للحصول على حلول تعتمد على المحولات.