YOLO YOLOv5: مقارنة تقنية بين البنية والأداء
في مجال الرؤية الحاسوبية سريع التطور، يعد اختيار بنية الكشف عن الأجسام المناسبة أمراً بالغ الأهمية لتحقيق التوازن بين الدقة والسرعة وكفاءة الموارد. يقدم هذا الدليل مقارنة تقنية شاملة بين YOLO وهو نموذج قائم على البحث عن البنية العصبية (NAS) من مجموعة Alibaba Group، و YOLOv5، النموذج الأسطوري الذي تم اعتماده على نطاق واسع من Ultralytics.
ملخص تنفيذي
بينما يقدم YOLO مفاهيم مبتكرة مثل البحث عن البنية العصبية (NAS) وإعادة المعلمات بشكل مكثف للحصول على دقة أعلى في مجموعة COCO YOLOv5 يظل المعيار الصناعي من حيث سهولة الاستخدام، والاستعداد للنشر، ودعم النظام البيئي.
للمطورين الباحثين عن أحدث التقنيات في عام 2026، يعد YOLO26 هو مسار الترقية الموصى به. فهو يجمع YOLOv5 سهولة استخدام YOLOv5 والابتكارات المعمارية مثل التصميم الشامل NMS ومحسن MuSGD، متفوقًا على كلا النموذجين القديمين في الكفاءة والسرعة.
YOLO: الهندسة المعمارية والابتكارات
تم تطويرYOLO من قبل باحثين في مجموعة Alibaba،YOLO على تجاوز حدود السرعة والدقة من خلال تصميم البنية التلقائي.
- المؤلفون: شيانزه شو، يي تشي جيانغ، وي هوا تشن، ييلون هوانغ، يوان تشانغ، وشيو يو صن
- المنظمة: مجموعة علي بابا
- التاريخ: 23 نوفمبر 2022
- روابط: Arxiv، GitHub
الميزات المعمارية الرئيسية
- البحث عن البنية العصبية (NAS): على عكس البنى الأساسية المصممة يدويًا،YOLO MAE-NAS (طريقة التوقف المبكر المساعد) لاكتشاف البنى الأساسية الفعالة المصممة خصيصًا لمختلف قيود زمن الاستجابة.
- RepGFPN (Rep-parameterized Generalized FPN الفعال): يستخدم عنق دمج ميزات جديد يعمل على تحسين مسار تدفق المعلومات عبر مستويات مختلفة، مستفيدًا من إعادة المعلمات للحفاظ على سرعة الاستدلال مع تعظيم ثراء الميزات.
- ZeroHead: رأس كشف خفيف الوزن يقلل بشكل كبير من العبء الحسابي مقارنة بالرؤوس التقليدية غير المقترنة.
- AlignedOTA: استراتيجية ديناميكية لتخصيص التسميات تحل مشكلات عدم التوافق بين مهام التصنيف والانحدار أثناء التدريب.
نقاط القوة والضعف
YOLO في المعايير الأكاديمية، وغالبًا ما يُظهر mAP أعلى لعدد معين من المعلمات مقارنةً YOLO الأقدم. ومع ذلك، فإن اعتماده على هياكل NAS المعقدة قد يجعل من الصعب تعديله أو ضبطه للأجهزة المخصصة. كما أن طريقة التدريب "التقطير أولاً" — التي تتطلب غالبًا نموذجًا تعليميًا ثقيلًا — قد تعقّد عملية التدريب للمستخدمين ذوي الموارد المحدودة.
YOLOv5: المعيار الصناعي
أصدرت Ultralytics عام 2020 YOLOv5 تجربة المستخدم في مجال اكتشاف الأجسام. لم يكن مجرد نموذج، بل كان إطار عمل كامل وجاهز للإنتاج.
- المؤلف: جلين جوتشر
- المؤسسة:Ultralytics
- التاريخ: 26 يونيو 2020
- روابط:YOLOv5 ، GitHub
الميزات المعمارية الرئيسية
- CSP-Darknet Backbone: يستخدم شبكات Cross Stage Partial لتعزيز تدفق التدرج وتقليل الحساب، وهو تصميم قوي مصنوع يدويًا يوازن بين العمق والعرض بشكل فعال.
- PANet Neck: تعمل شبكة تجميع المسارات على تحسين تدفق المعلومات بشكل كبير، مما يساعد النموذج على تحديد مواقع الكائنات بشكل أفضل من خلال دمج الميزات من مستويات العمود الفقري المختلفة.
- توسيع الموزاييك: تقنية رائدة لتوسيع البيانات تجمع أربع صور تدريبية في صورة واحدة، مما يسمح للنموذج بتعلم كيفية detect بمقاييس وسياقات مختلفة بفعالية.
- التثبيت التلقائي: يحسب تلقائيًا أفضل مربعات التثبيت لمجموعة البيانات المحددة الخاصة بك، مما يبسط عملية الإعداد للبيانات المخصصة.
نقاط القوة والضعف
أكبر قوة YOLOv5 هي عالميتها. فهي تعمل على كل شيء بدءًا من خوادم السحابة إلى Raspberry Pis و iPhones عبر CoreML. وتضمن استراتيجية التدريب "bag-of-freebies" الخاصة بها أداءً عاليًا دون إعدادات معقدة. وعلى الرغم من أن mAP الخام mAP COCO من نماذج البحث الأحدث مثلYOLO COCO موثوقيتها في العالم الحقيقي وقابليتها للتصدير ودعم المجتمع الهائل لها تجعلها ذات صلة كبيرة.
معايير الأداء
يُقارن الجدول التالي أداء كلا النموذجين. لاحظ أنYOLO mAP تحسين NAS المكثف، بينما YOLOv5 بين السرعة وسهولة التصدير.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
سياق الأداء
بينماYOLO معدل mAP قة متوسط أعلى mAP أحجام مماثلة، فإن سرعة الاستدلال في العالم الواقعي تعتمد غالبًا على دعم الأجهزة لطبقات معينة (مثل كتل RepVGG) والتي قد تتطلب خطوات تصدير محددة لتعمل بشكل صحيح. تم تحسين العمليات القياسية YOLOv5 بشكل شامل عبر جميع محركات الاستدلال تقريبًا.
توصيات حالات الاستخدام
عند الاختيار بين هاتين البنيتين، ضع في اعتبارك الاحتياجات المحددة لبيئة النشر لديك.
السيناريوهات المثالية لـ DAMO-YOLO
- البحث الأكاديمي: إذا كان هدفك هو دراسة NAS أو الحصول على آخر 0.1٪ mAP فإن بنيةYOLO المبتكرة توفر أرضية خصبة للتجريب.
- GPU عالي الأداء: حيث تكون قيود الذاكرة والحوسبة محدودة، والمقياس الأساسي هو الدقة في المعايير المعقدة.
السيناريوهات المثالية لـ Ultralytics YOLOv5
- النشر على الحافة: بالنسبة للأجهزة مثل NVIDIA أو Raspberry Pi، يتم تصدير بنية YOLOv5 البسيطة بسلاسة إلى TensorRT و TFLite.
- النماذج الأولية السريعة: تتيح لك تجربة "من الصفر إلى القمة" التدريب على مجموعة بيانات مخصصة ورؤية النتائج في غضون دقائق.
- أنظمة الإنتاج: الاستقرار هو المفتاح. YOLOv5 اختبار YOLOv5 في ملايين عمليات النشر، مما يقلل من مخاطر الأعطال غير المتوقعة في خطوط الإنتاج.
ميزة Ultralytics
بينماYOLO مساهمات بحثية مثيرة للاهتمام، يوفر Ultralytics مزايا مميزة للمطورين الذين يعملون على إنشاء تطبيقات واقعية.
1. سهولة الاستخدام والنظام البيئي
توحد Ultralytics سير العمل بأكمله. يمكنك إدارة مجموعات البيانات وتدريب النماذج في السحابة ونشرها على مختلف النقاط النهائية دون مغادرة النظام البيئي. الوثائق شاملة والمجتمع نشط، مما يضمن عدم تعرضك لمشكلة طويلة الأمد.
2. تنوع لا يمكن اكتشافه
YOLO في الأساس أداة لكشف الأجسام. في المقابل، تدعم Ultralytics مجموعة أوسع من المهام الأساسية لتطبيقات الذكاء الاصطناعي الحديثة:
- تجزئة المثيل: إخفاء دقيق للأجسام على مستوى البكسل.
- تقدير الوضع: تتبع النقاط الرئيسية على البشر أو الحيوانات.
- مربع الحدود الموجه (OBB): الكشف عن الأجسام الدوارة مثل السفن في صور الأقمار الصناعية.
- تصنيف الصور: تصنيف الصورة بأكملها.
3. كفاءة الذاكرة والموارد
تشتهرYOLO Ultralytics YOLO بكفاءتها في استخدام الذاكرة. على عكس البنى الهندسية الثقيلة بالمحولات أو خطوط التقطير المعقدة التي تستهلك ذاكرة VRAM، يمكن في كثير من الأحيان تدريب نماذج مثل YOLOv5 YOLO26 على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين (مثل RTX 3060)، مما يتيح الوصول إلى تدريب الذكاء الاصطناعي المتطور للجميع.
4. كفاءة التدريب
غالبًا ما يتضمن تدريبYOLO مرحلة "تقطير" معقدة تتطلب نموذجًا مدرسًا مدربًا مسبقًا. تستخدم Ultralytics نهجًا مبسطًا يسمى "bag-of-freebies". تقوم بتحميل الأوزان المدربة مسبقًا، وتشير إلى تكوين البيانات الخاصة بك، ويبدأ التدريب على الفور باستخدام معلمات فائقة محسّنة.
التطلع إلى المستقبل: YOLO26
إذا كنت تبدأ مشروعًا جديدًا في عام 2026، فإن الفائز الواضح ليس أيًا من الخيارات المذكورة أعلاه. YOLO26 يمثل قمة الكفاءة.
- NMS من البداية إلى النهاية: من خلال إزالة Non-Maximum Suppression (NMS)، تبسط YOLO26 منطق النشر وتقلل من تباين زمن الاستدلال.
- MuSGD Optimizer: مستوحى من تدريب نماذج اللغة الكبيرة (LLM)، يضمن هذا المحسّن تقاربًا مستقرًا وأوقات تدريب أسرع.
- تحسين الحواف: مع إزالة Distribution Focal Loss (DFL) والكتل المحسّنة، يحقق YOLO26 استنتاجًا أسرع بنسبة تصل إلى 43٪ على وحدات المعالجة المركزية (CPU) مقارنةً بالأجيال السابقة، مما يجعله الخيار الأفضل لتطبيقات الأجهزة المحمولة وإنترنت الأشياء.
مثال على الكود: الاستدلال باستخدام Ultralytics
تتيح لك بساطة Ultralytics تطبيقات Ultralytics التبديل بين أجيال النماذج بسهولة.
from ultralytics import YOLO
# Load the latest state-of-the-art model
model = YOLO("yolo26n.pt")
# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize and save the results
for result in results:
result.show() # Display to screen
result.save(filename="output.jpg") # Save image to disk
الخلاصة
YOLOv5 كلYOLO YOLOv5 دورًا مهمًا في تاريخ اكتشاف الكائنات.YOLO إمكانات البحث في الهندسة العصبية، بينما YOLOv5 معايير الاستخدام والنشر. ومع ذلك، فإن هذا المجال يتطور بسرعة. بالنسبة لأولئك الذين يطلبون أفضل توازن بين السرعة والدقة وتجربة المطور، فإن Ultralytics هو الخيار الأمثل لتطبيقات الرؤية الحاسوبية الحديثة.
لمزيد من الاستكشاف، يمكنك مراجعة المقارنات مع بنى أخرى مثل YOLO11 EfficientDet أو RT-DETR YOLOv8.