Link to this sectionYOLOv5 في مقابل YOLOv9: مقارنة تقنية متعمقة#
شهد مشهد الرؤية الحاسوبية واكتشاف الأشياء في الوقت الفعلي تطورات ملحوظة على مدى السنوات القليلة الماضية. ويعد التنقل بين خيارات النماذج الراسخة والمختبرة ميدانياً وبين معماريات البحث الأحدث تحدياً شائعاً لمهندسي تعلم الآلة. يقدم هذا الدليل مقارنة تقنية شاملة بين نموذجين مؤثرين للغاية في عائلة YOLO: YOLOv5 و YOLOv9.
سواء كنت تقوم بالنشر على أجهزة حافة مقيدة، أو تبحث في استخراج الميزات عالي الدقة، أو تبني خطوط أنابيب معقدة لـ اكتشاف الأشياء، فإن فهم الفروق الدقيقة في المعمارية، ومقاييس الأداء، واختلافات النظام البيئي لهذه النماذج أمر بالغ الأهمية.
Link to this sectionنظرة عامة على النماذج#
قبل الغوص في المقارنات المعمارية، من المفيد فهم أصول وأهداف كل نموذج.
Link to this sectionUltralytics YOLOv5#
تم تطوير YOLOv5 بواسطة Glenn Jocher وإصداره بواسطة Ultralytics في 26 يونيو 2020، وقد شكل نقطة تحول في كيفية تفاعل المطورين مع نماذج الرؤية. من خلال تبني إطار العمل PyTorch بالكامل، استبدل YOLOv5 خطوات التجميع المعقدة لنماذج Darknet السابقة بتجربة مستخدم بديهية تعتمد على Python أولاً.
- المؤلف: Glenn Jocher
- المنظمة: Ultralytics
- التاريخ: 26-06-2020
- GitHub: مستودع YOLOv5
- التوثيق: توثيق YOLOv5
يشتهر YOLOv5 بـ سهولة الاستخدام والأداء المستقر عبر بيئات الأجهزة المختلفة. وهو يدعم ليس فقط الاكتشاف، ولكن أيضاً تصنيف الصور و تجزئة المثيلات.
Link to this sectionYOLOv9#
تم تقديم YOLOv9 بواسطة Chien-Yao Wang و Hong-Yuan Mark Liao من معهد علوم المعلومات في أكاديمية سينيكا، تايوان، ويركز بشكل كبير على النظرية المعمارية لتخفيف مشاكل اختناق المعلومات في الشبكات العصبية العميقة.
- المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
- المنظمة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان
- التاريخ: 21-02-2024
- Arxiv: 2402.13616
- GitHub: مستودع YOLOv9
- التوثيق: توثيق YOLOv9
يعتمد جوهر YOLOv9 على ابتكارين نظريين رئيسيين: معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN). تساعد هذه المفاهيم النموذج على الاحتفاظ بالميزات المكانية الحيوية عبر طبقات الشبكة العميقة.
بينما يعد كل من YOLOv5 و YOLOv9 نماذج قوية، فإن YOLO26 الذي تم إصداره حديثاً يمثل التوازن الأمثل بين السرعة والدقة. بفضل تصميمه المتكامل والخالي من NMS وسرعة استنتاج CPU أسرع بنسبة تصل إلى 43%، يوصى بشدة باستخدام YOLO26 للحوسبة المتطورة وعمليات النشر الإنتاجية الحديثة.
Link to this sectionالاختلافات المعمارية والتقنية#
يعد فهم ما يحرك نماذج الرؤية هذه تحت غطاء المحرك أمراً حيوياً لتحسين استراتيجيات نشر النموذج.
Link to this sectionاستخراج الميزات والاحتفاظ بالمعلومات#
يستخدم YOLOv5 عموداً فقرياً من نوع شبكة الأجزاء المتقاطعة (CSPNet)، والذي يقلل بشكل فعال من العبء الحسابي مع الحفاظ على تدفق تدرج دقيق أثناء الانتشار العكسي. هذا التصميم محسن للغاية لـ عمليات GPU التقليدية ويضمن متطلبات ذاكرة أقل أثناء التدريب مقارنة ببدائل Transformer الثقيلة.
يقدم YOLOv9 معمارية GELAN، وهي معمارية عامة توسع مبادئ CSPNet. إلى جانب PGI—وهو فرع عكسي مساعد—يضمن YOLOv9 أن الطبقات العميقة لا تفقد البيانات الدلالية الضرورية لدوال الهدف الدقيقة. يسمح هذا لـ YOLOv9 بتحقيق دقة عالية، خاصة على الأشياء الصغيرة، على الرغم من أن التفرع المساعد المعقد يمكن أن يعقد أحياناً خطوط أنابيب التصدير إلى أجهزة الحافة المقيدة للغاية.
Link to this sectionمتطلبات الذاكرة وكفاءة التدريب#
When it comes to training efficiency, YOLOv5 remains incredibly robust. The well-maintained Ultralytics ecosystem ensures that YOLOv5 models consume significantly less CUDA memory, allowing researchers to maximize batch sizes on consumer-grade GPUs. While YOLOv9 achieves excellent parameter efficiency (high accuracy relative to its size), its training process can be more resource-intensive if not utilizing optimized frameworks. Fortunately, integrating YOLOv9 into the Ultralytics API brings it closer to parity with YOLOv5's streamlined resource management.
Link to this sectionالأداء والمقاييس#
لتقييم هذه المعماريات بموضوعية، نقارن أداءها على مجموعات بيانات قياسية مثل COCO. فيما يلي تفصيل دقيق للمقاييس مثل mAP (متوسط الدقة)، وسرعة الاستنتاج، وعدد المعلمات.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
كما يوضح الجدول، يحقق YOLOv9 دقة خام أعلى في مستويات متكافئة، مما يعكس معماريته الأحدث. ومع ذلك، يحافظ YOLOv5n على زمن انتقال TensorRT منخفض للغاية يبلغ 1.12 مللي ثانية، مما يسلط الضوء على قوته الدائمة لتطبيقات حوسبة الحافة عالية السرعة والمحلية.
Link to this sectionمنهجيات التدريب وسهولة الاستخدام#
تكمن الميزة الحقيقية للاستفادة من الرؤية الحاسوبية اليوم في سهولة الوصول إلى مجموعة الأدوات.
Link to this sectionميزة Ultralytics#
على الرغم من أن مستودعات الأبحاث الأصلية لنماذج مثل YOLOv9 تعتبر أساسية، إلا أنها غالباً ما تأتي مع مصفوفات تبعية معقدة ونصوص برمجية جاهزة. تقوم واجهة برمجة تطبيقات Python من Ultralytics بتجريد هذه التعقيدات تماماً. مع نظام Ultralytics البيئي، يمكنك تدريب وتقييم وتصدير كل من YOLOv5 و YOLOv9 باستخدام بناء جملة موحد ومتطابق.
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model for fast deployment
model_v5 = YOLO("yolov5s.pt")
# Or leverage a YOLOv9 model for high-fidelity accuracy
model_v9 = YOLO("yolov9c.pt")
# Train seamlessly on custom data with automatic MLflow logging
results = model_v9.train(data="coco8.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX
model_v9.export(format="onnx")يوفر نهج واجهة برمجة التطبيقات الواحدة هذا تنوعاً هائلاً، حيث يدعم ليس فقط الاكتشاف، بل أيضاً تقدير الوضعية و صناديق التحديد الموجهة (OBB) اعتماداً على النموذج المختار. علاوة على ذلك، تم دمج التكاملات القوية مع أدوات مثل Comet ML و Weights & Biases مباشرة في حلقة التدريب.
Link to this sectionحالات الاستخدام المثالية والتطبيقات الواقعية#
يعتمد الاختيار بين هذه المعماريات إلى حد كبير على قيود أجهزتك والدقة التي يتطلبها مجال تطبيقك.
Link to this sectionمتى تختار YOLOv5#
YOLOv5 هو مخضرم تم اختباره في المعارك ويتألق في عمليات النشر التي تعطي الأولوية للاستقرار، وبصمات الذاكرة المنخفضة، وتوافق التصدير الفائق.
- نشر الأجهزة المحمولة: يعد تصدير YOLOv5 إلى TFLite أو CoreML للاستنتاج على الجهاز على الهواتف الذكية الأقدم سلساً للغاية.
- أجهزة الحافة القديمة: بالنسبة لأجهزة مثل Raspberry Pi أو وحدات NVIDIA Jetson Nano من الجيل الأول، تضمن الالتواءات المباشرة لـ YOLOv5 معدلات إطارات متسقة لتطبيقات مثل إدارة مواقف السيارات الذكية.
- النماذج الأولية السريعة: التوافر الواسع لدروس المجتمع، و الأوزان المدربة مسبقاً المخصصة، والتوافق الهائل مع مجموعات البيانات يجعلها أسرع طريقة للتحقق من إثبات المفهوم.
Link to this sectionمتى تختار YOLOv9#
يعد YOLOv9 مثالياً للسيناريوهات التي يكون فيها التقاط التفاصيل المعقدة وتقليل السلبيات الكاذبة أمراً بالغ الأهمية، حتى لو تطلب ذلك عبئاً حسابياً أكبر قليلاً.
- Aerial and Satellite Imagery: The PGI framework is highly adept at maintaining the fidelity of small objects, making YOLOv9 excellent for drone-based agricultural monitoring.
- تشخيص التصوير الطبي: عند اكتشاف تشوهات أو آفات دقيقة في عمليات المسح عالية الدقة، يوفر تدفق التدرج الدقيق لـ GELAN ميزة ضرورية في الاستدعاء.
- تحليلات التجزئة المتطورة: يستفيد تتبع المنتجات المتداخلة على الأرفف الكثيفة بشكل كبير من قدرات الاحتفاظ بالميزات المتفوقة في YOLOv9.
Link to this sectionتوسيع آفاقك#
بينما توفر مقارنة YOLOv5 و YOLOv9 رؤية واضحة لكيفية تطور المعماريات من عام 2020 إلى عام 2024، فإن مجال الذكاء الاصطناعي يتحرك بشكل أسرع من أي وقت مضى. بالنسبة للمطورين الذين يسعون للحصول على أقصى حدود الأداء، نشجع بشدة على استكشاف أحدث نماذج YOLO26. من خلال استبدال القمع غير الأقصى التقليدي بـ تصميم أصلي خالٍ من NMS واستخدام محسن MuSGD المتقدم، يسد YOLO26 الفجوة بين دقة مستوى البحث وسرعة مستوى الإنتاج. مع إزالة DFL (إزالة خسارة التوزيع البؤري للتصدير المبسط وتوافق أفضل مع أجهزة الحافة/الأجهزة منخفضة الطاقة)، يحقق YOLO26 استنتاج CPU أسرع بنسبة تصل إلى 43%، مما يجعله مثالياً للحوسبة المتطورة. بالإضافة إلى ذلك، يوفر ProgLoss + STAL دوال خسارة محسنة مع تحسينات ملحوظة في التعرف على الأشياء الصغيرة، وهو أمر بالغ الأهمية لإنترنت الأشياء والروبوتات والصور الجوية.
قد تكون مهتماً أيضاً بمقارنة هذه المعماريات مقابل نماذج أخرى متطورة مثل RT-DETR أو YOLO11 القادر للغاية. يضمن استخدام إطار عمل Ultralytics الموحد أنه بغض النظر عن النموذج الذي تختاره، يظل خط أنابيب التطوير الخاص بك نظيفاً وفعالاً وجاهزاً للتوسع.