YOLOv9 مقابل YOLOv10: مقارنة فنية للكشف عن الأجسام
يعد اختيار نموذج الكشف عن الكائنات المناسب قرارًا حاسمًا لأي مشروع رؤية حاسوبية، مما يؤثر بشكل مباشر على الأداء والسرعة وكفاءة الموارد. تستمر سلسلة YOLO في دفع حدود الممكن. تقدم هذه الصفحة مقارنة فنية مفصلة بين نموذجين حديثين: YOLOv9 و YOLOv10. سنقوم بتحليل الابتكارات المعمارية وقياسات الأداء وحالات الاستخدام المثالية لمساعدتك في اختيار أفضل نموذج لاحتياجاتك الخاصة، مع موازنة عوامل مثل الدقة و سرعة الاستدلال والتكلفة الحسابية.
YOLOv9: معلومات التدرج القابلة للبرمجة للتعلم المحسن
YOLOv9، الذي تم تقديمه في فبراير 2024، هو تقدم كبير في الكشف عن الأجسام يعالج مشكلة فقدان المعلومات في الشبكات العصبية العميقة. تضمن بنيته الجديدة الحفاظ على البيانات الهامة في جميع أنحاء النموذج، مما يؤدي إلى نتائج دقيقة للغاية.
تفاصيل فنية:
- المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
- المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
- التاريخ: 2024-02-21
- Arxiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- المستندات: https://docs.ultralytics.com/models/yolov9/
البنية والميزات الرئيسية
يقدم YOLOv9 مفهومين رائدين:
- معلومات التدرج القابلة للبرمجة (PGI): تعالج هذه الآلية تحدي فقدان المعلومات أثناء تدفق البيانات عبر طبقات الشبكة العميقة. من خلال إنشاء تدرجات موثوقة، تضمن PGI قدرة النموذج على التعلم بفعالية وإجراء تحديثات دقيقة، وهو أمر بالغ الأهمية لاكتشاف الكائنات المعقدة.
- شبكة تجميع الطبقات الفعالة المعممة (GELAN): يتميز YOLOv9 ببنية شبكة جديدة، GELAN، وهي تصميم عالي الكفاءة يعمل على تحسين استخدام المعلمات والكفاءة الحسابية. يتيح ذلك لـ YOLOv9 تحقيق أداء من الدرجة الأولى دون أن يكون كبيرًا أو بطيئًا بشكل مفرط.
نقاط القوة
- دقة عالية: يضع YOLOv9 معيارًا عاليًا للدقة، حيث يحقق أكبر متغير له، YOLOv9-E، نتائج mAP متطورة على مجموعة بيانات COCO.
- الحفاظ على المعلومات: إن الابتكار الأساسي لـ PGI يقلل بشكل فعال من مشكلة عنق الزجاجة المعلوماتي، مما يؤدي إلى تحسين تعلم النموذج وأدائه.
- هندسة معمارية فعالة: يوفر GELAN توازنًا ممتازًا بين السرعة والدقة، مما يجعل YOLOv9 تنافسيًا للغاية من حيث الأداء لكل معلمة.
- نظام Ultralytics البيئي: عند استخدامه داخل إطار عمل Ultralytics، يستفيد YOLOv9 من تجربة مستخدم مبسطة و واجهة برمجة تطبيقات Python بسيطة و وثائق شاملة. يضمن النظام البيئي تدريبًا فعالاً مع أوزان مُدرَّبة مسبقًا متاحة بسهولة وتطويرًا نشطًا ودعمًا قويًا من المجتمع، وعادةً ما تكون متطلبات الذاكرة أقل مقارنة بأنواع النماذج الأخرى مثل المحولات.
نقاط الضعف
- نموذج أحدث: باعتباره إصدارًا حديثًا، فإن نطاق الأمثلة التي ساهم بها المجتمع وعمليات التكامل مع الجهات الخارجية لا يزال في ازدياد مقارنة بالنماذج الأكثر رسوخًا.
- التعقيد: يضيف مفهوم PGI الجديد، على الرغم من قوته، طبقة من التعقيد المعماري مقارنةً بالتصميمات الأكثر وضوحًا.
حالات الاستخدام المثالية
يعد YOLOv9 خيارًا ممتازًا للتطبيقات التي يكون فيها تحقيق أعلى دقة ممكنة هو الهدف الأساسي:
- الروبوتات المتقدمة: للمهام المعقدة التي تتطلب اكتشافًا للأجسام بدقة في البيئات الديناميكية.
- تحليل الصور عالي الدقة: مثالي لسيناريوهات مثل تحليل صور الأقمار الصناعية حيث التفاصيل هي الأهم.
- أنظمة السلامة الحرجة: تطبيقات في القيادة الذاتية أو أنظمة الأمان المتقدمة حيث يمكن أن تكون الدقة بالغة الأهمية.
YOLOv10: كفاءة شاملة في الوقت الفعلي
YOLOv10، الذي تم إصداره في مايو 2024 بواسطة باحثين في جامعة Tsinghua، مصمم لتحقيق أقصى قدر من الكفاءة والسرعة. ويحقق ذلك عن طريق إعادة تصميم المكونات الرئيسية لبنية YOLO، وعلى الأخص، عن طريق إلغاء الحاجة إلى معالجة ما بعد تثبيط غير الأقصى (NMS).
تفاصيل فنية:
- المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
- المنظمة: جامعة تسينغ هوا
- التاريخ: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- المستندات: https://docs.ultralytics.com/models/yolov10/
البنية والميزات الرئيسية
تتمحور فلسفة تصميم YOLOv10 حول الكفاءة الشاملة:
- تدريب بدون NMS: يستخدم YOLOv10 تعيينات ثنائية متسقة أثناء التدريب، مما يسمح له بإنتاج تنبؤات نظيفة بدون خطوة NMS. هذا يقلل بشكل كبير من زمن الوصول للاستدلال ويبسط مسار النشر.
- تصميم شامل مدفوع بالكفاءة والدقة: تم تحسين تصميم النموذج من الأعلى إلى الأسفل. ويشمل ذلك رأس تصنيف خفيف الوزن، وتقليل أبعاد مفصول مكانيًا وقنويًا للحفاظ على المعلومات بكفاءة، وتصميم كتلة موجه بالرتبة للقضاء على التكرار الحسابي.
نقاط القوة
- كفاءة وسرعة فائقة: مُحسَّن للحد الأدنى من زمن الوصول والتكلفة الحسابية، ممّا يجعله أحد أسرع أدوات الكشف عن الكائنات المتاحة.
- End-to-End Deployment: يزيل التصميم الخالي من NMS النفقات العامة للمعالجة اللاحقة، ممّا يتيح الكشف الشامل الحقيقي في خطوة واحدة.
- أداء ممتاز لكل واط: إن بصمته الحاسوبية والذاكرة المنخفضة تجعله مثاليًا للأجهزة ذات القدرة المحدودة.
- تكامل Ultralytics: تم دمج YOLOv10 بالكامل في نظام Ultralytics البيئي، مما يمنح المستخدمين نظامًا أساسيًا تتم صيانته جيدًا وسهل الاستخدام. يتضمن ذلك واجهة برمجة تطبيقات بسيطة و وثائق شاملة والوصول إلى المجموعة الكاملة من أدوات Ultralytics.
نقاط الضعف
- نموذج حديث جدًا: باعتباره أحدث نموذج في السلسلة، لا تزال موارد المجتمع وأمثلة النشر الواقعية قيد التراكم.
- تخصص المهمة: YOLOv10 متخصص للغاية في اكتشاف الأجسام. يفتقر إلى المرونة المدمجة للمهام الأخرى مثل تجزئة المثيلات أو تقدير الوضع الأصلية في نماذج مثل Ultralytics YOLOv8.
حالات الاستخدام المثالية
يتفوق YOLOv10 في التطبيقات التي يكون فيها الأداء والكفاءة في الوقت الفعلي أمرًا بالغ الأهمية:
- الحوسبة الطرفية: مثالية للنشر على الأجهزة ذات الموارد المحدودة مثل NVIDIA Jetson والمنصات المحمولة.
- تحليلات الفيديو عالية السرعة: التطبيقات التي تحتاج إلى كشف فوري للأشياء في تدفقات الفيديو، مثل مراقبة حركة المرور أو تحليلات الألعاب الرياضية الحية.
- الأنظمة المحمولة والمدمجة: التكامل في التطبيقات حيث السرعة واستهلاك الطاقة عاملان حاسمان لتجربة المستخدم.
مقارنة الأداء: YOLOv9 ضد YOLOv10
يكمن الاختلاف الرئيسي بين YOLOv9 و YOLOv10 في أولويات التصميم الخاصة بهما. تركز YOLOv9 على زيادة الدقة من خلال تصميمات معمارية متطورة، بينما تم تصميم YOLOv10 لتحقيق كفاءة حسابية لا مثيل لها وزمن انتقال منخفض.
يوضح الجدول أدناه أنه في حين أن أكبر نموذج، YOLOv9-E، يحقق أعلى mAP إجمالي، فإن نماذج YOLOv10 تقدم باستمرار سرعة وكفاءة أفضل للمعلمات عند مستويات دقة مماثلة. على سبيل المثال، تتمتع YOLOv10-B بزمن انتقال أقل بنسبة 46٪ وعدد أقل من المعلمات بنسبة 25٪ من YOLOv9-C للحصول على أداء مماثل. هذا يجعل YOLOv10 خيارًا قويًا للغاية للتطبيقات التي تكون فيها سرعة الاستدلال بمثابة عنق الزجاجة الحرج.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
الخلاصة: أي نموذج يجب أن تختاره؟
يعتمد اختيارك بين YOLOv9 و YOLOv10 بشكل كامل على أولويات مشروعك.
-
اختر YOLOv9 إذا كان الشرط الأساسي الخاص بك هو أقصى قدر من الدقة. إنه مثالي للمهام المعقدة حيث الدقة أمر لا يقبل المساومة ويمكنك استيعاب زيادة طفيفة في النفقات الحسابية.
-
اختر YOLOv10 إذا كان الشرط الأساسي الخاص بك هو السرعة والكفاءة في الوقت الفعلي. إن بنيته الخالية من NMS تجعله الخيار الأفضل للتطبيقات منخفضة الكمون والنشر على الأجهزة ذات الموارد المحدودة.
يمثل كلا النموذجين أحدث ما توصلت إليه تقنيات الكشف عن الأجسام وهما خياران ممتازان ضمن نطاقاتهما الخاصة. يضمن تكاملهما في نظام Ultralytics البيئي أن يتمكن المطورون والباحثون من الاستفادة من هذه الأدوات القوية بسهولة ودعم قوي.
استكشف نماذج أخرى
بالنسبة للمستخدمين الذين قد لا تتوافق احتياجاتهم تمامًا مع YOLOv9 أو YOLOv10، يقدم نظام Ultralytics البيئي بدائل قوية أخرى. يظل Ultralytics YOLOv8 خيارًا رئيسيًا لتوازنه الاستثنائي بين الأداء والتنوع، ودعم مهام مثل التجزئة والتصنيف وتقدير الوضعية خارج الصندوق. بالنسبة لأولئك الذين يبحثون عن أحدث التطورات المطلقة، يعتمد Ultralytics YOLO11 على سابقاته لتحديد معايير جديدة في الأداء والكفاءة. يمكنك استكشاف المزيد من المقارنات، مثل YOLOv9 مقابل YOLOv8 و YOLOv8 مقابل YOLOv10، للعثور على النموذج المثالي لمشروعك.