مقارنة النماذج: YOLOv8 مقابل YOLOv7 لاكتشاف الكائنات
يُعد اختيار نموذج الكشف عن الأجسام المناسب أمرًا بالغ الأهمية لتحقيق الأداء الأمثل في مهام رؤية الكمبيوتر. تقدم هذه الصفحة مقارنة فنية بين Ultralytics YOLOv8 و YOLOv7، وهما نموذجان مهمان في هذا المجال. سنقوم بتحليل الفروق الدقيقة في تصميمهما المعماري ومعايير الأداء والتطبيقات المثالية لتوجيه عملية اختيار النموذج الخاص بك، مع تسليط الضوء على المزايا التي يوفرها نظام Ultralytics البيئي. في حين أن كلا النموذجين قد دفعا حالة التكنولوجيا إلى الأمام، يظهر YOLOv8 باعتباره الخيار الأفضل للتطبيقات الحديثة نظرًا لأدائه المحسن وتنوعه وسهولة استخدامه الاستثنائية.
YOLOv8: كفاءة فائقة وقابلية للتكيف
Ultralytics YOLOv8، الذي تم إصداره في عام 2023، هو أحدث نموذج رائد من Ultralytics. إنه يعتمد على نجاحات أسلافه، ويقدم مستوى جديدًا من الأداء والمرونة والكفاءة. كنموذج حديث، تم تصميم YOLOv8 للتفوق في مجموعة واسعة من مهام رؤية الكمبيوتر.
المؤلفون: جلين جوتشر، أيوش شوراسيا، و جينغ تشيو
المنظمة: Ultralytics
التاريخ: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
المستندات: https://docs.ultralytics.com/models/yolov8/
الهندسة المعمارية والتصميم
يتميز YOLOv8 ببنية مُحسَّنة قوية وسهلة الاستخدام في آنٍ واحد. تتضمن التحسينات المعمارية الرئيسية رأس كشف anchor-free جديد وعمودًا فقريًا أكثر كفاءة. يقلل تصميم anchor-free من عدد تنبؤات الصندوق، مما يبسط خطوات المعالجة اللاحقة مثل Non-Maximum Suppression (NMS) ويسرع سرعة الاستدلال. هذا يجعل YOLOv8 أكثر قابلية للتكيف مع مختلف أشكال وأحجام الكائنات دون ضبط المرساة يدويًا.
نقاط القوة
- أداء هو الأفضل على الإطلاق: يقدم YOLOv8 توازنًا استثنائيًا بين الدقة والسرعة، ويتفوق على النماذج السابقة عبر جميع المقاييس. نماذجه الأصغر أسرع وأكثر دقة من متغيرات YOLOv7 المماثلة، في حين أن نماذجه الأكبر تحدد معايير جديدة للدقة.
- تنوع لا مثيل له: على عكس YOLOv7، الذي هو في الأساس كاشف كائنات، فإن YOLOv8 هو إطار عمل موحد يدعم مهام متعددة خارج الصندوق: اكتشاف الكائنات، و تجزئة المثيلات، و تقدير الوضعية، و تصنيف الصور، و اكتشاف الكائنات الموجهة (OBB).
- سهولة الاستخدام: تعطي Ultralytics الأولوية لتجربة مطور مبسطة. يأتي YOLOv8 مع Python API و CLI بسيطين، و توثيق شامل، وتكامل سلس مع أدوات مثل Ultralytics HUB للتدريب والنشر بدون تعليمات برمجية.
- نظام بيئي مُدار بشكل جيد: باعتباره نموذج Ultralytics رسميًا، يستفيد YOLOv8 من التطوير النشط والتحديثات المتكررة ومجتمع مفتوح المصدر قوي. وهذا يضمن الموثوقية والوصول إلى أحدث الميزات والدعم الشامل.
- كفاءة التدريب والذاكرة: تم تصميم نماذج YOLOv8 من أجل التدريب الفعال، وغالبًا ما تتطلب ذاكرة CUDA أقل من التصميمات المعمارية الأخرى مثل المحولات. يتيح توفر الأوزان المُدرَّبة مسبقًا بسهولة على مجموعات بيانات مثل COCO تقاربًا أسرع للبيانات المخصصة.
نقاط الضعف
- باعتباره نموذجًا متقدمًا للغاية، تتطلب متغيرات YOLOv8 الأكبر حجمًا موارد حسابية كبيرة للتدريب، على الرغم من أنها تظل فعالة للغاية بالنسبة لمستوى أدائها.
حالات الاستخدام المثالية
إن أداء YOLOv8 الفائق وتعدد استخداماته يجعله الخيار الأمثل لمجموعة واسعة من التطبيقات، بدءًا من الأجهزة الطرفية وحتى الخوادم السحابية.
- الأتمتة الصناعية في الوقت الفعلي: دعم التحكم في الجودة ومراقبة العمليات في التصنيع من خلال الكشف عالي السرعة والدقة.
- حلول الذكاء الاصطناعي المتقدمة: تمكين التطبيقات المعقدة في الزراعة لمراقبة المحاصيل وفي الرعاية الصحية من أجل تحليل الصور الطبية.
- الأنظمة الذاتية: توفير إدراك قوي للمركبات ذاتية القيادة و الروبوتات.
YOLOv7: معيار في الكشف في الوقت الفعلي
تم تقديم YOLOv7 في عام 2022 كخطوة كبيرة إلى الأمام في كشف الأجسام في الوقت الفعلي، حيث وضعت أحدث المعايير في وقت إصدارها. وركزت على تحسين عمليات التدريب لتحسين الدقة دون زيادة تكاليف الاستدلال.
المؤلفون: Chien-Yao Wang, Alexey Bochkovskiy, و Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
المستندات: https://docs.ultralytics.com/models/yolov7/
الهندسة المعمارية والتصميم
قدم YOLOv7 العديد من الابتكارات المعمارية، بما في ذلك شبكة تجميع الطبقات الفعالة الممتدة (E-ELAN) في العمود الفقري لتحسين كفاءة التعلم. كانت مساهمته الأكثر بروزًا هي مفهوم "حقيبة التدريب المجانية القابلة للتدريب"، وهي استراتيجيات تدريب تعمل على تحسين دقة النموذج دون إضافة إلى حمل الاستدلال. وتشمل هذه التقنيات مثل الرؤوس المساعدة وتعيين الملصقات من الخشن إلى الدقيق.
نقاط القوة
- أداء عالٍ عند الإصدار: قدم YOLOv7 مزيجًا ممتازًا من السرعة والدقة، متفوقًا على الكاشفات الأخرى المتاحة في ذلك الوقت.
- تدريب فعال: سمح مفهوم "حقيبة من الأشياء المجانية" بتحقيق دقة عالية مع إجراءات تدريب مُحسَّنة.
- معيار راسخ: إنه نموذج يحظى بتقدير جيد وقد تم اختباره على نطاق واسع على مجموعات البيانات القياسية مثل MS COCO.
نقاط الضعف
- تنوع محدود: YOLOv7 هو في الأساس كاشف للكائنات. يتطلب توسيعه ليشمل مهام أخرى مثل التجزئة أو تقدير الوضعية تطبيقات منفصلة، غالبًا ما تكون مدفوعة من المجتمع، على عكس النهج المتكامل لـ YOLOv8.
- التعقيد المعماري: يمكن أن تكون تقنيات التدريب والمكونات المعمارية أكثر تعقيدًا للفهم والتعديل مقارنة بالتصميم المبسط لـ YOLOv8.
- أداء أفضل من النماذج الأحدث: على الرغم من قوته، فقد تم تجاوز YOLOv7 في كل من السرعة والدقة بواسطة YOLOv8. يوفر نظام Ultralytics أيضاً تجربة أكثر شمولاً وسهولة في الاستخدام.
حالات الاستخدام المثالية
يظل YOLOv7 نموذجًا قادرًا للتطبيقات التي تم دمجه فيها قبل إصدار البدائل الأحدث.
- أنظمة الأمان في الوقت الفعلي: مناسب للتطبيقات مثل منع السرقة حيث يكون الاكتشاف السريع والدقيق أمرًا أساسيًا.
- المشاريع القديمة: خيار قابل للتطبيق للحفاظ على أو توسيع الأنظمة الحالية المبنية على بنية YOLOv7.
الأداء والمعايير: YOLOv8 ضد YOLOv7
توضح مقارنة الأداء بوضوح التطورات التي تم إحرازها مع YOLOv8. تقدم نماذج YOLOv8 بشكل عام مقايضة أفضل بين الدقة والسرعة.
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
من البيانات، تظهر العديد من الرؤى الرئيسية:
- دقة فائقة: يحقق أكبر نموذج، YOLOv8x، 53.9 mAP، متجاوزًا 53.1 mAP لنموذج YOLOv7x.
- سرعة لا مثيل لها: نماذج YOLOv8 أسرع بشكل ملحوظ، خاصةً على وحدة المعالجة المركزية (CPU). يتميز نموذج YOLOv8n بوقت استدلال يبلغ 80.4 مللي ثانية فقط على وحدة المعالجة المركزية (CPU) مع ONNX، وهو مقياس غير متوفر لـ YOLOv7 ولكنه أسرع بشكل واضح في الممارسة العملية. على وحدة معالجة الرسوميات (GPU)، يحقق YOLOv8n 1.47 مللي ثانية مذهلة مع TensorRT، متجاوزًا كفاءة YOLOv7 بشكل كبير.
- كفاءة أكبر: تحتوي نماذج YOLOv8 على عدد أقل من المعلمات والعمليات الحسابية (FLOPs) للحصول على أداء مماثل أو أفضل. على سبيل المثال، يحقق YOLOv8l نفس خريطة دقة متوسطة (mAP) تقريبًا مثل YOLOv7x (52.9 مقابل 53.1) ولكن مع عدد أقل بكثير من المعلمات (43.7 مليون مقابل 71.3 مليون) والعمليات الحسابية (165.2 مليار مقابل 189.9 مليار).
الخلاصة: لماذا Ultralytics YOLOv8 هو الخيار المفضل
في حين أن YOLOv7 كان نموذجًا هائلاً، فإن YOLOv8 هو الفائز الواضح للمشاريع والتطويرات الجديدة. إن هندسته المعمارية الفائقة وأدائه الحديث وتعدد استخداماته المذهل يجعله الأداة الأقوى والأكثر سهولة في الاستخدام المتاحة للكشف عن الكائنات ومهام رؤية الكمبيوتر الأخرى.
يوفر نظام Ultralytics المتكامل ميزة كبيرة، حيث يقدم تجربة سلسة من التدريب إلى النشر. بالنسبة للمطورين والباحثين الذين يبحثون عن نموذج قوي ومدعوم جيدًا وعالي الأداء، فإن YOLOv8 هو الخيار الأمثل.
استكشف نماذج أخرى
بالنسبة للمهتمين باستكشاف المزيد، توفر Ultralytics مجموعة من النماذج والمقارنات. يرجى الاطلاع على:
- YOLOv8 vs. YOLOv5: قارن YOLOv8 بنموذج آخر واسع الانتشار وفعال.
- YOLOv8 vs. RT-DETR: تعرف على كيفية مقارنة YOLOv8 بالبنى القائمة على المحولات.
- YOLO11 مقابل YOLOv8: استكشف التطورات في أحدث نموذج Ultralytics، YOLO11.