مقارنة النموذج: YOLOv7 مقابل YOLOv8 للكشف عن الأجسام
في المشهد سريع التطور في مجال الرؤية الحاسوبية، وضعت عائلة نماذج "أنت تنظر مرة واحدة فقط"YOLO) باستمرار معيارًا لاكتشاف الأجسام في الوقت الفعلي. ومن المعالم البارزة في هذه السلسلة نموذجا YOLOv7 Ultralytics YOLOv8. وعلى الرغم من أن كلا النموذجين قد تخطى حدود الدقة والسرعة عند إصدارهما، إلا أنهما يمثلان فلسفات تصميمية مختلفة ونضج النظام البيئي.
يوفر هذا الدليل مقارنة تقنية مفصلة لمساعدة المطورين والباحثين على اختيار الأداة المناسبة لاحتياجاتهم الخاصة، بدءًا من البحث الأكاديمي إلى النشر على مستوى الإنتاج.
مقارنة مقاييس الأداء
يعرض الجدول التالي مقارنة مباشرة لمقاييس الأداء بين نموذجي YOLOv7 و YOLOv8 الرئيسيين. يُظهِر YOLOv8 ميزة كبيرة في سرعة الاستدلال وعدد معلمات مواتية، خاصةً في متغيرات النماذج الأصغر حجمًا والتي تُعدّ حاسمة لتطبيقات الذكاء الاصطناعي المتطورة.
| النموذج | الحجم (بالبكسل) | mAPفال 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv7: تطور "حقيبة الهدايا المجانية"
تم إصدار YOLOv7 في يوليو 2022، وتم تطويره بشكل أساسي من قبل مؤلفي YOLOv4 و YOLOR. وقد أدخلت العديد من الابتكارات المعمارية التي تهدف إلى تحسين عملية التدريب دون زيادة تكاليف الاستدلال، وهو مفهوم يشار إليه باسم "حقيبة مجانية قابلة للتدريب".
- المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
- المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
- التاريخ: 2022-07-06
- الروابط:ورقة بحثية من Arxiv | مستودع GitHub
الميزات المعمارية الرئيسية
قدم YOLOv7 شبكة تجميع الطبقات الموسعة ذات الكفاءة الموسعة (E-ELAN). تتحكم هذه البنية في أقصر مسارات التدرج وأطولها للسماح للشبكة بتعلم ميزات أكثر تنوعًا. علاوة على ذلك، استخدمت تقنيات توسيع النموذج التي تعدّل عمق البنية وعرضها في وقت واحد، مما يضمن الأداء الأمثل عبر أحجام مختلفة.
على الرغم من معاييره المثيرة للإعجاب عند الإطلاق، يركز YOLOv7 بشكل أساسي على اكتشاف الأجسام، مع دعم أقل تكاملاً للمهام الأخرى مقارنةً بالأطر الأحدث.
Ultralytics YOLOv8: الإطار الموحد والبنية الحديثة
يمثل YOLOv8 الذي أطلقته شركة Ultralytics في أوائل عام 2023، إصلاحًا شاملاً لبنية YOLO . لم يتم تصميمه كنموذج فحسب، بل كإطار عمل موحّد قادر على إجراء الكشف، وتجزئة النماذج، وتقدير الوضعية، والتصنيف بسلاسة.
- المؤلفون: Glenn Jocher و Ayush Chaurasia و Jing Qiu
- المنظمة: Ultralytics
- التاريخ: 2023-01-10
- الروابط:مستنداتUltralytics | مستودع GitHub
الابتكارات المعمارية
ابتعد YOLOv8 عن الاكتشاف القائم على المرساة المستخدم في الإصدارات السابقة (بما في ذلك YOLOv7) إلى آلية كشف خالية من المرساة. يعمل هذا التحول على تبسيط عملية التدريب من خلال التخلص من الحاجة إلى حساب مربعات الارتكاز، مما يجعل النموذج أكثر قوة في مواجهة الاختلافات في شكل الجسم وحجمه.
تمت ترقية العمود الفقري لاستخدام وحدات C2f (اختناق جزئي متقاطع مع التفافين)، والتي تحل محل وحدات C3 من YOLOv5. يعمل هذا التغيير على تحسين تدفق التدرج ويسمح للنموذج بأن يظل خفيف الوزن مع التقاط معلومات أكثر ثراءً عن السمات.
مقارنة تقنية مفصلة
المرساة المستندة إلى مرساة مقابل الخالية من المرساة
أحد الاختلافات الأكثر تحديدًا هو رأس الكشف. يعتمد YOLOv7 على مربعات الارتكاز - وهي أشكال محددة مسبقًا يحاول النموذج مطابقتها مع الكائنات. على الرغم من فعاليته، إلا أن هذا يتطلب ضبط المعلمة الفائقة لمجموعات البيانات المخصصة.
في المقابل، يستخدم YOLOv8 نهجًا خاليًا من المرساة، حيث يتنبأ بمركز الجسم مباشرةً. يقلل هذا من عدد تنبؤات الصندوق، مما يسرّع من عملية الإخماد غير الأقصىNMS ويجعل النموذج أسهل في التدريب على بيانات متنوعة دون تكوين مرساة يدوية.
كفاءة التدريب واستخدام الذاكرة
تشتهر نماذج Ultralytics بكفاءتها الهندسية. يستخدم YOLOv8 استراتيجية ذكية لزيادة البيانات تقوم بتعطيل زيادة الفسيفساء خلال الحقب الأخيرة من التدريب. تعمل هذه التقنية على استقرار خسارة التدريب وتحسين الدقة.
كفاءة الذاكرة
من المزايا المهمة لـ Ultralytics YOLOv8 على البنى المعقدة مثل المحولات (مثل RT-DETR) هي انخفاض متطلبات ذاكرة CUDA . يسمح ذلك للمستخدمين بتدريب أحجام دفعات أكبر على وحدات معالجة الرسومات من فئة المستهلك، مما يتيح للمستخدمين الوصول إلى أحدث تدريب للنماذج.
النظام البيئي وسهولة الاستخدام
في حين أن YOLOv7 هو مستودع بحثي قوي، فإن Ultralytics YOLOv8 يقدم تجربة منتج مصقولة. يوفر نظام Ultralytics البيئي:
- واجهة برمجة تطبيقات مبسطة: واجهة Python متسقة لجميع المهام.
- النشر: التصدير بنقرة واحدة إلى تنسيقات مثل ONNX و TensorRT و CoreML و TFLite عبر وضع التصدير.
- دعم المجتمع: مجتمع Discord نشط وتحديثات متكررة تضمن التوافق مع أحدث إصدارات PyTorch .
مقارنة الرموز
تتضح فجوة سهولة الاستخدام عند مقارنة الكود المطلوب لتشغيل الاستدلال. يعطي Ultralytics الأولوية لنهج منخفض التعليمات البرمجية، مما يسمح للمطورين بدمج الذكاء الاصطناعي للرؤية في التطبيقات بأقل قدر من النفقات العامة.
تشغيل YOLOv8 باستخدام Python
from ultralytics import YOLO
# Load a pre-trained YOLOv8 model
model = YOLO("yolov8n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results
for result in results:
result.show()
تنفيذ CLI
يمكن أيضًا تنفيذ YOLOv8 مباشرةً من سطر الأوامر، وهي ميزة تبسّط تكامل خط الأنابيب والاختبار السريع.
# Detect objects in an image using the nano model
yolo predict model=yolov8n.pt source='https://ultralytics.com/images/zidane.jpg' imgsz=640
حالات الاستخدام المثالية
متى تستخدم YOLOv7
لا يزال YOLOv7 خيارًا قابلاً للتطبيق للباحثين الذين يقيسون معايير 2022/2023 أو الذين يحافظون على الأنظمة القديمة المبنية خصيصًا حول بنية على غرار الشبكة المظلمة. يقدم نهج "حقيبة الأشياء المجانية" الخاص به رؤى مثيرة للاهتمام لأولئك الذين يدرسون استراتيجيات تحسين الشبكة العصبية.
متى تستخدم YOLOv8
YOLOv8 هو الخيار الموصى به للغالبية العظمى من المشاريع الجديدة، بما في ذلك:
- تطبيقات الوقت الحقيقي: يوفر الطراز YOLOv8n (نانو) سرعات مذهلة (حوالي 80 مللي ثانية على CPU)، مما يجعله مثاليًا لتطبيقات الأجهزة المحمولة والأنظمة المدمجة.
- خطوط أنابيب متعددة المهام: يمكن للمشاريع التي تتطلب تقدير الوضعية أو التجزئة إلى جانب الكشف استخدام واجهة برمجة تطبيقات واحدة.
- النشر التجاري: يضمن التوافق القوي للتصدير إمكانية نشر النماذج المدربة على PyTorch بكفاءة في بيئات الإنتاج باستخدام TensorRT أو OpenVINO.
الخلاصة
بينما قدم YOLOv7 مساهمات كبيرة في مجال الرؤية الحاسوبية من خلال تحسين المعلمات القابلة للتدريب, Ultralytics YOLOv8 يمثل المعيار الحديث لتطوير الذكاء الاصطناعي العملي.
إن التوازن الفائق بين السرعة والدقة في YOLOv8 بالإضافة إلى تصميمه الخالي من المراسي ونظام دعم Ultralytics الشامل، يجعله أكثر سهولة للمبتدئين وأكثر قوة للخبراء. بالنسبة للمطورين الذين يتطلعون إلى إنشاء تطبيقات رؤية قابلة للتطوير والصيانة وعالية الأداء، فإن YOLOv8مثل YOLO11-المسار الأكثر إقناعًا للمضي قدمًا.
مزيد من القراءة
بالنسبة للمهتمين باستكشاف أحدث التطورات في مجال اكتشاف الأجسام، فكّر في مراجعة هذه النماذج ذات الصلة:
- YOLO11: أحدث تكرار من Ultralytics الذي يعمل على تحسين البنية لتحقيق كفاءة أكبر.
- YOLOv6: نموذج آخر خالٍ من المراسي يركز على التطبيقات الصناعية.
- YOLOv9: يركز على معلومات التدرج القابلة للبرمجة (PGI) لتدريب الشبكات العميقة.