تخطي إلى المحتوى

YOLOv7 YOLOv8: مقارنة تقنية بين أجهزة الكشف في الوقت الحقيقي

أدى التطور السريع في مجال الرؤية الحاسوبية إلى ظهور مجموعة من الأدوات القوية للمطورين والباحثين. عند اتخاذ قرار بشأن البنية المناسبة لخط أنابيب الكشف عن الكائنات، من الضروري مقارنة النماذج القائمة. يقدم هذا الدليل الفني نظرة متعمقة على البنى ومقاييس الأداء وحالات الاستخدام المثالية لنموذجين مؤثرين للغاية: YOLOv7 Ultralytics YOLOv8.

مقدمة إلى الهياكل المعمارية

يمثل كلا النموذجين قفزات كبيرة في الأداء، لكنهما يتعاملان مع التحدي المتمثل في تحسين الشبكات العصبية العميقة من منطلق فلسفات هيكلية مختلفة.

YOLOv7: رائد حقيبة الهدايا المجانية

تم طرح YOLOv7 في منتصف عام 2022، YOLOv7 بشكل كبير على تحسين مسار التدرج المعماري ومفهوم "حقيبة الهدايا القابلة للتدريب" لتجاوز حدود الكشف في الوقت الفعلي على الأجهزة المتطورة.

أبرز ميزات البنية: يستخدمYOLOv7 رأس كشف قائم على المراسي (على الرغم من أنه جرب فروعًا خالية من المراسي) ويقدم شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN). يعمل هذا التصميم على تحسين قدرة الشبكة على التعلم دون تدمير مسار التدرج الأصلي. ويقدم أداءً استثنائيًا على وحدات معالجة الرسومات (GPU) من فئة الخوادم، مما يجعله مناسبًا للغاية لتحليلات الفيديو الثقيلة.

نقاط القوة والضعف: بينما YOLOv7 زمن انتقال ممتاز على الأجهزة المخصصة، إلا أن نظامه البيئي شديد التجزئة. يتطلب التدريب حججًا معقدة لسطر الأوامر، واستنساخًا يدويًا للمستودع، وإدارة صارمة للتبعية في PyTorch. علاوة على ذلك، قد تكون متطلبات الذاكرة أثناء التدريب باهظة على الأجهزة الاستهلاكية.

تعرف على المزيد حول YOLOv7

Ultralytics YOLOv8: المعيار متعدد الاستخدامات

صدر YOLOv8 في أوائل عام 2023، وأعاد تعريف تجربة المطورين YOLOv8 ، حيث ركز ليس فقط على الدقة المتطورة، ولكن أيضًا على توفير إطار عمل موحد وجاهز للإنتاج.

أبرز ميزات الهندسة المعمارية: YOLOv8 رأس كشف خالٍ من المراسي بشكل أصلي، مما يلغي الحاجة إلى تكوين مربعات المراسي يدويًا استنادًا إلى COCO MS COCO أو توزيعات البيانات المخصصة. وهو يشتمل على وحدة C2f لتحسين تدفق التدرج ويستخدم بنية رأس منفصلة تفصل بين مهام الكائنات والتصنيف والانحدار. وهذا يسرع بشكل كبير من التقارب ويعزز الدقة.

نقاط القوة والضعف: YOLOv8 بكفاءة استثنائية في متطلبات الذاكرة. فهو يتطلب CUDA أقل بكثير أثناء التدريب مقارنةً بـ YOLOv7 ماذج المحولات الأثقل YOLOv7 مما يسمح للمطورين باستخدام أحجام دفعات أكبر. تكمن قوته الأساسية في تنوعه، حيث يدعم بشكل أساسي تجزئة المثيلات وتصنيف الصور وتقدير الوضع ومربعات الحدود الموجهة (OBB). العيب الوحيد الطفيف هو أن خطوط الأنابيب القديمة المتخصصة للغاية والمصممة حصريًا YOLOv7 قد تتطلب فترة إعادة هيكلة قصيرة.

تعرف على المزيد حول YOLOv8

ميزة النظام البيئي

YOLOv8 Ultralytics YOLOv8 من نظام بيئي جيد الصيانة. بفضل Python سهلة الاستخدام، والتطوير النشط، والدعم القوي من المجتمع، فإن نقل النموذج من الاختبار المحلي إلى النشر العالمي يستغرق جزءًا بسيطًا من الوقت مقارنة بالمستودعات المستقلة.

مقارنة مفصلة للأداء

يوضح الجدول التالي مقياس الأداء عبر أحجام النماذج الرئيسية. لاحظ التوازن المتميز في الأداء YOLOv8 والذي يعمل على تحسين الاستدلال السريع على الأجهزة الطرفية مع الحفاظ على دقة عالمية المستوى.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

ملاحظة: YOLOv8x أعلى معدل mAP هذه المجموعة، بينما YOLOv8n في كفاءة المعلمات وسرعة الاستدلال، مما يجعله البطل بلا منازع في نشر الرؤية الحاسوبية على أجهزة الذكاء الاصطناعي المتطورة.

سهولة الاستخدام وكفاءة التدريب

عندما يتعلق الأمر بسهولة الاستخدام،YOLOv8 Ultralytics YOLOv8 في فئة خاصة بها. YOLOv7 البنى القديمة مثل YOLOv7 استنساخ مستودعات محددة وتشغيل نصوص برمجية مطولة لسطر الأوامر لتكوين مجموعات البيانات والمسارات.

على العكس من ذلك، YOLOv8 ultralytics تقدم الحزمة تجربة مطورين مبسطة للغاية. كفاءة التدريب يتم تعظيمه من خلال التنزيل التلقائي للبيانات، والأوزان الجاهزة للاستخدام والمعدة مسبقًا، والانسيابية قدرات التصدير إلى تنسيقات مثل ONNX و TensorRT.

إليك كيفية تحميل وتدريب وتشغيل الاستدلال بسهولة باستخدامPython Ultralytics Python :

from ultralytics import YOLO

# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")

# Train the model efficiently on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the predictions
predictions[0].show()

تتبع التجارب

YOLOv8 بشكل أساسي مع أدوات MLops الشائعة مثل Weights & Biases و ClearML، مما يتيح لك مراقبة ضبط المعلمات الفائقة ومقاييس التدريب في الوقت الفعلي.

حالات الاستخدام المثالية

غالبًا ما يعتمد الاختيار بين هذه البنى على القيود المحددة لبيئة النشر الخاصة بك.

متى تختار YOLOv7

  • مقارنة الأداء القديم: مناسب للباحثين الذين يحتاجون إلى أساس ثابت للمقارنة مع معايير الهندسة المعمارية لعام 2022.
  • البنية التحتية الثقيلة الموجودة مسبقًا: البيئات التي استثمرت بكثافة في وحدات معالجة الرسومات NVIDIA أو A100 حيث يتم تضمين tensor الخاصة YOLOv7 بعمق في خط أنابيب C++ قديم.

متى تختار YOLOv8

  • الإنتاج عبر الأنظمة الأساسية: مثالي للفرق التي تحتاج إلى النشر بسلاسة عبر وحدات معالجة الرسومات السحابية والأجهزة المحمولة والمتصفحات.
  • متطلبات المهام المتعددة: إذا كان مشروعك يحتاج إلى تجاوز حدود المربعات والاستفادة من أقنعة تجزئة المثيلات الغنية أو وضع نقاط رئيسية.
  • الحافة المحدودة الموارد: YOLOv8 (yolov8n) توفر نسب دقة إلى سرعة مذهلة للروبوتات والطائرات بدون طيار وأجهزة استشعار إنترنت الأشياء.

التطلع إلى المستقبل: القفزة الجيلية إلى YOLO26

في حين أن YOLOv8 خيارًا قويًا للغاية، فإن مجال الرؤية الحاسوبية يتطور بسرعة. بالنسبة للمطورين الذين يبدؤون مشاريع جديدة تمامًا وعالية الأداء، قدمت Ultralytics الجيل التالي من نماذج الذكاء الاصطناعي. يوصى بشدة باستكشاف كل من YOLO11 و YOLO26 الذي تم إصداره حديثًا.

صدر YOLO26 في يناير 2026، وهو يوسع حدود الإمكانيات المتاحة على الأجهزة الطرفية:

  • تصميم شامل NMS: YOLO26 هو تصميم شامل أصلاً، مما يلغي تماماً المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يضمن خطوط إنتاج أسرع وأبسط بشكل ملحوظ دون اختناقات التأخير التي تعاني منها نماذج التنبؤ الكثيفة التقليدية.
  • إزالة DFL: من خلال إزالة Distribution Focal Loss، يحقق YOLO26 خيارات نشر نموذج أبسط بكثير وتوافقًا فائقًا مع الحواف.
  • CPU أسرع بنسبة تصل إلى 43٪ CPU : تم تحسينه بشكل كبير للبيئات المقيدة مثل Raspberry Pi والأنظمة المدمجة، متفوقًا على جميع الأجيال السابقة في CPU .
  • MuSGD Optimizer: مستوحى من نماذج تدريب النماذج اللغوية الكبيرة (LLM)، يدمج YOLO26 مزيجًا من SGD Muon. وهذا يوفر استقرارًا غير مسبوق في التدريب وتقاربًا سريعًا للغاية.
  • ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية بالنسبة للصور الجوية والزراعة الآلية والروبوتات.

سواء كنت تقوم بتوسيع نطاق مجموعات تحليلات الفيديو الضخمة باستخدام YOLOv8 تدفع الاستدلال إلى أجهزة حافة صغيرة باستخدام YOLO26 المتطورة، توفر Ultralytics الأدوات اللازمة لإدارة دورة حياة الذكاء الاصطناعي بالكامل بسلاسة.


تعليقات