تخطي إلى المحتوى

YOLOv7 YOLOv8: مقارنة تقنية بين أجهزة الكشف في الوقت الحقيقي

أدى التطور السريع في مجال الرؤية الحاسوبية إلى ظهور مجموعة من الأدوات القوية للمطورين والباحثين. عند اتخاذ قرار بشأن البنية المناسبة لخط أنابيب الكشف عن الكائنات، من الضروري مقارنة النماذج القائمة. يقدم هذا الدليل الفني نظرة متعمقة على البنى ومقاييس الأداء وحالات الاستخدام المثالية لنموذجين مؤثرين للغاية: YOLOv7 Ultralytics YOLOv8.

مقدمة إلى الهياكل المعمارية

يمثل كلا النموذجين قفزات كبيرة في الأداء، لكنهما يتعاملان مع تحدي تحسين الشبكات العصبية العميقة من فلسفات هيكلية مختلفة.

YOLOv7: رائد حقيبة الهدايا المجانية

تم طرح YOLOv7 في منتصف عام 2022، YOLOv7 بشكل كبير على تحسين مسار التدرج المعماري ومفهوم "حقيبة الهدايا القابلة للتدريب" لتجاوز حدود الكشف في الوقت الفعلي على الأجهزة المتطورة.

أبرز ملامح البنية المعمارية: يستخدم YOLOv7 بشكل أساسي رأس اكتشاف يعتمد على المراسٍ (على الرغم من أنه جرب فروعًا خالية من المراسٍ) ويقدم شبكات تجميع الطبقات الموسعة الفعالة (E-ELAN). يحسن هذا التصميم قدرة الشبكة على التعلم دون تدمير مسار التدرج الأصلي. يؤدي أداءً استثنائيًا على GPUs من فئة الخوادم، مما يجعله مناسبًا للغاية لتحليلات الفيديو عالية الأداء.

نقاط القوة والضعف: بينما يحقق YOLOv7 زمن استجابة ممتازًا على الأجهزة المخصصة، فإن بيئته التشغيلية مجزأة للغاية. يتطلب التدريب وسيطات سطر أوامر (CLI) معقدة، واستنساخ المستودعات يدويًا، وإدارة صارمة للتبعيات في PyTorch. علاوة على ذلك، قد تكون متطلبات الذاكرة أثناء التدريب باهظة على الأجهزة الاستهلاكية.

تعرف على المزيد حول YOLOv7

Ultralytics YOLOv8: المعيار متعدد الاستخدامات

صدر YOLOv8 في أوائل عام 2023، وأعاد تعريف تجربة المطورين YOLOv8 ، حيث ركز ليس فقط على الدقة المتطورة، ولكن أيضًا على توفير إطار عمل موحد وجاهز للإنتاج.

أبرز ملامح البنية المعمارية: قدم YOLOv8 رأس اكتشاف خاليًا من المراسٍ بطبيعته، مما يلغي الحاجة إلى التكوين اليدوي لصناديق المراسٍ بناءً على مجموعة بيانات MS COCO أو توزيعات البيانات المخصصة. يدمج وحدة C2f لتحسين تدفق التدرج ويستخدم بنية رأس مفصولة تفصل مهام تحديد الكائن والتصنيف والانحدار. هذا يسرع التقارب بشكل كبير ويعزز الدقة.

نقاط القوة والضعف: يتميز YOLOv8 بكفاءة استثنائية في متطلبات الذاكرة. فهو يتطلب ذاكرة CUDA أقل بكثير أثناء التدريب مقارنة بـ YOLOv7 ونماذج المحولات الأثقل، مما يسمح للمطورين باستخدام أحجام دفعات أكبر. تكمن قوته الأساسية في تعدد استخداماته، حيث يدعم أصلاً تجزئة الكائنات (instance segmentation)، وتصنيف الصور، وتقدير الوضعيات، والصناديق المحيطة الموجهة (OBB). العيب الطفيف الوحيد هو أن مسارات العمل القديمة المتخصصة للغاية والمصممة حصريًا لـ YOLOv7 tensors قد تتطلب فترة إعادة هيكلة قصيرة.

تعرف على المزيد حول YOLOv8

ميزة النظام البيئي

YOLOv8 Ultralytics YOLOv8 من نظام بيئي جيد الصيانة. بفضل Python سهلة الاستخدام، والتطوير النشط، والدعم القوي من المجتمع، فإن نقل النموذج من الاختبار المحلي إلى النشر العالمي يستغرق جزءًا بسيطًا من الوقت مقارنة بالمستودعات المستقلة.

مقارنة مفصلة للأداء

يوضح الجدول التالي مقياس الأداء عبر أحجام النماذج الرئيسية. لاحظ التوازن المتميز في الأداء YOLOv8 والذي يعمل على تحسين الاستدلال السريع على الأجهزة الطرفية مع الحفاظ على دقة عالمية المستوى.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

ملاحظة: YOLOv8x أعلى معدل mAP هذه المجموعة، بينما YOLOv8n في كفاءة المعلمات وسرعة الاستدلال، مما يجعله البطل بلا منازع في نشر الرؤية الحاسوبية على أجهزة الذكاء الاصطناعي المتطورة.

سهولة الاستخدام وكفاءة التدريب

عندما يتعلق الأمر بسهولة الاستخدام،YOLOv8 Ultralytics YOLOv8 في فئة خاصة بها. YOLOv7 البنى القديمة مثل YOLOv7 استنساخ مستودعات محددة وتشغيل نصوص برمجية مطولة لسطر الأوامر لتكوين مجموعات البيانات والمسارات.

على النقيض، YOLOv8's ultralytics تقدم الحزمة تجربة مطورين مبسطة للغاية. كفاءة التدريب يتم تعظيمه من خلال التنزيل التلقائي للبيانات، والأوزان الجاهزة للاستخدام والمعدة مسبقًا، والانسيابية قدرات التصدير إلى تنسيقات مثل ONNX و TensorRT.

إليك كيفية تحميل وتدريب وتشغيل الاستدلال بسهولة باستخدامPython Ultralytics Python :

from ultralytics import YOLO

# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")

# Train the model efficiently on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the predictions
predictions[0].show()

تتبع التجارب

YOLOv8 بشكل أساسي مع أدوات MLops الشائعة مثل Weights & Biases و ClearML، مما يتيح لك مراقبة ضبط المعلمات الفائقة ومقاييس التدريب في الوقت الفعلي.

حالات الاستخدام المثالية

غالبًا ما يعتمد الاختيار بين هذه المعماريات على القيود المحددة لبيئة النشر الخاصة بك.

متى تختار YOLOv7

  • المقارنة المعيارية القديمة: مناسب للباحثين الذين يحتاجون إلى خط أساس ثابت للمقارنة بمعايير البنية لعام 2022.
  • البنية التحتية الثقيلة الموجودة مسبقًا: البيئات التي تستثمر بكثافة في وحدات معالجة الرسوميات (GPU) من NVIDIA V100 أو A100 حيث تتكامل تكوينات tensor المحددة لـ YOLOv7 بعمق في مسار C++ قديم.

متى تختار YOLOv8

  • الإنتاج عبر الأنظمة الأساسية: مثالي للفرق التي تحتاج إلى النشر بسلاسة عبر وحدات معالجة الرسوميات (GPUs) السحابية والأجهزة المحمولة والمتصفحات.
  • متطلبات المهام المتعددة: إذا كان مشروعك بحاجة إلى تجاوز الصناديق المحيطة والاستفادة من أقنعة تجزئة الكائنات (instance segmentation masks) الغنية أو النقاط الرئيسية للوضعية (pose keypoints).
  • الحافة المحدودة الموارد: YOLOv8 (yolov8n) يوفر نسب دقة إلى سرعة مذهلة للروبوتات والطائرات بدون طيار ومستشعرات إنترنت الأشياء.

التطلع إلى المستقبل: القفزة الجيلية إلى YOLO26

في حين أن YOLOv8 خيارًا قويًا للغاية، فإن مجال الرؤية الحاسوبية يتطور بسرعة. بالنسبة للمطورين الذين يبدؤون مشاريع جديدة تمامًا وعالية الأداء، قدمت Ultralytics الجيل التالي من نماذج الذكاء الاصطناعي. يوصى بشدة باستكشاف كل من YOLO11 و YOLO26 الذي تم إصداره حديثًا.

صدر YOLO26 في يناير 2026، وهو يوسع حدود الإمكانيات المتاحة على الأجهزة الطرفية:

  • تصميم شامل بدون NMS: يتميز YOLO26 بتصميم شامل بطبيعته، مما يلغي تمامًا المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يضمن مسارات نشر أسرع وأبسط بكثير دون اختناقات زمن الاستجابة لنماذج التنبؤ الكثيفة التقليدية.
  • إزالة DFL: من خلال إزالة خسارة التركيز التوزيعي، يحقق YOLO26 خيارات نشر نموذج أبسط بكثير وتوافقًا فائقًا مع الأجهزة الطرفية.
  • استدلال أسرع على CPU بنسبة تصل إلى 43%: مُحسّن بشكل كبير للبيئات المقيدة مثل Raspberry Pi والأنظمة المدمجة، متفوقًا على جميع الأجيال السابقة في إنتاجية CPU.
  • مُحسِّن MuSGD: مستوحى من نماذج تدريب نماذج اللغة الكبيرة (LLM)، يدمج YOLO26 مزيجًا من SGD و Muon. يوفر هذا استقرارًا غير مسبوق في التدريب وتقاربًا فائق السرعة.
  • ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو أمر بالغ الأهمية للصور الجوية والزراعة الآلية والروبوتات.

سواء كنت تقوم بتوسيع نطاق مجموعات تحليلات الفيديو الضخمة باستخدام YOLOv8 تدفع الاستدلال إلى أجهزة حافة صغيرة باستخدام YOLO26 المتطورة، توفر Ultralytics الأدوات اللازمة لإدارة دورة حياة الذكاء الاصطناعي بالكامل بسلاسة.


تعليقات