تخطي إلى المحتوى

YOLOv8 YOLOv6.0: مقارنة تقنية شاملة

يتطور مجال الرؤية الحاسوبية في الوقت الفعلي باستمرار، مدفوعًا بالطلب على نماذج أسرع وأكثر دقة وتنوعًا. ومن أبرز البنى التي ظهرت في أوائل عام 2023 ما يلي Ultralytics YOLOv8 و YOLOv6.0 من Meituan. كلا النموذجين يوسعان حدود الأداء المتطور، لكنهما يلبيان فلسفات تطوير وسيناريوهات نشر مختلفة قليلاً.

يقدم هذا الدليل الشامل تحليلاً متعمقاً لهيكلها ومقاييس أدائها وحالات الاستخدام المثالية، مما يساعد مهندسي وباحثي التعلم الآلي على اختيار الأداة المناسبة لمشروعهم التالي في مجال اكتشاف الأجسام.

سلسلة الطرازات وتفاصيلها

قبل الخوض في التفاصيل الفنية، من المهم فهم أصول ومواصفات كل من النموذجين. يستفيد كلا المستودعين بشكل كبير من PyTorch ، ولكن تكاملهما مع النظام البيئي يختلف بشكل كبير.

تفاصيل YOLOv8

تمثلYOLOv8 Ultralytics YOLOv8 إطار عمل موحد ومتعدد المهام مصمم من الألف إلى الياء لتوفير تجربة استثنائية للمطورين وتعدد الاستخدامات. وهي تستند إلى سنوات من البحث وردود فعل المجتمع من الإصدارات السابقة.

  • المؤلفون: جلين جوشر، أيوش شوراسيا، وجينغ تشيو
  • المنظمة: Ultralytics
  • التاريخ: 2023-01-10
  • GitHub: ultralytics
  • المستندات: yolov8

تعرف على المزيد حول YOLOv8

تفاصيل YOLOv6.0

تم طرح YOLOv6 في الأصل للاستخدامات الصناعية في Meituan، ثم YOLOv6 تحديث كبير "Full-Scale Reloading" في الإصدار 3.0. وهو يستهدف في المقام الأول بيئات النشر عالية التحسين، باستخدام تقنيات مثل التقطير الذاتي و RepOptimizer.

  • المؤلفون: تشوي لي، لولو لي، ييفي جينغ، هونغليانغ جيانغ، مينغ تشينغ، بو تشانغ، زيدان كي، شياومينغ شو، وشيانغشيانغ تشو
  • المنظمة: Meituan
  • التاريخ: 2023-01-13
  • Arxiv: https://arxiv.org/abs/2301.05586
  • GitHub: YOLOv6
  • المستندات: ultralytics

تعرف على المزيد حول YOLOv6-3.0

إدارة مبسطة

أصبحت إدارة مجموعات البيانات وجلسات التدريب ونشر النماذج أكثر بساطة بفضل Ultralytics . فهي توفر واجهة شاملة تقلل من الكود النمطي المطلوب عادةً في سير عمل MLOps.

الهندسة المعمارية ومنهجيات التدريب

YOLOv8 Ultralytics YOLOv8

YOLOv8 رأس كشف عالي الدقة وخالي من المراسي. من خلال إزالة مربعات المراسي المحددة مسبقًا، يقوم النموذج بالتعميم بشكل أفضل عبر مجموعات البيانات المتنوعة ويقلل من عدد عمليات المعالجة اللاحقة. علاوة على ذلك، YOLOv8 توازنًا لا مثيل له في الأداء، حيث يحقق باستمرار توازنًا جيدًا بين السرعة والدقة المناسبين لسيناريوهات النشر المتنوعة في العالم الحقيقي — من خوادم السحابة إلى الأجهزة الطرفية المحدودة الموارد.

YOLOv8 المزايا الرئيسية لـ YOLOv8 متطلبات الذاكرة. أثناء التدريب، تُظهر Ultralytics استخدامًا أقل بكثير CUDA مقارنة بالبدائل الثقيلة القائمة على المحولات مثل RT-DETR. وهذا يتيح للمطورين استخدام أحجام دفعات أكبر على وحدات معالجة الرسومات القياسية للمستهلكين، مما يؤدي إلى كفاءة تدريب ممتازة.

بنية YOLOv6.0

يستخدم YOLOv6.YOLOv6 وحدة تسلسل ثنائي الاتجاه (BiC) واستراتيجية تدريب مدعومة بالمرساة (AAT). بالنسبة للنماذج الأصغر (N و S)، يستخدم EfficientRep Backbone، بينما تتحول المتغيرات الأكبر (M و L) إلى CSPStackRep Backbone. تم تحسين البنية بشكل كبير من أجل NVIDIA TensorRT ، مما يجعلها سريعة للغاية عند نشرها على أجهزة متوافقة. ومع ذلك، فإن هذا الترابط الوثيق مع تحسينات الأجهزة المحددة يمكن أن يجعل النشر عبر الأنظمة الأساسية أكثر صرامة قليلاً مقارنة بمرونة ONNX المرنة الأصلية في Ultralytics.

مقارنة الأداء

عند تقييم النماذج على مجموعة بياناتCOCO أظهر كلا النموذجين أداءً رائعًا. يوضح الجدول أدناه المقاييس الرئيسية.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

بينما يتميز YOLOv6. YOLOv6 بمزايا طفيفة في السرعة في TensorRT المحددة، YOLOv8 تصميمًا أكثر كفاءة من حيث المعلمات في الفئات الأصغر، مما يترجم إلى مرونة أفضل عبر الأجهزة المتنوعة، بما في ذلك وحدات المعالجة المركزية المحمولة والمدمجة.

النظام البيئي والتنوع

يكمن التباين الأكثر وضوحًا بين النموذجين في دعمهما للنظام البيئي.

YOLOv6 في الأساس محرك للكشف عن الصناديق المحددة. في المقابل، YOLOv8 بتعدد استخداماته. ضمن إطار عمل موحد واحد، يدعم YOLOv8 تقسيم الحالات وتصنيف الصور وتقدير الوضع والكشف عن الصناديق المحددة الموجهة (OBB).

علاوة على ذلك، فإن سهولة استخدام Ultralytics لا مثيل لها. باستخدام Python بسيطة، يمكن للباحثين بدء التدريب والتحقق من صحة النتائج وتصدير النماذج إلى العديد من التنسيقات دون الحاجة إلى كتابة أكواد برمجية معقدة. يضمن النظام المحافظ عليه جيدًا التطوير النشط والتحديثات المتكررة والتكامل السلس مع أدوات تتبع التجارب الشائعة.

مثال على الكود: تدريب YOLOv8

يتطلب تدريب YOLOv8 إعدادات بسيطة للغاية، مما يبرز تصميم الإطار السهل الاستخدام:

from ultralytics import YOLO

# Load a pretrained YOLOv8 small model
model = YOLO("yolov8s.pt")

# Train the model on the COCO8 dataset
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Utilize GPU for efficient training
    batch=32,
)

# Easily export to ONNX for cross-platform deployment
model.export(format="onnx")

حالات الاستخدام والتوصيات

YOLOv6 الاختيار بين YOLOv8 YOLOv6 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار YOLOv8

YOLOv8 خيار قوي لـ:

  • نشر متعدد المهام متعدد الاستخدامات: المشاريع التي تتطلب نموذجًا مثبتًا للكشف والتجزئة والتصنيف وتقدير الوضع داخل نظام Ultralytics .
  • أنظمة الإنتاج الراسخة: بيئات الإنتاج الحالية المبنية بالفعل على YOLOv8 مع خطوط إنتاج مستقرة ومختبرة جيدًا.
  • دعم واسع من المجتمع والنظام البيئي: تطبيقات تستفيد من البرامج التعليمية الشاملة YOLOv8OLOv8، وعمليات الدمج مع أطراف ثالثة، وموارد المجتمع النشطة.

متى تختار YOLOv6

YOLOv6 في الحالات التالية:

  • النشر الصناعي المراعي للأجهزة: سيناريوهات يوفر فيها تصميم النموذج المراعي للأجهزة وإعادة تحديد المعلمات بكفاءة أداءً محسّنًا على أجهزة مستهدفة محددة.
  • الكشف السريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الأولي على GPU الفيديو في الوقت الفعلي في البيئات الخاضعة للرقابة.
  • تكامل نظام Meituan البيئي: فرق تعمل بالفعل ضمن مجموعة تقنيات Meituan وبنيتها التحتية للنشر.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

التطلع إلى المستقبل: الترقية إلى YOLO26

في حين أن YOLOv8 YOLOv6. YOLOv6 خياران ممتازان، فإن المطورين الذين يبدؤون مشاريع جديدة مدعوون بشدة لاستكشاف نموذج Ultralytics من الجيل التالي. تم إصدار YOLO26 في يناير 2026، وهو يعيد تعريف معيار الذكاء الاصطناعي للرؤية التي تركز على الحافة.

يقدم YOLO26 تصميمًا شاملاً NMS، مما يلغي تمامًا الحاجة إلى القمع غير الأقصى أثناء المعالجة اللاحقة. يضمن هذا النهج الشامل الأصلي منطق نشر أسرع وأبسط، لا سيما في بيئات الحافة. إلى جانب إزالة DFL (توزيع الخسارة البؤرية)، أصبح رأس النموذج أخف وزنًا بشكل ملحوظ، مما أدى إلى زيادة سرعة CPU بنسبة تصل إلى 43٪.

كما شهدت استقرار التدريب وسرعة التقارب تحسينات هائلة بفضل MuSGD Optimizer، وهو مزيج من SGD Muon مستوحى من منهجيات تدريب LLM. بالإضافة إلى ذلك، أدى إدخال ProgLoss + STAL إلى تعزيز التعرف على الأجسام الصغيرة بشكل كبير، وهو أمر بالغ الأهمية لصور الطائرات بدون طيار والتفتيش الصناعي الكثيف.

تعرف على المزيد حول YOLO26

نماذج أخرى يجب أخذها في الاعتبار

بناءً على قيودك الخاصة، قد تكون مهتمًا أيضًا باستكشاف YOLO11 للحصول على سير عمل قديم متوازن للغاية أو YOLO لمهام الكشف عن المفردات المفتوحة بدون الحاجة إلى إعادة تدريب مكثفة.

الخلاصة

يعتمد الاختيار بين YOLOv8 YOLOv6. YOLOv6 في النهاية على أولويات خط أنابيب النشر الخاص بك. YOLOv6. YOLOv6 هو نموذج عالي الكفاءة TensorRT الصارمة حيث تكون GPU الخام هي الأولوية المطلقة. ومع ذلك، بالنسبة للغالبية العظمى من الفرق، فإن Ultralytics YOLOv8 هو الخيار الأفضل. فمزيجها من متطلبات ذاكرة تدريب أقل، وتعدد المهام، ونظام بيئي رائد في الصناعة مقدم من Ultralytics يقلل بشكل كبير من وقت طرح المنتج في السوق.

بالنسبة للمطورين الذين يرغبون في تحقيق أقصى درجات الكفاءة الحديثة، يوفر الانتقال السلس إلى YOLO26 تجربة لا مثيل لها NMS تضمن استمرارية أي تطبيق للرؤية الحاسوبية في المستقبل.


تعليقات