تخطي إلى المحتوى

YOLOv8 مقابل YOLOv6.0: مقارنة تقنية

يعد اختيار النموذج الأمثل لاكتشاف الأجسام خطوة محورية في بناء تطبيقات رؤية حاسوبية قوية. تستكشف هذه المقارنة المفصّلة الاختلافات المعمارية ومقاييس الأداء وحالات الاستخدام المثالية ل Ultralytics YOLOv8 و YOLOv6.0. بينما نشأ كلا النموذجين في نفس الوقت تقريبًا ويهدفان إلى حل مشاكل متشابهة، إلا أنهما يختلفان اختلافًا كبيرًا في فلسفة تصميمهما وتعدد استخداماتهما والنظم البيئية التي تدعمهما.

Ultralytics YOLOv8

المؤلفون: جلين جوتشر، وأيوش تشوراسيا، وجينغ كيو
المنظمة: Ultralytics
التاريخ: 2023-01-10
GitHub: ultralytics
المستندات: https:yolov8

Ultralytics YOLOv8 يمثل قفزة كبيرة إلى الأمام في تطور بنية YOLO . تم تصميمه كإطار عمل موحّد، وهو يدعم مجموعة واسعة من مهام الرؤية الحاسوبية التي تتجاوز الاكتشاف البسيط، بما في ذلك تجزئة النماذج وتقدير الوضع والتصنيف. ويعطي تصميمه الذي يركز على المستخدم الأولوية لسهولة الاستخدام، مما يجعل الذكاء الاصطناعي المتطور في متناول المطورين من جميع مستويات المهارة.

البنية والميزات الرئيسية

YOLOv8 آلية كشف خالية من الارتكاز، مما يبسّط رأس النموذج ويقلل من عدد المعلمات الفائقة المطلوبة للتدريب. يعمل هذا النهج على تحسين التعميم عبر أشكال وأحجام الأجسام المختلفة. تتميز البنية بأحدث ما توصلت إليه الهندسة المعمارية باستخدام وحدة C2f، مما يعزز تدفق التدرج وتكامل الميزات مقارنةً بالتكرارات السابقة.

نقاط القوة

  • براعة لا مثيل لها: على عكس العديد من المنافسين، لا يقتصر YOLOv8 على اكتشاف الأجسام. فهو يدعم أصلاً تجزئة النماذج، وتصنيف الصور، وتقدير الوضع، ومهام الصندوق المحيط الموجه (OBB) ضمن قاعدة رموز واحدة.
  • كفاءة فائقة: كما هو موضح في معايير الأداء، يحقق YOLOv8 دقة أعلىmAP) مع عدد أقل من المعلمات وعمليات التشغيل المتكرر. وينتج عن ذلك انخفاض متطلبات الذاكرة أثناء التدريب والاستدلال على حد سواء، وهي ميزة حاسمة مقارنةً بالنماذج القائمة على المحولات الأثقل.
  • سهولة الاستخدام: تم تغليف النموذج في واجهة برمجة تطبيقاتPython مبسطة وواجهة سطر الأوامرCLI، مما يسمح للمستخدمين بتدريب النماذج والتحقق من صحتها ونشرها بأقل قدر من التعليمات البرمجية.
  • نظام بيئي قوي: مدعوم من Ultralyticsيستفيد YOLOv8 من التحديثات المستمرة والوثائق الشاملة والمجتمع النابض بالحياة. وهذا يضمن استمرارية ودعم طويل الأجل لعمليات النشر المؤسسية.

نقاط الضعف

  • اكتشاف الأجسام الصغيرة: على الرغم من أن أجهزة الكشف أحادية المرحلة ذات القدرات العالية مثل YOLOv8 قد تواجه أحيانًا صعوبة في الكشف عن الأجسام الصغيرة جدًا أو المسدودة مقارنةً بأجهزة الكشف المتخصصة والمكلفة حسابيًا ذات المرحلتين.

تعرف على المزيد حول YOLOv8

YOLOv6.0

المؤلفون: تشوي لي، ولولو لي، ويفي جينغ، وهونغليانغ جيانغ، ومنغ تشنغ، وبو تشانغ، وبو تشانغ، وزيدان كي، وشياومينغ شو، وشيانغ شيانغ شيانغ تشو
المنظمة: Meituan
التاريخ: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586https://arxiv.org/abs/2301.05586
GitHub: YOLOv6
Docs: https:ultralytics

YOLOv6.0 هو إطار عمل للكشف عن الكائنات تم تطويره بواسطة Meituan، وهو مصمم خصيصًا للتطبيقات الصناعية حيث تكون سرعة الاستدلال على الأجهزة المخصصة أولوية. وهو يركز على تحسين المفاضلة بين السرعة والدقة، ويستخدم تقنيات متقدمة لتحقيق أقصى استفادة من GPU .

البنية والميزات الرئيسية

تشتمل بنية YOLOv6 على تصميم مدرك للأجهزة، باستخدام هياكل إعادة المعلمات (إعادة المعلمات) التي تسمح للشبكة بأن يكون لها فروع معقدة أثناء التدريب ولكنها تنطوي على بنية أبسط وأسرع أثناء الاستدلال. كما تستخدم أيضًا استراتيجية التقطير الذاتي لتعزيز الدقة دون تكبد تكاليف استدلال إضافية.

نقاط القوة

  • سرعة الاستدلالGPU : تم تحسين النموذج بدرجة كبيرة لأداء GPU خاصةً على أجهزة NVIDIA مما يجعله مرشحاً قوياً للسيناريوهات الصناعية ذات ميزانيات زمن الاستجابة الصارمة.
  • دعم التكميم الكمي: يركز YOLOv6 على دعم التكميم الكمي للنماذج، مما يوفر أدوات لنشر النماذج على الأجهزة ذات الدقة الحسابية المحدودة.
  • تحسين الأجهزة المحمولة: من خلال متغيرات مثل YOLOv6Lite، يوفر إطار العمل حلولاً مصممة خصيصاً لنقاط النهاية CPU.

نقاط الضعف

  • نطاق المهام المحدود: يركز YOLOv6 بشكل أساسي على اكتشاف الأجسام. فهو يفتقر إلى الدعم الأصلي الجاهز للتجزئة وتقدير الوضع والتتبع الذي يميز نظام Ultralytics البيئي.
  • كثافة الموارد: لتحقيق دقة مماثلة لدقة YOLOv8 غالبًا ما تتطلب نماذج YOLOv6 عددًا أكبر بكثير من المعلمات وعمليات التشغيل الحر، مما يؤدي إلى زيادة النفقات الحسابية أثناء التدريب.
  • المجتمع والصيانة: على الرغم من أن النظام البيئي مفتوح المصدر، إلا أنه أقل نشاطًا مقارنةً Ultralytics مما قد يؤدي إلى بطء حل المشكلات وقلة الموارد التي يساهم بها المجتمع.

اعرف المزيد عن YOLOv6

مقارنة الأداء

يعرض الجدول التالي مقارنة مباشرة لمقاييس الأداء على مجموعة بياناتCOCO . تؤكد هذه البيانات على كفاءةYOLOv8 Ultralytics YOLOv8 الذي يقدم باستمرار متوسط دقة عالية (mAP) مع تقليل تعقيد النموذج.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0 م64050.0-5.2834.985.8
YOLOv6.0L64052.8-8.9559.6150.7

تحليل المقاييس

  • الكفاءة: يُظهر YOLOv8 كفاءة فائقة في المعلمات. على سبيل المثال YOLOv8s يحقق 44.9 mAP تنافسية مع 11.2 مليون معلمة فقط، بينما يتطلب YOLOv6.0s 18.5 مليون معلمة - أيأكثربنسبة 65% - لتحقيق معلمة متطابقة تقريبًا تبلغ 45.0 mAP . يُترجم هذا إلى تكاليف تخزين أقل وتحديثات أسرع على الأجهزة الطرفية.
  • حِمل الحوسبة: وبالمثل، من حيث عمليات النقطة العائمة (FLOPs)، يعمل YOLOv8m بـ 78.9 مليار عملية FLOP مقارنةً بـ 85.8 مليار عملية FLOP في YOLOv6.0m، مما يجعل نموذج Ultralytics أخف من الناحية الحسابية مع تحقيق mAP أعلى (50.2 مقابل 50.0).
  • السرعة: على الرغم من أن YOLOv6.0 يُظهر سرعات استدلال خام أسرع قليلاً على وحدات معالجة الرسومات T4 نظرًا لتصميمه المتخصص المدرك للأجهزة، فإن YOLOv8 يقدم أداءً ممتازًا CPU عبر ONNXوهو أمر بالغ الأهمية لعمليات النشر التي لا تتوفر فيها وحدات معالجة الرسومات.

التدريب وسهولة الاستخدام

أحد الاختلافات المميزة بين هذه النماذج هو تجربة المطورين. تعطي Ultralytics الأولوية لسير العمل الخالي من الاحتكاك، ويتضح ذلك في كيفية تدريب النماذج ونشرها.

سير العمل الموحّد

توفر Ultralytics واجهة برمجة تطبيقات متسقة في جميع المهام. سواء كنت تقوم بالكشف أو التجزئة أو تقدير الوضع، تظل الصيغة هي نفسها، مما يقلل بشكل كبير من منحنى التعلم.

سهولة الاستخدام مع Ultralytics

يمكن دمج YOLOv8 في مشروع ببضعة أسطر من التعليمات البرمجية. تتعامل مجموعة أدوات تطوير البرمجيات Python SDK مع تحميل البيانات وزيادتها وإعداد خط أنابيب التدريب تلقائيًا.

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

في المقابل، على الرغم من فعالية YOLOv6 إلا أنه غالبًا ما يتطلب المزيد من التكوين اليدوي وإدارة التبعيات المعتادة في المستودعات الأكاديمية، مما قد يؤدي إلى إبطاء عملية وضع النماذج الأولية السريعة وتكامل MLOps.

حالات الاستخدام المثالية

متى تختار Ultralytics YOLOv8

  • تطبيقات متنوعة: عندما يحتاج مشروعك إلى أكثر من مجرد مربعات محدّدة - مثل تجزئة الكائنات أو تقدير النقاط الرئيسية - فلا غنى عن قدرات YOLOv8 8 متعددة المهام.
  • النشر على الحافة والسحابة: بفضل أنماط التصدير الخاصة به، يمكن نشر YOLOv8 بسلاسة إلى TFLite و ONNX و CoreML و TensorRT مما يغطي كل شيء من الهواتف المحمولة إلى الخوادم السحابية.
  • التطوير السريع: بالنسبة للفرق التي تحتاج إلى التكرار بسرعة، فإن التوثيق الشامل والدعم المجتمعي النشط يقلل من وقت التعطل واستكشاف الأخطاء وإصلاحها.

متى تختار YOLOv6.0

  • أجهزة صناعية محددة: إذا كانت بيئة النشر الخاصة بك تخضع لرقابة صارمة وتستخدم أجهزة تستفيد بشكل خاص من بنيات Rep-Block (مثل بعض إعدادات GPU )، فقد يوفر YOLOv6 مكاسب هامشية في السرعة.
  • الأنظمة القديمة: بالنسبة لخطوط الأنابيب الحالية المبنية بالفعل حول تنسيقات المدخلات/المخرجات الخاصة ب YOLOv6 حيث لا يمكن إعادة هيكلتها.

الخلاصة

بينما لا يزال YOLOv6.0 منافسًا قويًا في مجال محدد للكشف عن الأجسام الصناعية, Ultralytics YOLOv8 يقدم حلاً أكثر شمولاً وفعالية وملائمًا للمستقبل للغالبية العظمى من مشاريع الرؤية الحاسوبية. إن قدرته على تقديم دقة فائقة مع عدد أقل من المعلمات، بالإضافة إلى نظام بيئي مزدهر ودعم لمهام الرؤية المتعددة، يجعله الخيار الموصى به للمطورين والباحثين على حد سواء.

لأولئك الذين يتطلعون إلى استكشاف أحدث ما توصلت إليه تكنولوجيا الرؤية الحاسوبية على الإطلاق، فكّر في الاطلاع على YOLO11الذي يعمل على تحسين الكفاءة والأداء الذي أرساه YOLOv8. بالإضافة إلى ذلك، يمكن إجراء مقارنات مع النماذج القائمة على المحولات مثل RT-DETR يمكن أن توفر مزيدًا من الرؤى حول بنيات الكشف الحديثة.


تعليقات