YOLOv6.0 مقابل YOLOv8: دراسة تقنية متعمقة حول الكشف الحديث عن الكائنات

في مجال الرؤية الحاسوبية سريع التطور، يعد اختيار نموذج الكشف عن الأجسام المناسب أمراً بالغ الأهمية لنجاح المشروع. تستكشف هذه المقارنة معلمتين هامتين في YOLO : YOLOv6.YOLOv6، وهو كاشف قوي مُحسّن للتطبيقات الصناعية، و Ultralytics YOLOv8، وهو نموذج متطور مصمم ليكون متعدد الاستخدامات وسهل الاستخدام وعالي الأداء عبر مجموعة واسعة من الأجهزة. نقوم بتحليل هياكلهما ومقاييس أدائهما ومنهجيات التدريب الخاصة بهما لمساعدتك في تحديد النموذج الأنسب لاحتياجاتك في مجال النشر.

مقارنة مقاييس الأداء

يوضح الجدول التالي مؤشرات الأداء الرئيسية لكلا النموذجين. YOLOv8 توازنًا فائقًا بين الدقة والسرعة، لا سيما في النماذج المتوسطة إلى الكبيرة الحجم، مع الحفاظ على عدد معلمات تنافسية.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv6-3.0n	640	37.5	-	1.17	4.7	11.4
YOLOv6-3.0s	640	45.0	-	2.66	18.5	45.3
YOLOv6-3.0m	640	50.0	-	5.28	34.9	85.8
YOLOv6-3.0l	640	52.8	-	8.95	59.6	150.7

YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

YOLOv6.0: دقة على مستوى صناعي

تم تصميم YOLOv6.YOLOv6، الذي أطلقته Meituan في يناير 2023، خصيصًا للتطبيقات الصناعية التي تعتبر فيها قيود الأجهزة والإنتاجية أمرًا بالغ الأهمية. ويقدم هذا البرنامج العديد من الابتكارات المعمارية التي تهدف إلى تعظيم سرعة الاستدلال على وحدات معالجة الرسومات المخصصة مثل NVIDIA T4.

الميزات المعمارية الرئيسية

الهيكل الأساسي القابل لإعادة المعلمة: يستخدم هيكلاً أساسياً من نوع VGG يتسم بالكفاءة أثناء الاستدلال ولكنه قد يكون معقداً في التدريب. تسمح طريقة "RepVGG" هذه بدمج الفروع الكثيفة أثناء التصدير.
الاندماج ثنائي الاتجاه: يعزز انتشار الميزات عبر مستويات مختلفة، مما يحسن من اكتشاف الأجسام ذات الأحجام المتنوعة.
التدريب بمساعدة المرساة: يستخدم استراتيجية التدريب بمساعدة المرساة (AAT) لتثبيت التقارب دون التضحية بمرونة الاستدلال بدون مرساة.

نقاط القوة:

إنتاجية عالية: سرعة فائقة على GPU بفضل تصميمها الأساسي المتوافق مع الأجهزة.
دعم التكمية: تركيز قوي على التكمية بعد التدريب (PTQ) والتدريب المدرك للتكمية (QAT) للنشر.

نقاط الضعف:

دعم مهام محدود: يركز بشكل أساسي على اكتشاف الكائنات، ويفتقر إلى الدعم الأصلي للتجزئة أو تقدير الوضع.
التدريب المعقد: تضيف عملية إعادة تحديد المعلمات تعقيدًا إلى عملية التدريب والتصدير.

تعرف على المزيد حول YOLOv6

Ultralytics YOLOv8: المعيار متعدد الاستخدامات

Ultralytics YOLOv8، الذي تم إطلاقه قبل أيام قليلة YOLOv6. YOLOv6، يمثل قفزة كبيرة إلى الأمام في قابلية الاستخدام والتنوع. وهو مصمم ليس فقط كنموذج، ولكن كمنصة لمختلف مهام الرؤية الحاسوبية. YOLOv8 رأس الكشف القائم على المراسي لصالح نهج خالٍ من المراسي، مما يبسط بنية النموذج ويحسن التعميم.

الابتكارات المعمارية

الكشف بدون مرساة: يلغي الحاجة إلى التكوين اليدوي لصندوق المرساة، مما يقلل من ضبط المعلمات الفائقة ويحسن الأداء على مجموعات البيانات المتنوعة.
وحدة C2f: عنق زجاجة جزئي عبر المراحل مع اثنين من التلافيف التي تحسن تدفق التدرج وتقلل حجم النموذج مع الحفاظ على الدقة.
رأس منفصل: يفصل بين مهام التصنيف والانحدار، مما يسمح لكل فرع بالتركيز على هدفه المحدد لتحقيق دقة أعلى.

مزايا YOLOv8

تعدد الاستخدامات: يدعم بشكل أساسي اكتشاف الكائنات، وتقسيم الحالات، وتقدير الوضع، والتصنيف، ومربع الحدود الموجه (OBB).
سهولة الاستخدام: تتيح Python Ultralytics Python التدريب والتحقق والنشر في بضع أسطر من التعليمات البرمجية.
كفاءة التدريب: مُحسّن للتدريب السريع على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين مع متطلبات ذاكرة أقل من العديد من البدائل القائمة على المحولات.
النظام البيئي: مدعوم بنظام Ultralytics القوي، بما في ذلك التكامل السلس مع أدوات مثل Ultralytics و Comet .

تعرف على المزيد حول YOLOv8

سير عمل مبسط

تدريب YOLOv8 أمر في غاية البساطة. يوضح مقتطف الشفرة التالي كيفية تحميل نموذج مدرب مسبقًا وبدء التدريب على مجموعة بيانات مخصصة:

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

التحليل المقارن: حالات الاستخدام والنشر

عند الاختيار بين هاتين البنيتين القويتين، غالبًا ما يعتمد القرار على المتطلبات المحددة لبيئة النشر لديك ونطاق المهام التي تحتاج إلى تنفيذها.

تطبيقات عملية في أرض الواقع

يتميز YOLOv6.0 بما يلي:

الفحص الصناعي عالي السرعة: مناسب بشكل مثالي لخطوط التصنيع التي تستخدم وحدات معالجة رسومات مخصصة حيث كل مللي ثانية من الإنتاجية مهمة.
عمليات نشر الأجهزة الثابتة: السيناريوهات التي تكون فيها الأجهزة معروفة ومُحسّنة خصيصًا (على سبيل المثال، خوادم NVIDIA ).

Ultralytics YOLOv8 تتفوق في:

Edge AI و Mobile: بنية النموذج الفعالة وسهولة التصدير إلى TFLite و CoreML يجعله مثاليًا Android iOS Android .
الروبوتات والأنظمة المستقلة: قدرتها على التعامل مع مهام متعددة مثل التجزئة وتقدير الوضع في وقت واحد توفر فهماً أكثر ثراءً للبيئة للروبوتات.
النماذج الأولية السريعة: سهولة الاستخدام والوثائق الشاملة تسمح للمطورين بالتكرار بسرعة وطرح المنتجات في السوق بشكل أسرع.

حماية مشاريعك المستقبلية

على الرغم من أن كلا النموذجين ممتازان، إلا أن مجال الذكاء الاصطناعي يتطور بسرعة مذهلة. بالنسبة للمطورين الذين يبدؤون مشاريع جديدة اليوم ويحتاجون إلى أحدث ما توصلت إليه التكنولوجيا من حيث الأداء والكفاءة، Ultralytics بالاطلاع على YOLO26.

يعتمد YOLO26 على نجاح YOLOv8 العديد من الميزات الرائدة:

NMS من البداية إلى النهاية: من خلال التخلص من تقنية Non-Maximum Suppression (NMS)، تعمل YOLO26 على تبسيط النشر وتقليل تباين زمن الاستجابة.
MuSGD Optimizer: مستوحى من تدريب LLM، يضمن هذا المحسن تقاربًا مستقرًا.
أداء محسّن على الحافة: CPU أسرع بنسبة تصل إلى 43٪ CPU ، وهو أمر بالغ الأهمية للأجهزة التي تعمل بالبطارية.
خصوصية المهمة: تعمل وظائف الخسارة المتخصصة مثل ProgLoss و STAL على تحسين اكتشاف الأجسام الصغيرة بشكل كبير.

تعرف على المزيد حول YOLO26

الخلاصة

كل من YOLOv6.0 و YOLOv8 يمثلان علامتين بارزتين في تاريخ اكتشاف الأجسام. يوفر YOLOv6. YOLOv6 حلاً متخصصًا GPU الصناعية عالية الإنتاجية. ومع ذلك، بالنسبة للغالبية العظمى من المستخدمين، Ultralytics YOLOv8 (و YOLO26 الأحدث) تجربة فائقة من خلال تنوعها وسهولة استخدامها ودعمها الشامل للمهام. تقلل القدرة على التبديل بسلاسة بين الكشف والتجزئة وتقدير الوضع داخل إطار عمل واحد بشكل كبير من تكاليف التطوير وتسرع من وقت تحقيق القيمة.

قد يرغب المطورون المهتمون ببنى أخرى في استكشاف YOLOv9 للحصول على معلومات التدرج القابلة للبرمجة أو YOLO للحصول على إمكانات الكشف عن المفردات المفتوحة.

التفاصيل

YOLOv6-3.0

المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
المنظمة: ميتوان
التاريخ: 2023-01-13
أرخايف:2301.05586
GitHub:YOLOv6

YOLOv8

المؤلفون: Glenn Jocher و Ayush Chaurasia و Jing Qiu
المؤسسة:Ultralytics
التاريخ: 2023-01-10
الوثائق:وثائق YOLOv8
GitHub:Ultralytics