YOLOv5 مقابل YOLOv6-3.0: مقارنة فنية شاملة

في مجال الرؤية الحاسوبية سريع التطور، لم يكن لأي مجموعة من النماذج تأثير كبير مثل سلسلة YOLO You Only Look Once). تتعمق هذه المقارنة في نسختين مهمتين: Ultralytics YOLOv5، النموذج الأسطوري الذي جعل اكتشاف الأجسام في متناول الجميع بفضل سهولة استخدامه، و YOLOv6.YOLOv6، الإصدار القوي من Meituan الذي يركز على التطبيقات الصناعية. سنستكشف الاختلافات في بنيتهما ومقاييس أدائهما وحالات الاستخدام المثالية لمساعدتك في اختيار الأداة المناسبة لمشروعك.

ملخص تنفيذي

يمثل كلا النموذجين علامات فارقة مهمة في مجال الكشف عن الأجسام في الوقت الفعلي. YOLOv5 يشتهر بسهولة استخدامه التي لا مثيل لها، وقوته، ونظامه البيئي الواسع الذي يدعم دورة حياة التعلم الآلي بأكملها. يركز YOLOv6.YOLOv6 بشكل كبير على تحسين الإنتاجية GPU محددة، مما يجعله منافسًا قويًا في عمليات النشر الصناعية حيث يمثل زمن الاستجابة الذي يبلغ أجزاء من الثانية على الأجهزة المخصصة القيد الأساسي.

ومع ذلك، بالنسبة للمطورين الذين يبدؤون مشاريع جديدة في عام 2026، فقد تغير المشهد بشكل أكبر. يقدم إصدار Ultralytics تصميمًا أصليًا شاملاً NMS CPU أسرع بنسبة تصل إلى 43٪ CPU مما يوفر ترقية جذابة مقارنة بسابقيه.

YOLOv5 Ultralytics YOLOv5

صدر في يونيو 2020 عن جلين جوشر و Ultralytics، غيّر YOLOv5 طريقة تفاعل المطورين مع الذكاء الاصطناعي. لم يكن مجرد نموذج؛ بل كان إطار عمل كامل مصمم لتسهيل الوصول إليه.

المؤلفون: Glenn Jocher
المؤسسة:Ultralytics
التاريخ: 2020-06-26
GitHub:ultralytics/yolov5

YOLOv5 لسهولة الاستخدام والتنوع. وهو يدعم مجموعة واسعة من المهام التي تتجاوز الكشف، بما في ذلك تقسيم الحالات وتصنيف الصور. وتوازن بنيته بين السرعة والدقة مع الحفاظ على متطلبات ذاكرة منخفضة، مما يجعله سهل الاستخدام للغاية للنشر على أجهزة مثل Raspberry Pi أو NVIDIA .

تعرف على المزيد حول YOLOv5

نظرة عامة على Meituan YOLOv6-3.0

يُعد YOLOv6، الذي طورته Meituan، كاكتشاف كائنات أحادي المرحلة مخصص للتطبيقات الصناعية. وقد أدخل الإصدار 3.0، الذي يحمل عنوان "إعادة تحميل شاملة"، تغييرات كبيرة في البنية لتعزيز الأداء على المعايير القياسية.

المؤلفون: تشوي لي، لولو لي، ييفي جينغ، وآخرون.
المنظمة: ميتوان
التاريخ: 2023-01-13
Arxiv:YOLOv6 v3.0: A Full-Scale Reloading
GitHub:meituan/YOLOv6

يستخدم YOLOv6.YOLOv6 هيكل أساسي من نوع RepVGG وهو فعال في GPU ولكنه قد يكون أكثر تعقيدًا في التدريب بسبب الحاجة إلى إعادة تحديد المعلمات الهيكلية.

تعرف على المزيد حول YOLOv6

مقارنة مقاييس الأداء

يوضح الجدول التالي مقاييس الأداء الرئيسية في مجموعة بيانات COCO . في حين يُظهر YOLOv6. YOLOv6 أرقامًا أولية قوية على GPU محددة، YOLOv5 CPU ممتاز وعدد معلمات أقل في العديد من التكوينات.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

YOLOv6-3.0n	640	37.5	-	1.17	4.7	11.4
YOLOv6-3.0s	640	45.0	-	2.66	18.5	45.3
YOLOv6-3.0m	640	50.0	-	5.28	34.9	85.8
YOLOv6-3.0l	640	52.8	-	8.95	59.6	150.7

سياق الأداء

تعد المقاييس المعيارية أمرًا بالغ الأهمية، ولكن الأداء الفعلي يعتمد بشكل كبير على بيئة النشر. غالبًا ما تُفضل Ultralytics نظرًا لقابليتها للتعميم وموثوقيتها عبر أجهزة متنوعة، وليس فقط بسبب ذروة GPU .

نظرة معمارية متعمقة

بنية YOLOv5

YOLOv5 شبكة CSPDarknet الأساسية، والتي تتميز بكفاءة عالية في استخراج الميزات. ويشمل تصميمها ما يلي:

طبقة التركيز (تم دمجها لاحقًا في Conv): تقلل البعد المكاني مع زيادة عمق القناة، مما يؤدي إلى تحسين السرعة.
CSP (Cross Stage Partial) Bottleneck: يقلل من تكرار معلومات التدرج، ويقلل من المعلمات وعمليات FLOPs مع تحسين الدقة.
PANet Neck: يعزز انتشار الميزات لتحسين تحديد الموقع.
رأس قائم على المثبت: يستخدم مربعات مثبتة محددة مسبقًا للتنبؤ بمواقع الكائنات.

بنية YOLOv6-3.0

تتبنى YOLOv6.YOLOv6 فلسفة مختلفة مصممة خصيصًا GPU :

RepVGG Backbone: يستخدم إعادة تحديد المعلمات الهيكلية، مما يسمح بتدريب متعدد الفروع (لتحقيق تقارب أفضل) ليتم دمجه في نموذج استدلال أحادي المسار (للسرعة).
رقبة EfficientRep Bi-Fusion: تصميم رقبة مبسط لتقليل زمن الاستجابة.
رأس بدون مرساة: يلغي صناديق التثبيت، ويتنبأ بإحداثيات صندوق الحدود مباشرة، مما يبسط التصميم ولكنه قد يتطلب ضبط دقيق لوظيفة الخسارة.

ميزة Ultralytics

على الرغم من أهمية المقاييس الأولية، غالبًا ما يتم تحديد قيمة النموذج من خلال سهولة دمجه في سير عمل الإنتاج. وهنا تبرز أهمية Ultralytics .

1. سهولة الاستخدام والنظام البيئي

Ultralytics تجربة سلسة "من الصفر إلى القمة". مع ultralytics Python ، يمكنك تدريب النماذج والتحقق من صحتها ونشرها باستخدام بضع أسطر من التعليمات البرمجية. التكامل مع منصة Ultralytics يسمح بإدارة سهلة لمجموعات البيانات، التعليق التلقائي، والتدريب على السحابة.

from ultralytics import YOLO

# Load a model (YOLOv5 or the recommended YOLO26)
model = YOLO("yolo26n.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100)

# Export to ONNX for deployment
path = model.export(format="onnx")

في المقابل، غالبًا ما يتطلب نشر النماذج التي تركز على الأبحاث التنقل بين ملفات التكوين المعقدة وإدارة التبعيات يدويًا.

2. تنوع عبر المهام

YOLOv5 وخلفاؤها (مثل YOLO11 و YOLO26) لا يقتصر على اكتشاف الأجسام. فهي تدعم بشكل أساسي:

تجزئة المثيل: لفهم مستوى البكسل.
تقدير الوضع: لتتبع النقاط الرئيسية على أجسام البشر.
التصنيف: لتصنيف الصورة بأكملها.
OBB: لاكتشاف الصندوق المحيط الموجه، وهو أمر بالغ الأهمية في الصور الجوية.

YOLOv6 في الأساس نموذج للكشف عن الأجسام، مع دعم محدود للمهام الأخرى.

3. كفاءة التدريب والذاكرة

تم تحسين Ultralytics من أجل كفاءة التدريب. وعادةً ما تتطلب CUDA أقل أثناء التدريب مقارنةً بالبنى الثقيلة للمحولات أو النماذج المعقدة المعاد معايرتها. وهذا يتيح للمطورين استخدام أحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين، مما يتيح الوصول إلى تدريب الذكاء الاصطناعي عالي الأداء.

توصيات حالات الاستخدام

مناسب بشكل مثالي لـ YOLOv5

الحوسبة الطرفية: تستفيد المشاريع التي تستخدم Raspberry Pi أو الهواتف المحمولة (Android) أو الأجهزة الأخرى منخفضة الطاقة من انخفاض استهلاك YOLOv5 للذاكرة وكفاءة التصدير إلى TFLite و CoreML.
النماذج الأولية السريعة: بفضل واجهة برمجة التطبيقات البسيطة والوثائق الشاملة، تعد هذه الطريقة الأسرع للتحقق من صحة المفهوم.
تطبيقات متعددة المهام: إذا كان خط الأنابيب الخاص بك يتطلب الكشف والتجزئة والتصنيف، فإن البقاء ضمن Ultralytics الواحد يبسط عملية الصيانة.

مناسب بشكل مثالي لـ YOLOv6-3.0

GPU مخصصة: خطوط الفحص الصناعية التي تعمل على وحدات معالجة الرسومات T4 أو V100 حيث يكون تعظيم معدل الإطارات في الثانية هو المقياس الوحيد.
تحليلات الفيديو عالية الإنتاجية: سيناريوهات معالجة تدفقات فيديو متزامنة ضخمة حيث يتم الاستفادة من TensorRT المحددة.

المستقبل: لماذا الانتقال إلى YOLO26؟

بالنسبة للمطورين الذين يبحثون عن أفضل أداء على الإطلاق، Ultralytics YOLO26. تم إصداره في يناير 2026، وهو يعالج قيود الجيلين السابقين.

NMS من البداية إلى النهاية: من خلال التخلص من تقنية Non-Maximum Suppression (NMS)، تعمل YOLO26 على تبسيط منطق النشر وتقليل تباين زمن الاستجابة، وهي ميزة رائدة في YOLOv10.
MuSGD Optimizer: مستوحى من تدريب LLM (مثل Kimi K2 من Moonshot AI)، يضمن هذا المحسن تقاربًا مستقرًا وديناميكيات تدريب قوية.
كفاءة محسّنة: مع إزالة فقدان بؤرة التوزيع (DFL)، أصبح YOLO26 أسرع بنسبة تصل إلى 43٪ في CPU ، مما يجعله الخيار الأمثل للذكاء الاصطناعي المتطور.

تعرف على المزيد حول YOLO26

الخلاصة

اكتسب كل من YOLOv5 YOLOv6. YOLOv6 مكانتهما في قاعة مشاهير الرؤية الحاسوبية. يوسع YOLOv6. YOLOv6 حدود GPU للمهام الصناعية المتخصصة. ومع ذلك، YOLOv5 معيارًا قياسيًا في قابلية الاستخدام والتنوع ودعم المجتمع.

بالنسبة للمطورين المعاصرين، يتجه الاختيار بشكل متزايد نحو الجيل التالي. يجمع Ultralytics YOLOv5 النظام البيئي سهل الاستخدام لـ YOLOv5 ابتكارات المعمارية التي تتفوق على سابقيها، مما يوفر الحل الأكثر توازناً وقوة ومستقبلاً للرؤية الحاسوبية اليوم.