YOLOv5 vs. YOLOv6-3.0: دليل شامل لنماذج اكتشاف الكائنات في الوقت الفعلي
يشهد مجال الرؤية الحاسوبية تطوراً مستمراً، حيث تساهم البنيات الجديدة في تجاوز حدود السرعة والدقة. عند اختيار نموذج لمشروعك القادم في مجال الرؤية المعتمدة على الذكاء الاصطناعي، يجد المطورون أنفسهم غالباً في حالة مقارنة بين أطر العمل الراسخة ومتعددة الاستخدامات وبين كواشف صناعية عالية التخصص. يستعرض هذا التحليل العميق الفروق التقنية بين Ultralytics YOLOv5 و YOLOv6-3.0 من Meituan، مما يساعدك في اختيار الأداة الأنسب لاحتياجات النشر الخاصة بك.
مقدمة عن النماذج
Ultralytics YOLOv5: المعيار متعدد الاستخدامات
بعد إصداره في عام 2020، سرعان ما أصبح Ultralytics YOLOv5 المعيار الذهبي لاكتشاف الكائنات بشكل يسهل الوصول إليه وبأداء عالٍ. يشتهر النموذج بسهولة استخدامه الفائقة، وخطوط أنابيب التدريب القوية، وتكاملات النشر الواسعة.
- المؤلف: Glenn Jocher
- المؤسسة: Ultralytics
- التاريخ: 2020-06-26
- GitHub: ultralytics/yolov5
صُمم YOLOv5 من الألف إلى الياء لتوفير تجربة تطوير سلسة داخل نظام PyTorch. يوفر توازناً ممتازاً في الأداء، محققاً دقة متوسطة (mAP) عالية مع الحفاظ على سرعات استنتاج كبيرة مناسبة لسيناريوهات النشر الواقعية المتنوعة، بدءاً من أجهزة الحافة وحتى خوادم السحابة.
YOLOv6-3.0: الإنتاجية الصناعية
طُوّر YOLOv6-3.0 بواسطة قسم الرؤية الحاسوبية بالذكاء الاصطناعي في Meituan، وهو مصمم خصيصاً للتطبيقات الصناعية، مع إعطاء أولوية قصوى للإنتاجية الخام على مسرعات الأجهزة المخصصة.
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, وآخرون.
- المؤسسة: Meituan
- التاريخ: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
يهدف YOLOv6 إلى تعظيم سرعة المعالجة على وحدات معالجة الرسومات مثل NVIDIA T4. يستخدم أساليب تكميم مخصصة وبنيات أساسية متخصصة لتحقيق أدائه، مما يجعله مرشحاً قوياً لمعالجة الخادم الخلفي حيث يتم استخدام استنتاج الدفعات بكثافة.
الاختلافات المعمارية
يعد فهم الخيارات المعمارية وراء هذه النماذج أمراً بالغ الأهمية لتحديد حالات الاستخدام المثالية لها.
بنية YOLOv5
يستخدم YOLOv5 بنية CSPDarknet أساسية محسنة للغاية مدمجة مع عنق من نوع شبكة تجميع المسارات (PANet). تم ضبط هذا الهيكل بدقة لضمان الحد الأدنى من متطلبات الذاكرة أثناء التدريب والاستنتاج. على عكس نماذج Transformer الضخمة التي تتطلب كميات هائلة من ذاكرة CUDA وأوقات تدريب طويلة، يعمل YOLOv5 بكفاءة على الأجهزة الاستهلاكية القياسية.
صُممت نماذج Ultralytics خصيصاً لكفاءة التدريب. يمكنك غالباً تدريب نموذج YOLOv5 على وحدة معالجة رسومات واحدة متوسطة المدى، مما يجعله سهل الوصول للغاية للباحثين والشركات الناشئة على حد سواء.
علاوة على ذلك، YOLOv5 ليس مجرد كاشف للكائنات. تمتد بنيته بسلاسة لتشمل مهام أخرى، حيث توفر دعماً قوياً وجاهزاً لـ تجزئة الصور و تصنيف الصور.
بنية YOLOv6-3.0
يتميز YOLOv6-3.0 ببنية أساسية من نوع EfficientRep، مصممة لتكون صديقة للأجهزة، وخاصة لتنفيذ وحدات معالجة الرسومات. يستخدم وحدة تسلسل ثنائية الاتجاه (BiC) في عنقه لتعزيز دمج الميزات.
أثناء التدريب، يستخدم YOLOv6 استراتيجية التدريب المدعوم بالمرساة (AAT) لتحقيق الاستقرار في التقارب، على الرغم من أنه يظل كاشفاً خالياً من المراسي أثناء الاستنتاج. وبينما تتفوق هذه البنية في المهام المسرعة بواسطة وحدة معالجة الرسومات، فقد تكون في بعض الأحيان أكثر تعقيداً للتكيف مع أجهزة الحافة المتنوعة مقارنة بإطار العمل YOLOv5 القابل للنقل بدرجة كبيرة.
تحليل الأداء
عند تقييم هذه النماذج، تعد مقاييس السرعة الخام والدقة أمراً حيوياً. فيما يلي جدول مقارنة يسلط الضوء على أداء أحجام النماذج المختلفة على مجموعة بيانات COCO.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ملي ثانية) | السرعة T4 TensorRT10 (ملي ثانية) | المعلمات (مليون) | FLOPs (مليار) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
بينما يحقق YOLOv6-3.0 نتائج mAP أعلى في متغيراته الأكبر، يحافظ YOLOv5 على بصمة خفيفة الوزن بشكل لا يصدق. على سبيل المثال، يتطلب YOLOv5n معلمات و FLOPs أقل بكثير من نظيره في YOLOv6، مما يجعله مثالياً جداً للنشر على الأجهزة المحمولة أو الأجهزة المعتمدة على CPU.
النظام البيئي وسهولة الاستخدام
العامل الحاسم الحقيقي للعديد من الفرق الهندسية هو النظام البيئي المحيط بالنموذج.
يعد YOLOv6 مستودعاً بحثياً مثيراً للإعجاب، لكنه يتطلب قدراً كبيراً من التعليمات البرمجية القياسية للنشر عبر تنسيقات مختلفة. في المقابل، تقدم Ultralytics نظاماً بيئياً مُصاناً جيداً يتميز بتجربة مستخدم مبسطة. من خلال واجهة برمجة تطبيقات Python الموحدة و منصة Ultralytics البديهية، يكتسب المطورون إمكانية الوصول إلى إدارة سلسة لمجموعات البيانات، والتدريب بضغطة زر واحدة، والتصدير المباشر إلى تنسيقات مثل ONNX و TensorRT.
مثال برمجي: واجهة برمجة تطبيقات Ultralytics الموحدة
تسمح لك حزمة ultralytics عبر pip بتحميل وتدريب ونشر النماذج في بضعة أسطر فقط من التعليمات البرمجية.
from ultralytics import YOLO
# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")
# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for edge deployment
model.export(format="onnx")حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLOv5 و YOLOv6 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
متى تختار YOLOv5
YOLOv5 هو خيار قوي لـ:
- أنظمة الإنتاج المثبتة: عمليات النشر الحالية التي يتم فيها تقدير سجل YOLOv5 الطويل من الاستقرار، والتوثيق المكثف، والدعم المجتمعي الهائل.
- التدريب بموارد محدودة: البيئات ذات موارد GPU المحدودة حيث يكون خط أنابيب التدريب الفعال ومتطلبات الذاكرة الأقل لـ YOLOv5 ميزة كبيرة.
- دعم واسع لتنسيقات التصدير: المشاريع التي تتطلب النشر عبر العديد من التنسيقات بما في ذلك ONNX، و TensorRT، و CoreML، و TFLite.
متى تختار YOLOv6
يوصى بـ YOLOv6 لـ:
- النشر المدرك للأجهزة الصناعية: السيناريوهات التي يوفر فيها التصميم المدرك للأجهزة وإعادة المعلمات الفعالة للنموذج أداءً محسناً على أجهزة مستهدفة محددة.
- الاكتشاف السريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستنتاج الخام على GPU لمعالجة الفيديو في الوقت الفعلي في بيئات محكومة.
- تكامل نظام Meituan البيئي: الفرق التي تعمل بالفعل ضمن كومة تقنيات Meituan وبنية النشر التحتية الخاصة بها.
متى تختار Ultralytics (YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطورين:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استدلالاً ثابتاً ومنخفض التأخير دون تعقيد المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئات تعتمد فقط على CPU: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث توفر سرعة استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
المضي قدماً: ميزة YOLO26
بينما يظل YOLOv5 حصاناً قوياً يمكن الاعتماد عليه، ويوفر YOLOv6-3.0 إنتاجية قوية لوحدات معالجة الرسومات الصناعية، فإن أحدث التقنيات قد تطورت. بالنسبة للمطورين الذين يبدأون مشاريع جديدة اليوم، فإن المسار الموصى به هو Ultralytics YOLO26.
تم إصدار YOLO26 في يناير 2026، وهو يمثل قفزة هائلة للأمام. إنه يرث التنوع غير المسبوق لنظام Ultralytics البيئي مع تقديم تحسينات معمارية رائدة:
- تصميم شامل خالٍ من NMS: يلغي YOLO26 معالجة ما بعد الاستنتاج عبر قمع غير الحد الأقصى (Non-Maximum Suppression)، مما يقلل بشكل كبير من تباين زمن الوصول ويبسط منطق النشر.
- سرعة استنتاج على CPU أسرع بنسبة تصل إلى 43%: مع إزالة DFL ورأس محسّن، يتفوق بشكل كبير على الأجيال السابقة على أجهزة الحافة والأجهزة منخفضة الطاقة.
- محسن MuSGD: من خلال الاستفادة من ابتكارات تدريب LLM، يضمن محسن MuSGD الجديد تدريباً مستقراً للغاية وتقارباً سريعاً بشكل ملحوظ.
- تنوع متقدم: يتعامل YOLO26 بسلاسة مع صندوق الإحاطة الموجه (OBB)، و تقدير الوضع (Pose Estimation)، والتجزئة مع خسائر مهام متخصصة مثل ProgLoss و STAL للتعرف على الكائنات الصغيرة بشكل لا مثيل له.
إذا كنت تستكشف خيارات أخرى ضمن نظام Ultralytics البيئي، فقد تفكر أيضاً في YOLO11 للأغراض العامة أو YOLO-World المبتكر لمهام الاكتشاف مفتوح المفردات.
خاتمة
لقد أثر كل من YOLOv5 و YOLOv6-3.0 بشكل كبير على مجال الرؤية الحاسوبية. يوفر YOLOv6-3.0 إنتاجية ممتازة لأجهزة الخادم المتطورة، مما يجعله مناسباً للتحليلات غير المتصلة بالإنترنت المتخصصة. ومع ذلك، يظل YOLOv5 الخيار الأفضل للمطورين الذين يحتاجون إلى نموذج قوي وسهل الاستخدام ومتعدد الاستخدامات ومدعوم بمنصة عالمية المستوى.
لتحقيق التوازن النهائي بين دقة الجيل التالي، والنشر الأصلي الخالي من NMS، وأفضل تجربة للمطورين في الصناعة، يعد الترقية إلى YOLO26 عبر منصة Ultralytics الخيار الأمثل لحلول الرؤية الحاسوبية الحديثة بالذكاء الاصطناعي.