YOLOv5 YOLOv6.0: دليل شامل لنماذج الكشف عن الكائنات في الوقت الفعلي
يتطور مجال الرؤية الحاسوبية باستمرار، مع ظهور هياكل جديدة توسع حدود السرعة والدقة. عند اختيار نموذج لمشروع الرؤية الاصطناعية التالي، غالبًا ما يجد المطورون أنفسهم يقارنون بين الأطر الراسخة والمتعددة الاستخدامات وأجهزة الكشف الصناعية عالية التخصص. يستكشف هذا التحليل المتعمق الفروق الفنية بين Ultralytics YOLOv5 و Meituan's YOLOv6.0، مما يساعدك على اختيار أفضل أداة لتلبية احتياجاتك في مجال النشر.
مقدمة إلى النماذج
Ultralytics YOLOv5: المعيار متعدد الاستخدامات
صدر Ultralytics YOLOv5 في عام 2020،YOLOv5 أصبح المعيار الذهبي للكشف عن الكائنات المتاح وعالي الأداء. وهو مشهور بسهولة استخدامه المذهلة، وخطوط التدريب القوية، وعمليات النشر المتكاملة الواسعة النطاق.
- المؤلف: جلين جوتشر
- المؤسسة:Ultralytics
- التاريخ: 2020-06-26
- GitHub:ultralytics/yolov5
YOLOv5 تصميم YOLOv5 من الألف إلى الياء لتوفير تجربة مطور سلسة ضمن PyTorch . وهو يوفر توازنًا جيدًا في الأداء، حيث يحقق متوسط دقة ممتازًا (mAP) مع الحفاظ على سرعات استدلال عالية مناسبة لسيناريوهات النشر المتنوعة في العالم الحقيقي، من الأجهزة الطرفية إلى خوادم السحابة.
YOLOv6.0: الإنتاجية الصناعية
تم تطوير YOLOv6. YOLOv6 بواسطة قسم Vision AI في Meituan، وهو مصمم خصيصًا للتطبيقات الصناعية، مع إعطاء أولوية كبيرة للإنتاجية الأولية على مسرعات الأجهزة المخصصة.
- المؤلفون: تشوي لي، لولو لي، ييفي جينغ، وآخرون.
- المنظمة: ميتوان
- التاريخ: 2023-01-13
- أرخايف:2301.05586
- GitHub:meituan/YOLOv6
YOLOv6 إلى تعظيم سرعة المعالجة على وحدات معالجة الرسومات (GPU) مثل NVIDIA . ويستخدم طرق تكمية مخصصة وعمود فقري متخصص لتحقيق أدائه، مما يجعله مرشحًا قويًا لمعالجة الخادم الخلفي حيث يتم استخدام الاستدلال الدفعي بكثافة.
الاختلافات المعمارية
إن فهم الخيارات المعمارية الكامنة وراء هذه النماذج أمر بالغ الأهمية لتحديد حالات الاستخدام المثالية لها.
YOLOv5
YOLOv5 شبكة أساسية CSPDarknet عالية التحسين مقترنة بشبكة تجميع المسارات (PANet). تم ضبط هذه البنية بدقة شديدة لضمان الحد الأدنى من متطلبات الذاكرة أثناء التدريب والاستدلال. على عكس نماذج المحولات الكبيرة التي تتطلب كميات هائلة من CUDA وأوقات تدريب طويلة، YOLOv5 بكفاءة على الأجهزة الاستهلاكية القياسية.
كفاءة الذاكرة
تم تصميم Ultralytics خصيصًا لتحقيق الكفاءة في التدريب. يمكنك في كثير من الأحيان تدريب YOLOv5 على GPU واحدة متوسطة المدى، مما يجعله في متناول الباحثين والشركات الناشئة على حد سواء.
علاوة على ذلك، YOLOv5 مجرد كاشف للأجسام. فهيكلته تمتد بسلاسة إلى مهام أخرى، وتوفر دعماً قوياً جاهزاً للاستخدام لتقسيم الصور وتصنيفها.
بنية YOLOv6.0
يتميز YOLOv6.YOLOv6 بوجود هيكل EfficientRep، والذي تم تصميمه ليكون متوافقًا مع الأجهزة، خاصةً GPU . ويستخدم وحدة تسلسل ثنائي الاتجاه (BiC) في عنقه لتعزيز دمج الميزات.
أثناء التدريب، YOLOv6 استراتيجية التدريب بمساعدة المرجع (AAT) لتثبيت التقارب، على الرغم من أنه يظل كاشفًا خاليًا من المرجع أثناء الاستدلال. في حين أن هذه البنية تتفوق في المهام GPU، إلا أنها قد تكون في بعض الأحيان أكثر تعقيدًا للتكيف مع الأجهزة الطرفية المتنوعة مقارنة YOLOv5 عالي القابلية للنقل.
تحليل الأداء
عند تقييم هذه النماذج، تعتبر مقاييس السرعة والدقة الأولية أمراً حيوياً. يوجد أدناه جدول مقارن يسلط الضوء على أداء أحجام النماذج المختلفة على COCO .
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
بينما يحقق YOLOv6. YOLOv6 mAP أعلى في متغيراته الأكبر حجمًا، YOLOv5 حجم صغير للغاية. على سبيل المثال، يتطلب YOLOv5n معلمات وعمليات FLOP أقل بكثير من YOLOv6 مما يجعله مثاليًا للغاية للاستخدامات المتنقلة أو CPU.
النظام البيئي وسهولة الاستخدام
العامل الحقيقي الذي يحدد العديد من فرق الهندسة هو النظام البيئي المحيط بالنموذج.
YOLOv6 مستودع أبحاث مثير للإعجاب، ولكنه يتطلب كودًا نمطيًا كبيرًا لنشره عبر تنسيقات مختلفة. في المقابل، Ultralytics نظامًا بيئيًا جيد الصيانة يتميز بتجربة مستخدم مبسطة. من خلال Python الموحدة Ultralytics البديهية، يمكن للمطورين الوصول إلى إدارة سلسة لمجموعات البيانات، والتدريب بنقرة واحدة، والتصدير المباشر إلى تنسيقات مثل ONNX و TensorRT.
مثال برمجي: واجهة برمجة تطبيقات Ultralytics الموحدة
UlUltralyticsytics ultralytics تتيح لك حزمة pip تحميل النماذج وتدريبها ونشرها باستخدام بضع أسطر من التعليمات البرمجية فقط.
from ultralytics import YOLO
# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")
# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for edge deployment
model.export(format="onnx")
حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLOv5 و YOLOv6 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
متى تختار YOLOv5
YOLOv5 خيار قوي لـ:
- أنظمة الإنتاج المثبتة: العمليات المنشورة الحالية حيث تُقدر سجل YOLOv5 الطويل في الاستقرار، والتوثيق الشامل، والدعم المجتمعي الهائل.
- التدريب محدود الموارد: البيئات ذات موارد GPU المحدودة حيث تكون خطة تدريب YOLOv5 الفعالة ومتطلبات الذاكرة الأقل مفيدة.
- دعم واسع لتنسيقات التصدير: المشاريع التي تتطلب النشر عبر العديد من التنسيقات بما في ذلك ONNX وTensorRT وCoreML وTFLite.
متى تختار YOLOv6
YOLOv6 في الحالات التالية:
- النشر الصناعي المدرك للأجهزة: سيناريوهات حيث يوفر تصميم النموذج المدرك للأجهزة وإعادة التكوين الفعالة أداءً محسنًا على أجهزة مستهدفة محددة.
- detect سريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الخام على GPU لمعالجة الفيديو في الوقت الفعلي في بيئات محكومة.
- تكامل نظام Meituan البيئي: الفرق التي تعمل بالفعل ضمن مكدس تقنية Meituan والبنية التحتية للنشر.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
- بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
- اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.
المضي قدماً: ميزة YOLO26
بينما YOLOv5 أداة موثوقة وفعالة ويوفر YOLOv6. YOLOv6 GPU صناعية قوية، إلا أن أحدث التقنيات قد تطورت. بالنسبة للمطورين الذين يبدؤون مشاريع جديدة اليوم، فإن المسار الموصى به هو Ultralytics .
صدر YOLO26 في يناير 2026، وهو يمثل قفزة هائلة إلى الأمام. فهو يرث التنوع غير المسبوق Ultralytics مع إدخال تحسينات معمارية رائدة:
- تصميم شامل خالٍ من NMS: يلغي YOLO26 المعالجة اللاحقة لقمع غير الأقصى (Non-Maximum Suppression)، مما يقلل بشكل كبير من تباين زمن الانتقال ويبسط منطق النشر.
- استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): مع إزالة DFL ورأس مُحسّن، يتفوق بشكل كبير على الأجيال السابقة على الأجهزة الطرفية ومنخفضة الطاقة.
- مُحسِّن MuSGD: بالاستفادة من ابتكارات تدريب نماذج LLM، يضمن مُحسِّن MuSGD الجديد تدريبًا مستقرًا للغاية وتقاربًا سريعًا بشكل ملحوظ.
- تعدد استخدامات متقدم: يتعامل YOLO26 بسلاسة مع الصناديق المحيطة الموجهة (OBB)، وتقدير الوضعيات، والتجزئة باستخدام دوال خسارة مهام متخصصة مثل ProgLoss و STAL لتحقيق تعرف لا مثيل له على الأجسام الصغيرة.
إذا كنت تستكشف خيارات أخرى ضمن نظام Ultralytics ، فقد ترغب أيضًا في النظر في استخدام YOLO11 أو YOLO المبتكر لمهام الكشف عن المفردات المفتوحة.
الخلاصة
لقد أثر كل من YOLOv5 وYOLOv6-3.0 بشكل كبير على مجال رؤية الكمبيوتر. يوفر YOLOv6-3.0 إنتاجية ممتازة لأجهزة الخوادم المتطورة، مما يجعله مناسبًا للتحليلات المتخصصة غير المتصلة بالإنترنت. ومع ذلك، يظل YOLOv5 الخيار الأفضل للمطورين الذين يحتاجون إلى نموذج قوي وسهل الاستخدام ومتعدد الاستخدامات للغاية ومدعوم بمنصة عالمية المستوى.
للحصول على التوازن المثالي بين دقة الجيل التالي، والنشر الأصلي NMS وأفضل تجربة مطور في الصناعة، فإن الترقية إلى YOLO26 عبر Ultralytics هي الخيار الأمثل لحلول الذكاء الاصطناعي الحديثة في مجال الرؤية.