تخطي إلى المحتوى

YOLOv6.0 مقابل YOLOv5: مقارنة تقنية بين أجهزة الكشف عن الأجسام في الوقت الفعلي

شهد مجال الكشف عن الأجسام في الوقت الفعلي تطوراً سريعاً، حيث تتنافس العديد من البنى الهندسية على الصدارة من حيث السرعة والدقة. ومن المعالم البارزة في هذه المسيرة YOLOv6.YOLOv6 و YOLOv5. ورغم أن كلاهما ينتمي إلى سلالة "YOLO" (You Only Look Once)، إلا أنهما يختلفان بشكل كبير في فلسفات التصميم وأهداف التحسين وحالات الاستخدام المقصودة.

يقدم هذا الدليل تحليلاً تقنياً متعمقاً لهذين النموذجين، مما يساعد المطورين والمهندسين على اختيار الأداة المناسبة لتطبيقات الرؤية الحاسوبية الخاصة بهم. سنستكشف الاختلافات في بنيتهما، وأداءهما المعياري، وكيفية مقارنتهما بالحلول الحديثة مثل Ultralytics .

نظرة عامة على مقاييس الأداء

يوضح الجدول أدناه أداء كلا النموذجين على COCO وهي معيار قياسي لاكتشاف الأجسام.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOv6-3.0: العملاق الصناعي

YOLOv6.YOLOv6، الذي يشار إليه غالبًا باسم "YOLOv6 .0: A Full-Scale Reloading"، تم تطويره بواسطة باحثين من Meituan. تم إصداره في يناير 2023، وهو مصمم خصيصًا للتطبيقات الصناعية التي تتوفر فيها أجهزة مخصصة، وتحديدًا NVIDIA .

الهندسة المعمارية والتصميم

YOLOv6 هيكلًا أساسيًا معدلًا بشكل كبير مستوحى من RepVGG. تستخدم هذه البنية إعادة تحديد المعلمات الهيكلية، مما يسمح للنموذج بأن يكون له طوبولوجيا متعددة الفروع معقدة أثناء التدريب، ولكنه ينهار إلى مكدس بسيط وعالي السرعة من التلافيف 3x3 أثناء الاستدلال.

تشمل الميزات الرئيسية ما يلي:

  • تصميم بدون مرساة: يلغي تعقيد ضبط المعلمات الفائقة لصندوق المرساة، مما يبسط مسار التدريب.
  • تعيين علامات SimOTA: استراتيجية متقدمة لتعيين العلامات تعمل على مطابقة الكائنات الحقيقية بشكل ديناميكي مع التنبؤات، مما يحسن التوافق.
  • الوعي بالتكمية: تم بناء النموذج مع مراعاة التدريب المدرك للتكمية (QAT) ، مما يضمن الحد الأدنى من فقدان الدقة عند التحويل إلى INT8 للنشر على TensorRT.

نقاط القوة والضعف

تكمن القوة الأساسية لـ YOLOv6 في إنتاجيتها الأولية على وحدات معالجة الرسومات (GPU). من خلال تحسين العمليات الملائمة للأجهزة، تحقق هذه التقنية معدل إطارات في الثانية (FPS) مذهلاً على أجهزة مثل Tesla T4. ومع ذلك، فإن هذا التخصص له ثمنه. قد تكون البنية المعاد تهيئة معلماتها أقل كفاءة على وحدات المعالجة المركزية (CPU) أو الأجهزة المحمولة حيث يمثل عرض النطاق الترددي للذاكرة عنق زجاجة. علاوة على ذلك، فإن نظامها البيئي أكثر تجزئة مقارنة بالتجربة الموحدة التي تقدمها Ultralytics.

تعرف على المزيد حول YOLOv6

YOLOv5: المعيار المتعدد الاستخدامات

YOLOv5، الذي ابتكره جلين جوشر Ultralytics أحدث ثورة في إمكانية الوصول إلى اكتشاف الكائنات. منذ إطلاقه في يونيو 2020، أصبح أحد نماذج الذكاء الاصطناعي البصري الأكثر استخدامًا على مستوى العالم، ويشتهر ببساطته التي تمكن المستخدمين من تحقيق إنجازات مذهلة دون أي خبرة مسبقة.

الهندسة المعمارية والتصميم

YOLOv5 بنية أساسية CSPDarknet، التي توازن بين قدرات استخراج الميزات والكفاءة الحسابية. وقد أدخلت العديد من الابتكارات التي أصبحت الآن قياسية، مثل طبقة Focus (في الإصدارات المبكرة) والاستخدام الواسع النطاق لوظائف تنشيط SiLU.

تشمل الميزات الرئيسية ما يلي:

  • نظام بيئي يركز على المستخدم: YOLOv5 مجرد نموذج؛ إنه إطار عمل كامل. ويشمل تكاملًا سلسًا لتعزيز البيانات وتطوير المعلمات الفائقة والنشر.
  • دعم واسع للأجهزة: على عكس النماذج المُحسّنة حصريًا لوحدات معالجة الرسومات (GPU) المتطورة، YOLOv5 بشكل موثوق عبر وحدات المعالجة المركزية (CPU) والأجهزة الطرفية مثل Raspberry Pi وشرائح الهواتف المحمولة عبر TFLite.
  • قدرات متعددة المهام: بالإضافة إلى الكشف البسيط، YOLOv5 تقسيم وتصنيف الحالات ، مما يجعله خيارًا مرنًا للمشاريع المعقدة.

نقاط القوة والضعف

YOLOv5 بتنوعه وسهولة استخدامه. متطلبات الذاكرة الخاصة به أثناء التدريب أقل بكثير من العديد من المنافسين، مما يسمح للمستخدمين بالتدريب على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين. في حين أن النماذج الأحدث قد تتفوق عليه في المقاييس المعيارية البحتة على أجهزة معينة، YOLOv5 حلاً قوياً ومجرباً للتطبيقات العامة.

تعرف على المزيد حول YOLOv5

حالات الاستخدام المثالية

متى تختار YOLOv6-3.0

يعد YOLOv6.0 منافسًا قويًا في البيئات الصناعية الصارمة حيث:

  • GPU مخصصة: تستخدم بيئة النشر حصريًا NVIDIA (مثل T4 أو V100 أو Jetson Orin) و TensorRT.
  • الإنتاجية أمر بالغ الأهمية: في سيناريوهات مثل فحص خطوط الإنتاج عالية السرعة، حيث تكون زمناً من التأخير الذي لا يتجاوز أجزاء من الثانية على أجهزة معينة هو المقياس الوحيد للنجاح.

متى تختار YOLOv5

YOLOv5 الخيار الأفضل لمجموعة واسعة من التطبيقات:

  • CPU الحافة CPU : بالنسبة للأجهزة مثل Raspberry Pi والهواتف المحمولة أو حالات السحابة CPU، توفر بنية YOLOv5 توافقًا وسرعة أفضل.
  • النماذج الأولية السريعة: سهولة التدريب والتوثيق الشامل تتيح للمطورين الانتقال من مجموعة البيانات إلى النموذج المطبق في غضون ساعات.
  • التدريب المحدود الموارد: إذا كنت تقوم بالتدريب على أجهزة محدودة (على سبيل المثال، GPU واحدة GPU ذاكرة VRAM سعة 8 جيجابايت)، فإن كفاءة YOLOv5 لا مثيل لها.

Ultralytics : ما وراء النموذج

على الرغم من أهمية الهندسة المعمارية، غالبًا ما يحدد النظام البيئي المحيط بالنموذج نجاح المشروع. توفر Ultralytics بما في ذلك YOLOv5 اللاحقة، مزايا مميزة:

  1. سهولة الاستخدام: توحدPython Ultralytics Python التدريب والتحقق والاستدلال. التبديل بين YOLOv5 و YOLO11أو YOLO26 يتطلب تغيير سلسلة واحدة فقط في الكود الخاص بك.
  2. نظام بيئي جيد الصيانة: يضمن التطوير النشط والتحديثات المتكررة والمجتمع النابض بالحياة إصلاح الأخطاء بسرعة ودمج الميزات الجديدة (مثل نماذج World) بسلاسة.
  3. كفاءة التدريب: Ultralytics كفاءة التدريب Ultralytics ، حيث توفر أوزانًا مسبقة التدريب ومُحسّنة تتقارب بسرعة مع البيانات المخصصة.
  4. تكامل المنصة: توفر Ultralytics حلاً لا يتطلب كتابة أي أكواد برمجية لإدارة مجموعات البيانات وتدريب النماذج في السحابة ونشرها على مختلف النقاط النهائية دون الحاجة إلى إدارة البنية التحتية.

تكامل سلس

تدعم Ultralytics التصدير بنقرة واحدة إلى ONNXو CoreMLو OpenVINOو TensorRT، مما يقلل بشكل كبير من الجهد الهندسي المطلوب للنشر.

التوصية: المستقبل هو YOLO26

بالنسبة للمطورين الذين يبدأون مشاريع جديدة في عام 2026، نوصي بشدة بالبحث عن نماذج جديدة تتجاوز النماذج القديمة، مثل Ultralytics .

يمثل YOLO26 قمة الكفاءة والدقة. فهو يعالج قيود كل من YOLOv5 المفاضلة بين السرعة والدقة) و YOLOv6 صلابة الأجهزة) بتصميم مبتكر.

  • من البداية إلى النهاية: يلغي YOLO26 الحاجة إلى تقنية Non-Maximum Suppression (NMS)، وهي خطوة ما بعد المعالجة التي تعقد عملية النشر وتزيد من زمن الاستجابة. وهذا يجعل عملية المعالجة أبسط وأسرع.
  • CPU : مع إزالة Distribution Focal Loss (DFL) وإجراء تعديلات معمارية محددة، يحقق YOLO26 استنتاجًا أسرع بنسبة تصل إلى 43٪ على وحدات المعالجة المركزية، مما يجعله مثاليًا للحوسبة الطرفية.
  • محسّن MuSGD: مستوحى من الابتكارات في تدريب نموذج اللغة الكبيرة (LLM)، يضمن محسّن MuSGD الجديد ديناميكيات تدريب مستقرة وتقارب أسرع، حتى في مجموعات البيانات الأصغر حجماً.
  • تحسين اكتشاف الأجسام الصغيرة: أدى إدخال وظائف ProgLoss و STAL إلى تحسين الأداء بشكل كبير على الأجسام الصغيرة، وهو مطلب أساسي لمهام التصوير الجوي والاستشعار عن بعد.

تعرف على المزيد حول YOLO26

مثال على التعليمات البرمجية

تم تصميم Ultralytics تطبيق Ultralytics بحيث تكون متسقة عبر أجيال النماذج. إليك كيفية تحميل وتشغيل الاستدلال بسهولة، سواء كنت تستخدم YOLOv5 YOLO26 الموصى به.

from ultralytics import YOLO

# Load the recommended YOLO26 model (or YOLOv5)
# Switch to 'yolov5s.pt' to use YOLOv5
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset
# The system automatically handles data downloading and preparation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
# The predict method returns a list of Result objects
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Process results
for result in results:
    result.show()  # Display result to screen
    result.save(filename="result.jpg")  # Save result to disk

للمستخدمين المهتمين بقدرات أخرى متطورة، ننصحهم باستكشاف YOLO للكشف عن المفردات المفتوحة أو RT-DETR للحصول على دقة قائمة على المحولات.

الخلاصة

كل من YOLOv6.0 و YOLOv5 دوراً محورياً في تطوير الرؤية الحاسوبية. فقد YOLOv6 حدود GPU ، بينما YOLOv5 الوصول إلى أدوات الذكاء الاصطناعي القوية. ومع ذلك، فإن هذا المجال يتطور بسرعة. مع YOLO26، Ultralytics أفضل ما في العالمين: سرعة التصميم المدرك للأجهزة، وبساطة خط الإنتاج الشامل، وتعدد استخدامات النظام البيئي الشامل. سواء كنت تنشر في مصنع أو تطبيق جوال، يظل Ultralytics هو الخيار الأفضل لبناء حلول الذكاء الاصطناعي القابلة للتطوير والصيانة.


تعليقات