تخطي إلى المحتوى

YOLO11 مقابل YOLOv5: تطور أحدث التقنيات في مجال الكشف عن الأجسام

لقد تم تشكيل تطور الكشف عن الكائنات في الوقت الفعلي بشكل كبير من خلال سلسلة Ultralytics YOLO. YOLOv5، الذي تم إصداره في عام 2020، وضع معيارًا عالميًا لسهولة الاستخدام والسرعة والموثوقية، ليصبح أحد نماذج الذكاء الاصطناعي للرؤية الأكثر انتشارًا في التاريخ. YOLO11، أحدث تكرار، يبني على هذا الأساس الأسطوري لتقديم دقة وكفاءة وتنوع غير مسبوق.

يقدم هذا الدليل مقارنة فنية مفصلة بين هذين النموذجين القويين، مما يساعد المطورين والباحثين على فهم التحولات المعمارية ومكاسب الأداء وحالات الاستخدام المثالية لكل منهما.

تحليل الأداء

تسلط فجوة الأداء بين YOLO11 و YOLOv5 الضوء على التطورات السريعة في تصميم الشبكات العصبية. في حين أن YOLOv5 لا يزال نموذجًا قادرًا، إلا أن YOLO11 يتفوق عليه باستمرار عبر جميع مقاييس النماذج، لا سيما من حيث سرعة الاستدلال لوحدة المعالجة المركزية CPU ودقة الكشف.

مقاييس الأداء الرئيسية

يعرض الجدول أدناه مقارنة مباشرة على مجموعة بيانات COCO. الملاحظة الحاسمة هي كفاءة YOLO11n، التي تحقق 39.5 mAP، متجاوزة بشكل كبير 28.0 mAP الخاصة بـ YOLOv5n، بينما تعمل أيضًا بشكل أسرع على أجهزة CPU.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

الدقة مقابل الكفاءة

يمثل YOLO11 نقلة نوعية في المفاضلة بين "الكفاءة مقابل الدقة".

  • اكتشاف الكائنات الصغيرة: YOLO11 يحسن بشكل كبير اكتشاف الكائنات الصغيرة مقارنة بـ YOLOv5، وذلك بفضل طبقات استخراج الميزات المحسنة.
  • كفاءة الحوسبة: يحقق YOLO11l قيمة 53.4 mAP مع 25.3 مليون معلمة فقط. في المقابل، يتطلب YOLOv5l عدد 53.2 مليون معلمة للوصول إلى mAP أقل يبلغ 49.0. هذا الانخفاض بنسبة 50% في المعلمات للحصول على دقة أعلى يترجم إلى استخدام أقل للذاكرة وأوقات تدريب أسرع.

خالي من المرساة مقابل المرتكز على المرساة

أحد أهم الاختلافات التقنية هو آلية رأس الكشف (detection head). يستخدم YOLOv5 نهجًا قائمًا على الربط (anchor-based)، والذي يتطلب مربعات ربط محددة مسبقًا يجب ضبطها لمجموعات بيانات معينة لتحقيق الأداء الأمثل.

YOLO11 يستخدم تصميم خالٍ من المرساة. هذا يلغي الحاجة إلى حساب مربع المرساة اليدوي، ويبسط مسار التدريب، ويحسن التعميم على مجموعات البيانات المتنوعة دون ضبط المعلمات الفائقة.

تصميم وهندسة النموذج

تعكس الاختلافات المعمارية بين هذين النموذجين تطور أبحاث رؤية الكمبيوتر على مدى عدة سنوات.

YOLOv5: المعيار المثبت

YOLOv5 قدم تطبيق PyTorch سهل الاستخدام جعل اكتشاف الكائنات في متناول الجماهير.

  • العمود الفقري: يستخدم CSPDarknet53 معدل، وهو فعال للغاية ولكنه أثقل حسابيًا من البدائل الحديثة.
  • التركيز: أعطى الأولوية لتحقيق التوازن بين السرعة والدقة الذي كان ثوريًا عند إصداره في عام 2020.
  • قديم: لا يزال "خيارًا آمنًا" للأنظمة المدمجة بعمق بالفعل مع تنسيقات الإدخال/الإخراج الخاصة به.

تعرف على المزيد حول YOLOv5

YOLO11: أحدث التقنيات

YOLO11 يدمج أحدث تقنيات التعلم العميق لزيادة إعادة استخدام الميزات وتقليل النفقات الحسابية.

  • كتلة C3k2: تطور عنق الزجاجة CSP، تتيح هذه الكتلة تدفق تدرج أكثر كفاءة ودمج الميزات.
  • وحدة C2PSA: تقدم آليات الانتباه المكاني، مما يمكّن النموذج من التركيز على المناطق الهامة في الصورة لتحسين تحديد موقع الكائن.
  • رأس متعدد المهام: على عكس YOLOv5، الذي يتطلب تفرعات نموذج منفصلة لمهام مختلفة، يدعم YOLO11 أصلاً Object Detection و Instance Segmentation و Pose Estimation و Oriented Bounding Boxes (OBB) والـ classify في إطار عمل موحد.

تعرف على المزيد حول YOLO11

جدول المقارنة: المواصفات الفنية

ميزةYOLOv5YOLO11
البنيةالعمود الفقري CSPDarknetالعمود الفقري المحسن مع C3k2 و C2PSA
رأس الكشفمستند على مرساةخالي من المرساة
المهامDetect, Segment, ClassifyDetect, Segment, Classify, Pose, OBB, Track
رخصةAGPL-3.0AGPL-3.0
تاريخ الإصداريونيو 2020سبتمبر 2024
سهولة الاستخدامعالية (سطر الأوامر و PyTorch Hub)عالي جدًا (حزمة تطوير برامج python و CLI موحدة)

التدريب والنظام البيئي

يستفيد كلا النموذجين من نظام Ultralytics البيئي القوي، الذي يوفر أدوات سلسة لإدارة البيانات والتدريب والنشر.

كفاءة التدريب

تم تصميم YOLO11 للتدريب بشكل أسرع والتقارب بسرعة أكبر من YOLOv5.

  • إعدادات افتراضية ذكية: يقوم محرك Ultralytics تلقائيًا بتهيئة المعلمات الفائقة بناءً على حجم مجموعة البيانات والنموذج، مما يقلل الحاجة إلى ضبط المعلمات الفائقة يدويًا.
  • استخدام الذاكرة: بفضل العدد المنخفض للمعلمات، تستهلك نماذج YOLO11 عمومًا ذاكرة وصول عشوائي مرئية أقل لوحدة معالجة الرسومات (GPU VRAM) أثناء التدريب، مما يسمح بأحجام دفعات أكبر على الأجهزة الاستهلاكية.

مثال على التعليمات البرمجية: تدريب YOLO11

تدريب YOLO11 مُبسَّط باستخدام ultralytics حزمة Python. يوضح المثال التالي كيفية تدريب نموذج YOLO11n على مجموعة بيانات COCO8.

from ultralytics import YOLO

# Load a pre-trained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model
# The device argument can be 'cpu', 0 for GPU, or [0, 1] for multi-GPU
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

تكامل النظام الإيكولوجي

في حين أن YOLOv5 لديه مجموعة واسعة من البرامج التعليمية التابعة لجهات خارجية نظرًا لعمره، فإن YOLO11 مدمج أصلاً في حزمة Ultralytics الحديثة. يوفر هذا وصولاً فوريًا إلى الميزات المتقدمة:

  • تصدير بنقرة واحدة: تصدير إلى ONNX و OpenVINO و TensorRT و CoreML بأمر واحد.
  • التتبع: دعم مدمج لتتبع الكائنات (BoT-SORT، ByteTrack) بدون مستودعات خارجية.
  • المستكشف: استخدم واجهة برمجة التطبيقات Ultralytics Explorer لتصور مجموعات البيانات الخاصة بك والاستعلام عنها باستخدام SQL والبحث الدلالي.

حالات الاستخدام المثالية

يعتمد اختيار النموذج المناسب على القيود والمتطلبات المحددة لمشروعك.

متى تختار YOLO11

YOLO11 هو الخيار الموصى به لـ 95% من المشاريع الجديدة.

  1. تطورات جديدة: إذا كنت تبدأ من الصفر، فإن YOLO11 يوفر أفضل حماية للمستقبل ودقة وسرعة.
  2. النشر على وحدة المعالجة المركزية CPU: بالنسبة للأجهزة الطرفية التي تعمل على وحدة المعالجة المركزية CPU (مثل Raspberry Pi والهواتف المحمولة)، يكون YOLO11n أسرع وأكثر دقة بشكل ملحوظ من YOLOv5n.
  3. مهام معقدة: المشاريع التي تتطلب تقدير الوضع أو OBB (مثل الصور الجوية، وتحليل المستندات) مدعومة أصلاً بواسطة YOLO11.
  4. السحابة والخادم: إن الإنتاجية العالية لـ YOLO11 تجعله مثاليًا لمعالجة تدفقات الفيديو الضخمة في الوقت الفعلي.

متى تلتزم بـ YOLOv5

لا يزال YOLOv5 خيارًا قابلاً للتطبيق في سيناريوهات الأنظمة القديمة المحددة.

  1. الصيانة القديمة: إذا كان لديك نظام إنتاج مقترن بشكل كبير بقاعدة أكواد YOLOv5 المحددة أو تنسيق الإخراج.
  2. ضبط أجهزة محدد: قد تحتوي بعض المسرّعات المضمنة القديمة على برامج ثابتة مُحسَّنة للغاية تم التحقق من صحتها خصيصًا لطبقات YOLOv5 (على الرغم من أن معظم أوقات التشغيل الحديثة مثل OpenVINO تفضل الآن البنى الأحدث).
  3. خط الأساس الأكاديمي: غالبًا ما يستشهد الباحثون الذين يقارنون بالخطوط الأساسية التاريخية بـ YOLOv5 نظرًا لوجوده الطويل الأمد في الأدبيات.

الترحيل إلى YOLO11

إن الترحيل من YOLOv5 إلى YOLO11 أمر مباشر. يظل تنسيق مجموعة البيانات (YOLO TXT) متطابقًا، مما يعني أنه يمكنك إعادة استخدام مجموعات البيانات المشروحة الموجودة لديك دون تعديل. هيكل Python API مشابه جدًا أيضًا، وغالبًا ما يتطلب فقط تغييرًا في سلسلة اسم النموذج (على سبيل المثال، من yolov5su.pt إلى yolo11n.pt في نطاق ultralytics حزمة).

استكشاف خيارات أخرى

تدعم Ultralytics مجموعة واسعة من النماذج تتجاوز مجرد YOLO11 و YOLOv5. بناءً على احتياجاتك الخاصة، قد تفكر في:

  • YOLOv8: السلف المباشر لـ YOLO11، حيث يوفر توازنًا رائعًا في الميزات واعتمادًا صناعيًا واسع النطاق.
  • YOLOv10: بنية تركز على التدريب بدون NMS لتقليل زمن الوصول في تطبيقات معينة في الوقت الفعلي.
  • RT-DETR: كاشف يعتمد على المحولات ويتفوق في الدقة للحالات التي تكون فيها سرعة الاستدلال أقل أهمية من الدقة القصوى.
  • YOLOv9: يشتهر بمفهوم معلومات التدرج القابلة للبرمجة (PGI)، ويقدم أداءً قويًا في مهام الـ detection الصعبة.

الخلاصة

تمثل المرحلة الانتقالية من YOLOv5 إلى YOLO11 علامة فارقة مهمة في تاريخ رؤية الكمبيوتر. لقد أضفت YOLOv5 طابعًا ديمقراطيًا على الذكاء الاصطناعي، مما جعل اكتشاف الكائنات في متناول الجميع. تعمل YOLO11 على إتقان هذه الرؤية، وتقديم نموذج أسرع وأخف وزنًا وأكثر دقة.

بالنسبة للمطورين الباحثين عن أفضل أداء لكل واط ومجموعة الميزات الأكثر تنوعًا، فإن YOLO11 هو الفائز الواضح. يضمن تكامله في نظام Ultralytics البيئي النشط إمكانية الوصول إلى أحدث الأدوات وواجهات برمجة التطبيقات البسيطة ومجتمع مزدهر لدعم رحلة الذكاء الاصطناعي الخاصة بك.

هل أنت مستعد للترقية؟ تحقق من وثائق YOLO11 أو استكشف مستودع GitHub لتبدأ اليوم.


تعليقات