YOLO11 مقابل YOLOv5: تطور الكشف عن أحدث الأجسام
لقد تم تشكيل تطور اكتشاف الأجسام في الوقت الحقيقي بشكل كبير من خلال سلسلة Ultralytics YOLO . YOLOv5التي تم إصدارها في عام 2020، ووضعت معيارًا عالميًا لسهولة الاستخدام والسرعة والموثوقية، لتصبح أحد أكثر نماذج الذكاء الاصطناعي للرؤية انتشارًا في التاريخ. YOLO11وهو أحدث تكرار، يعتمد على هذا الأساس الأسطوري لتقديم دقة وكفاءة وتعدد استخدامات غير مسبوقة.
يقدم هذا الدليل مقارنة تقنية مفصلة بين هاتين القوتين، مما يساعد المطورين والباحثين على فهم التحولات المعمارية ومكاسب الأداء وحالات الاستخدام المثالية لكل منهما.
تحليل الأداء
تُسلط فجوة الأداء بين YOLO11 و YOLOv5 الضوء على التطورات السريعة في تصميم الشبكات العصبية. بينما يظل YOLOv5 نموذجًا قادرًا، يتفوق YOLOv5 باستمرار على YOLO11 في جميع مقاييس النموذج، خاصةً من حيث سرعة الاستدلال CPU ودقة الكشف.
مقاييس الأداء الرئيسية
يعرض الجدول أدناه مقارنة وجهاً لوجه على مجموعة بياناتCOCO . من الملاحظات المهمة هي كفاءة YOLO11n، التي تحقق 39.5 mAP متجاوزةً بشكل كبير كفاءة YOLOv5n البالغة 28.0 mAP بينما تعمل أيضًا بشكل أسرع على أجهزة CPU .
| النموذج | الحجم (بالبكسل) | mAPفال 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
الدقة مقابل الكفاءة
يمثل YOLO11 نقلة نوعية في مفاضلة "الكفاءة مقابل الدقة".
- اكتشاف الأجسام الصغيرة: يعمل YOLO11 على تحسين اكتشاف الأجسام الصغيرة بشكل كبير مقارنةً بـ YOLOv5 وذلك بفضل طبقات استخراج الميزات المحسّنة.
- كفاءة الحوسبة: يحقق YOLO11l 53.4 mAP بـ 25.3 مليون معلمة فقط. وعلى النقيض من ذلك، يتطلب YOLOv5l 53.2 مليون معلمة للوصول إلى معلمة mAP أقل من 49.0. هذا التخفيض بنسبة 50% في المعلمات للحصول على دقة أعلى يُترجم إلى استخدام أقل للذاكرة وأوقات تدريب أسرع.
خالي من المرساة مقابل المرتكز على المرساة
أحد أهم الاختلافات التقنية هي آلية رأس الكشف. YOLOv5 يستخدم نهجًا قائمًا على المرساة، وهو ما يتطلب مربعات ربط محددة مسبقًا يجب ضبطها لمجموعات بيانات محددة لتحقيق الأداء الأمثل.
YOLO11 يستخدم تصميمًا خاليًا من المرتكزات. وهذا يُلغي الحاجة إلى حساب صندوق الارتكاز يدويًا، ويُبسّط خط أنابيب التدريب، ويُحسّن التعميم على مجموعات بيانات متنوعة دون ضبط المعلمة الفائقة.
هندسة النماذج والتصميم
تعكس الاختلافات المعمارية بين هذين النموذجين تطور أبحاث الرؤية الحاسوبية على مدار عدة سنوات.
YOLOv5: المعيار المثبت
YOLOv5 قدَّم تطبيق PyTorch سهل الاستخدام جعل اكتشاف الكائنات في متناول الجميع.
- العمود الفقري: يستخدم شبكة CSPDarknet53 المعدلة، وهي فعالة للغاية ولكنها أثقل من الناحية الحسابية من البدائل الحديثة.
- التركيز: إعطاء الأولوية للتوازن بين السرعة والدقة الذي كان ثورياً عند إطلاقه في عام 2020.
- الإرث: يظل "خيارًا آمنًا" للأنظمة المدمجة بالفعل بعمق مع تنسيقات الإدخال/الإخراج الخاصة به.
YOLO11: الحافة المتطورة
YOLO11 يدمج أحدث تقنيات التعلّم العميق لزيادة إعادة استخدام الميزات وتقليل النفقات الحسابية.
- كتلة C3k2: تطور من عنق الزجاجة CSP، تسمح هذه الكتلة بتدفق التدرج ودمج الميزات بكفاءة أكبر.
- وحدة C2PSA: تقدم آليات الانتباه المكاني، مما يمكّن النموذج من التركيز على المناطق الحرجة من الصورة لتحديد موقع الجسم بشكل أفضل.
- رئيس متعدد المهام: على عكس YOLOv5 الذي يتطلب شوكات نموذجية منفصلة لمهام مختلفة، يدعم YOLO11 أصلاً اكتشاف الكائنات، وتقسيم المثيلات، وتقدير الوضعية، والمربعات المحددة الموجهة (OBB)، والتصنيف في إطار عمل موحد.
جدول المقارنة: المواصفات الفنية
| الميزة | YOLOv5 | YOLO11 |
|---|---|---|
| البنية | العمود الفقري لشبكة CSPDarknet الخلفية | العمود الفقري المحسّن مع C3k2 و C2PSA |
| رأس الكشف | مستند على مرساة | خالي من المرساة |
| المهام | الكشف، والتقسيم، والتصنيف | الكشف، والتقسيم، والتصنيف، والتصنيف، والوضع، و OBB، والتتبع |
| الترخيص | AGPL-3.0 | AGPL-3.0 |
| تاريخ الإصدار | حزيران/يونيو 2020 | سبتمبر 2024 |
| سهولة الاستخدام | عالية (سطر الأوامر و PyTorch Hub) | مرتفع جدًا (مجموعة أدوات تطوير البرمجيات الموحدة Python و CLI) |
التدريب والنظام البيئي
يستفيد كلا النموذجين من منظومةUltralytics القوية التي توفر أدوات سلسة لإدارة البيانات والتدريب والنشر.
كفاءة التدريب
صُمم YOLO11 ليتدرب بشكل أسرع ويتقارب بسرعة أكبر من YOLOv5.
- الإعدادات الافتراضية الذكية: يقوم محرك Ultralytics تلقائيًا بتهيئة المعلمات الفائقة تلقائيًا استنادًا إلى مجموعة البيانات وحجم النموذج، مما يقلل من الحاجة إلى ضبط المعلمات الفائقة يدويًا.
- استخدام الذاكرة: بفضل عدد المعلمات المنخفض، تستهلك نماذج YOLO11 عمومًا كمية أقل من ذاكرة الوصول العشوائي GPU VRAM أثناء التدريب، مما يسمح بأحجام دفعات أكبر على الأجهزة الاستهلاكية.
مثال على الرمز: التدريب YOLO11
تم تبسيط تدريب YOLO11 باستخدام ultralytics حزمة Python . يوضح المثال التالي كيفية تدريب نموذج YOLO11n على مجموعة بيانات COCO8 .
from ultralytics import YOLO
# Load a pre-trained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model
# The device argument can be 'cpu', 0 for GPU, or [0, 1] for multi-GPU
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
تكامل النظام البيئي
على الرغم من أن YOLOv5 يحتوي على مجموعة كبيرة من البرامج التعليمية التابعة لجهات خارجية نظرًا لقدمه، فإن YOLO11 مدمج أصلاً في حزمة Ultralytics الحديثة. وهذا يوفر وصولاً فورياً إلى الميزات المتقدمة:
- تصدير بنقرة واحدة: التصدير إلى ONNX, OpenVINOو TensorRT و CoreML بأمر واحد.
- التتبع: دعم مدمج لتتبع الكائنات (BoT-SORT و ByteTrack) بدون مستودعات خارجية.
- المستكشف: استخدم واجهة برمجة تطبيقات Ultralytics Explorer API لتصور مجموعات بياناتك والاستعلام عنها باستخدام SQL والبحث الدلالي.
حالات الاستخدام المثالية
يعتمد اختيار النموذج المناسب على القيود والمتطلبات الخاصة بمشروعك.
متى تختار YOLO11
YOLO11 هو الخيار الموصى به لـ 95% من المشاريع الجديدة.
- التطورات الجديدة: إذا كنت تبدأ من الصفر، فإن YOLO11 يوفر لك أفضل ما يمكن أن يوفره لك المستقبل من دقة وسرعة ودقة.
- نشرCPU : بالنسبة للأجهزة المتطورة التي تعمل على CPU (مثل Raspberry Pi والهواتف المحمولة)، فإن YOLO11n أسرع بكثير وأكثر دقة من YOLOv5n.
- المهام المعقدة: تدعم YOLO11 المشاريع التي تتطلب تقدير الوضعية أو OBB (مثل الصور الجوية وتحليل الوثائق) بشكل أصلي.
- السحابة والخادم: تجعل الإنتاجية العالية لـ YOLO11 مثالية لمعالجة تدفقات الفيديو الضخمة في الوقت الفعلي.
متى تلتزم بـ YOLOv5
يظل YOLOv5 خياراً قابلاً للتطبيق في سيناريوهات قديمة محددة.
- الصيانة القديمة: إذا كان لديك نظام إنتاج مقترن بشكل كبير بقاعدة تعليمات YOLOv5 البرمجية أو تنسيق الإخراج المحدد.
- ضبط الأجهزة المحددة: قد تحتوي بعض المسرّعات المدمجة القديمة على برمجيات ثابتة محسّنة للغاية تم التحقق من صحتها خصيصًا لطبقات YOLOv5 (على الرغم من أن معظم أنظمة التشغيل الحديثة مثل OpenVINO تفضل الآن البنى الأحدث).
- خط الأساس الأكاديمي: غالبًا ما يستشهد الباحثون الذين يقارنون بخطوط الأساس التاريخية بـ YOLOv5 نظرًا لوجوده منذ فترة طويلة في الأدبيات.
الترحيل إلى YOLO11
يعد الترحيل من YOLOv5 إلى YOLO11 أمرًا بسيطًا ومباشرًا. يظل تنسيق مجموعة البياناتYOLO TXT) متطابقًا، مما يعني أنه يمكنك إعادة استخدام مجموعات البيانات المشروحة الموجودة لديك دون تعديل. كما أن بنية واجهة برمجة تطبيقات Python متشابهة جدًا، وغالبًا ما تتطلب فقط تغييرًا في سلسلة اسم النموذج (على سبيل المثال، من yolov5su.pt إلى yolo11n.pt ضمن ultralytics الحزمة).
استكشاف خيارات أخرى
تدعم Ultralytics مجموعة واسعة من النماذج التي تتجاوز YOLO11 و YOLOv5 فقط. بناءً على احتياجاتك الخاصة، يمكنك التفكير في:
- YOLOv8: السلف المباشر لـ YOLO11 الذي يقدم توازنًا رائعًا بين الميزات والاعتماد الواسع في المجال.
- YOLOv10: بنية تركز على التدريب NMS لتقليل زمن الاستجابة في تطبيقات محددة في الوقت الحقيقي.
- RT-DETR: كاشف قائم على المحولات يتفوق في الدقة في الحالات التي تكون فيها سرعة الاستدلال أقل أهمية من الدقة القصوى.
- YOLOv9: يُعرف بمفهوم معلومات التدرج القابلة للبرمجة (PGI)، الذي يقدم أداءً قويًا في مهام الكشف الصعبة.
الخلاصة
يمثل الانتقال من YOLOv5 إلى YOLO11 علامة فارقة في تاريخ الرؤية الحاسوبية. YOLOv5 قد أضفى طابعًا ديمقراطيًا على الذكاء الاصطناعي، مما جعل اكتشاف الأجسام في متناول الجميع. YOLO11 يتقن هذه الرؤية، حيث يقدم نموذجًا أسرع وأخف وزنًا وأكثر دقة.
بالنسبة للمطورين الذين يبحثون عن أفضل أداء على الإطلاق لكل واط ومجموعة الميزات الأكثر تنوعًا، فإن YOLO11 هو الفائز الواضح. يضمن لك تكامله في نظام Ultralytics النشط إمكانية الوصول إلى أحدث الأدوات وواجهات برمجة التطبيقات البسيطة ومجتمع مزدهر لدعم رحلتك في مجال الذكاء الاصطناعي.
هل أنت مستعد للترقية؟ اطّلع على وثائقYOLO11 أو استكشف مستودع GitHub لبدء العمل اليوم.