YOLOv5 YOLO11: جسر بين التراث والابتكار في مجال اكتشاف الأجسام

كان تطور بنية YOLO You Only Look Once) رحلة حاسمة في مجال الرؤية الحاسوبية. من الموثوقية الأساسية لـ YOLOv5 الكفاءة المتقدمة لـ YOLO11 دفعت كل نسخة حدود السرعة والدقة. يقدم هذا الدليل مقارنة تقنية مفصلة لمساعدة المطورين والباحثين والمهندسين على اختيار النموذج المناسب لاحتياجاتهم الخاصة في مجال النشر.

نظرة عامة على النموذج

YOLOv5: المعيار الصناعي

صدر في عام 2020 عن جلين جوشر و Ultralytics، YOLOv5 أصبح بسرعة المعيار الذهبي للكشف العملي عن الأشياء. كان أول YOLO يتم تنفيذه أصلاً في PyTorch، مما جعله متاحًا بشكل استثنائي لمجتمع الذكاء الاصطناعي الأوسع. وقد عزز توازنه بين سهولة الاستخدام وقنوات التدريب القوية ومرونة النشر مكانته في آلاف التطبيقات الأكاديمية والصناعية.

المؤلفون: Glenn Jocher
المؤسسة:Ultralytics
التاريخ: 2020-06-26
GitHub:ultralytics/yolov5

تعرف على المزيد حول YOLOv5

YOLO11: الخلف المُحسّن

YOLO11، الذي تم إصداره في عام 2024، يمثل قفزة كبيرة إلى الأمام في Ultralytics . بناءً على التطورات المعمارية YOLOv8 يقدم هيكلًا أساسيًا ورأسًا محسنًا مصممًا لاستخراج الميزات وكفاءة فائقة. YOLO11 على تعظيم نسبة الدقة إلى الحساب، مما يوفر متوسط دقة أعلى (mAP) مع معلمات أقل مقارنة بسابقيه.

المؤلفون: غلين جوشر وجينغ تشيو
المؤسسة:Ultralytics
التاريخ: 2024-09-27
GitHub:ultralytics/ultralytics

تعرف على المزيد حول YOLO11

أحدث التوصيات

بينما YOLO11 تحسينات كبيرة مقارنة YOLOv5، يجب على المطورين الذين يبدؤون مشاريع جديدة في عام 2026 تقييم YOLO26 أيضًا. يتميز هذا البرنامج بتصميم شامل أصلي (إزالة NMS) ومحسّن MuSGD مبتكر CPU أسرع بنسبة تصل إلى 43٪، مما يجعله الخيار الأول للنشر المتطور.

مقارنة البنية التقنية

العمود الفقري واستخراج الميزات

YOLOv5 يستخدم هيكل CSPDarknet. كان تصميم الشبكة الجزئية عبر المراحل ثوريًا في تقليل التكرار الحسابي مع الحفاظ على تدفق التدرج الغني. فهو يوازن بشكل فعال بين العمق والعرض، مما يسمح للنموذج بتعلم الميزات المعقدة دون زيادة عدد المعلمات بشكل كبير.

YOLO11 يطور هذا المفهوم من خلال تعزيز العمود الفقري CSP (C3k2) ويقدم آليات محسنة للانتباه المكاني. تم ضبط البنية بشكل خاص لالتقاط التفاصيل الدقيقة، مما يعزز بشكل كبير الأداء في اكتشاف الأجسام الصغيرة. يتيح هذا التصميم المحسن YOLO11 دقة أعلى مع حجم نموذج أصغر.

رأس الكشف

رأس الكشف في YOLOv5 يعتمد على المراسي، حيث يعتمد على مربعات مراسي محددة مسبقًا للتنبؤ بمواقع الكائنات. على الرغم من فعالية هذه الطريقة، إلا أنها تتطلب ضبطًا دقيقًا للمعلمات الفائقة لأبعاد المراسي لمجموعات البيانات المخصصة.

YOLO11 يعتمد رأس كشف بدون مرساة. هذا النهج الحديث يبسط عملية التدريب من خلال التنبؤ المباشر بمراكز الأجسام وأبعادها، مما يلغي الحاجة إلى حسابات مربع المرساة. وهذا لا يبسط عملية التدريب فحسب، بل يحسن أيضًا التعميم عبر أشكال الأجسام ونسب العرض إلى الارتفاع المتنوعة.

مقاييس الأداء

يوضح الجدول التالي الفروق في الأداء بين YOLOv5 YOLO11. ومن الملاحظات الرئيسية التوازن بين السرعة والدقة. يحقق YOLO11 mAP أعلى مع الحفاظ على سرعات استدلال تنافسية أو متفوقة، لا سيما على GPU .

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv5n	640	28.0	73.6	1.12	1.9	4.5
YOLOv5s	640	37.4	120.7	1.92	7.2	16.5
YOLOv5m	640	45.4	233.9	4.03	21.2	49.0
YOLOv5l	640	49.0	408.4	6.61	46.5	109.1
YOLOv5x	640	50.7	763.2	11.89	86.7	205.7

YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

تحليل:

الدقة: يحقق YOLO11n (Nano) معدل دقة متوسط ( mAP) مذهلًا يبلغ 39.5٪، متفوقًا بشكل كبير على YOLOv5n الذي يبلغ معدله 28.0٪. وهذا يجعل YOLO11 أفضل بكثير للتطبيقات خفيفة الوزن التي تتطلب دقة عالية.
السرعة: تُظهر YOLO11 سرعات CPU أسرع CPU في ONNX ، وهو أمر بالغ الأهمية للنشر علىGPU .
الكفاءة: YOLO11 هذه المكاسب بعدد معلمات مماثل أو أقل في كثير من الأحيان (على سبيل المثال، YOLO11x مقابل YOLOv5x)، مما يظهر كفاءة تحسينات هندسته المعمارية.

التدريب والنظام البيئي

سهولة الاستخدام

يستفيد كلا الطرازين من نظام Ultralytics الشهير، الذي يضع تجربة المطورين في مقدمة أولوياته.

YOLOv5 وضع معيارًا لـ "بدء التدريب في 5 دقائق" بفضل هيكله البديهي واعتماده على معيار PyTorch .
YOLO11 يندمج بسلاسة في النظام الموحد ultralytics Python . توفر هذه الحزمة واجهة برمجة تطبيقات متسقة لجميع المهام، مما يعني التبديل من اكتشاف إلى تجزئة المثيل أو تقدير الوضع يتطلب تغيير وسيطة سلسلة واحدة فقط.

كفاءة التدريب

YOLO11 روتينات تدريب محسّنة تؤدي غالبًا إلى تقارب أسرع. تم تحسين ميزات مثل زيادة الفسيفساء، كما أن التصميم الخالي من المراسي يلغي خطوة المعالجة المسبقة لتطور المراسي التلقائية الموجودة في YOLOv5. علاوة على ذلك، يُظهر كلا النموذجين استخدامًا أقل بكثير للذاكرة أثناء التدريب مقارنةً بأجهزة الكشف القائمة على المحولات مثل RT-DETR، مما يسمح بأحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) الاستهلاكية.

التدريب باستخدام واجهة برمجة التطبيقات Ultralytics

تدريب YOLO11 سهل للغاية باستخدام Python . تنطبق نفس الصيغة على YOLOv5 ultralytics .

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

تعدد الاستخدامات

بينما YOLOv5 دعمًا للتقسيم والتصنيف في مرحلة لاحقة من دورة حياته، YOLO11 تصميم YOLO11 من الأساس ليكون متعلمًا متعدد المهام. وهو يدعم بشكل أساسي:

الكشف عن الكائنات
تجزئة المثيل
تصنيف الصور
تقدير الوضع
مربع إحاطة موجه (OBB)

وهذا يجعل YOLO11 "سكين جيب سويسري" أكثر تنوعًا في الاستخدامات بالنسبة لخطوط أنابيب الرؤية الحاسوبية المعقدة التي تتطلب إجراء أنواع متعددة من التحليلات في وقت واحد.

حالات الاستخدام المثالية

متى تختار YOLOv5

الأنظمة القديمة: إذا كان لديك خط إنتاج قائم مبني على تنسيق YOLOv5 المحدد أو requirements.txt، والاستمرار في استخدام YOLOv5 الاستقرار.
قيود الأجهزة المحددة: على الأجهزة القديمة للغاية أو تطبيقات FPGA المحددة، YOLOv5 تحتوي بنية YOLOv5 الأبسط على تدفقات بتات محسّنة موجودة بالفعل.
تكرار البحث: لإعادة إنتاج الأوراق الأكاديمية من 2020 إلى 2023 التي استخدمت YOLOv5 .

متى تختار YOLO11

نشر الذكاء الاصطناعي على الحافة: تجعل نسبة السرعة إلى الدقة الفائقة YOLO11 لأجهزة مثل NVIDIA أو Raspberry Pi، خاصةً لمعالجة الفيديو في الوقت الفعلي.
متطلبات الدقة العالية: التطبيقات في التصوير الطبي أو الكشف عن العيوب حيث كل نقطة مئوية من mAP .
التطبيقات متعددة المهام: تستفيد المشاريع التي تتطلب تقدير الوضع (مثل تحليلات الرياضة) أو مربعات الحدود الدوارة (مثل المسح الجوي) من الدعم الأصلي YOLO11.
التدريب على السحابة: استخدام Ultralytics لإدارة مجموعات البيانات وتدريب النماذج بشكل مبسط.

الخلاصة

YOLO11 كل من YOLOv5 YOLO11 دليلاً على التزام Ultralytics بالتميز في مجال البرمجيات مفتوحة المصدر. YOLOv5 لا يزال أداة موثوقة ومجربة في الميدان. ومع ذلك، YOLO11 مسار ترقية مقنع بفضل تحسينات هندسته ودقته الفائقة ودعمه الواسع للمهام.

بالنسبة للمطورين الذين يتطلعون إلى المستقبل، فإن الخيار واضح: YOLO11 الأداء المتفوق المطلوب للتطبيقات الحديثة. بالنسبة لأولئك الذين يبحثون عن أحدث التقنيات، نوصي بشدة باستكشاف YOLO26، الذي يقدم اكتشافًا شاملاً NMS لنشر أكثر بساطة.

استكشف وثائق YOLO26

قد تهمك أيضًا النماذج التالية YOLOv10 لأبحاث الأداء في الوقت الفعلي أو YOLO للكشف عن المفردات المفتوحة.