YOLO11 YOLOv5: تطور الكشف عن الكائنات في الوقت الفعلي

يمثل تطور عائلة YOLO You Only Look Once) خطًا زمنيًا للابتكار السريع في مجال الرؤية الحاسوبية. YOLOv5، الذي أطلقته Ultralytics في عام 2020، ثورة في هذا المجال من خلال توفير إمكانية الكشف عن الكائنات عالية الأداء من خلال واجهة برمجة تطبيقات سهلة الاستخدام للغاية PyTorch قوي. وبالانتقال سريعًا إلى أواخر عام 2024، فإن YOLO11 كقوة محسنة، بناءً على سنوات من التعليقات والتطورات المعمارية لتقديم كفاءة ودقة فائقتين.

تستكشف هذه المقارنة الخطوات التقنية التي تم اتخاذها بين هذين النموذجين الأيقونيين، مما يساعد المطورين على فهم متى يجب الحفاظ على الأنظمة القديمة ومتى يجب الترقية إلى أحدث بنية.

تحليل مقاييس الأداء

YOLO11 تصور القفزة من YOLOv5 YOLO11 بشكل أفضل من خلال أدائهما على المعايير القياسية. YOLO11 تحسينات مهمة تسمح له بتحقيق متوسط دقة أعلى (mAP) مع الحفاظ على الحمل الحسابي أو تقليله.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

النقاط الرئيسية

مكاسب الدقة: يحقق YOLO11n نسبة mAP ملحوظة تبلغ 39.5٪، متفوقًا بشكل كبير على YOLOv5n (28.0٪ mAP). وهذا يجعل أصغر YOLO11 قابلاً للتطبيق في المهام المعقدة التي كانت تتطلب في السابق نماذج أكبر وأبطأ.
كفاءة الحوسبة: على الرغم من الدقة العالية، تتطلب YOLO11 عمومًا عددًا أقل من عمليات FLOP. على سبيل المثال، تستخدم YOLO11x عددًا أقل من عمليات FLOP بنسبة 20٪ تقريبًا مقارنةً بـ YOLOv5x مع تقديم نتائج كشف فائقة.
CPU :ONNX CPU ONNX لـ YOLO11 أسرع بشكل ملحوظ، YOLO11 عامل حاسم في عمليات النشر على الأجهزة الطرفية مثل Raspberry Pi.

YOLO11: الكفاءة المحسنة والتنوع

صدر YOLO11 في سبتمبر 2024، YOLO11 تتويجًا للتحسينات المتكررة فيYOLO Ultralytics YOLO . وقد تم تصميمه ليس فقط للكشف الأولي، ولكن لدعم مسار رؤية موحد يشمل التجزئة وتقدير الوضع والمربعات المحددة الاتجاه (OBB).

المواصفات الفنية:

المؤلفون: غلين جوشر وجينغ تشيو
المؤسسة:Ultralytics
التاريخ: 2024-09-27
الروابط:GitHub، الوثائق

أبرز ملامح الهيكلة

YOLO11 كتلة C3k2، وهي نسخة محسنة من عنق الزجاجة Cross Stage Partial (CSP) الذي يعمل على تحسين تدفق التدرج. بالإضافة إلى ذلك، يستخدم C2PSA (Cross-Stage Partial with Spatial Attention) في رأس الكشف، مما يعزز قدرة النموذج على التركيز على الميزات الهامة في المشاهد المزدحمة. على عكس YOLOv5 YOLO11 بنية خالية من المراسي، مما يبسط عملية التدريب من خلال التخلص من الحاجة إلى حساب مربعات المراسي لمجموعات بيانات محددة، مما يؤدي إلى تعميم أفضل.

لماذا تختار YOLO11؟

YOLO11 الخيار الموصى به لمعظم التطبيقات التجارية الجديدة. إن توازنه بين الدقة العالية (mAP) والاستهلاك المنخفض للموارد يجعله مثاليًا للتحليلات في الوقت الفعلي في مجالات البيع بالتجزئة والمدن الذكية والرعاية الصحية.

تعرف على المزيد حول YOLO11

YOLOv5: المعيار الصناعي

أصدرت YOLOv5 في منتصف عام 2020، ووضعت معيارًا لسهولة الاستخدام في صناعة الذكاء الاصطناعي. كانت أول نموذج يجعل "التدريب والتقييم والنشر" تجربة سلسة داخل مستودع واحد، مما أرسى فلسفة التركيز على المستخدم التي Ultralytics بها Ultralytics اليوم.

المواصفات الفنية:

المؤلفون: Glenn Jocher
المؤسسة:Ultralytics
التاريخ: 2020-06-26
الروابط:GitHub، الوثائق

أبرز ملامح الهيكلة

YOLOv5 شبكة CSPDarknet الأساسية وهو كاشف قائم على المراسي. على الرغم من فعاليتها العالية، يمكن أن تكون الأساليب القائمة على المراسي حساسة لتعديل المعلمات الفائقة فيما يتعلق بأبعاد الصندوق. على الرغم من عمره، YOLOv5 أداة موثوقة، لا سيما في السيناريوهات التي تقيد فيها الأجهزة القديمة أو شهادات البرامج المحددة المشاريع بإصدارات أقدم من الأطر.

تعرف على المزيد حول YOLOv5

الاختلافات المعمارية والتدريب

النظام البيئي وسهولة الاستخدام

تتمثل إحدى أقوى مزايا كلا النموذجين في تكاملهما مع Ultralytics . سواء كنت تستخدم YOLOv5 YOLO11 فستستفيد من واجهة برمجة تطبيقات موحدة ووثائق شاملة ودعم لتصدير النماذج بسلاسة إلى تنسيقات مثل TensorRT CoreML OpenVINO.

ومع ذلك، YOLO11 من آخر التحديثات في ultralytics Python ، التي توفر تكاملاً أكثر إحكامًا مع أدوات مثل منصة Ultralytics للتدريب على السحابة وإدارة مجموعات البيانات.

كفاءة التدريب

YOLO11 يتقارب YOLO11 بشكل أسرع أثناء التدريب بفضل هندسته المعمارية المحسّنة ووظائف الخسارة. كما أن متطلباته من الذاكرة محسّنة للغاية. على عكس نماذج المحولات الضخمة التي تتطلب ذاكرة VRAM كبيرة، يمكن تدريب YOLO11 و YOLOv5) بكفاءة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين.

فيما يلي كيفية تدريب YOLO11 باستخدامPython Ultralytics Python :

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset
# fast, efficient, and low-memory usage
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

تعدد الاستخدامات

بينما YOLOv5 تحديث YOLOv5 في وقت لاحق من دورة حياته لدعم التجزئة والتصنيف، YOLO11 تم تصميمه من الألف إلى الياء مع وضع هذه المهام في الاعتبار. إذا كان مشروعك يتطلب التبديل بين اكتشاف الكائنات، وتجزئة المثيلات، وتقدير الوضع، أو المربعات المحددة الاتجاه (OBB)، YOLO11 تجربة أكثر تماسكًا وأداءً أعلى عبر جميع هذه الطرق.

الخلاصة: أي نموذج يجب استخدامه؟

بالنسبة للغالبية العظمى من المستخدمين الذين يبدؤون مشروعًا اليوم، YOLO11 هو الفائز الواضح. فهو يقدم تحسينًا "مجانيًا": دقة أفضل وسرعة مماثلة أو أفضل دون زيادة التعقيد. YOLOv5 نقطة مرجعية ممتازة للبحث وصيانة الإرث، ولكنه يتخلف في المقارنات المقياسية الخام مع البنى الحديثة.

الحد الأقصى: YOLO26

إذا كنت تبحث عن أحدث ما توصلت إليه تكنولوجيا الرؤية الحاسوبية (اعتبارًا من يناير 2026)، فيجب عليك استكشاف YOLO26.

يعتمد YOLO26 على أساس YOLO11 يقدم تصميمًا شاملاً NMS مما يلغي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression. وينتج عن ذلك نشر أبسط وسرعات استدلال أسرع، خاصة على الأجهزة الطرفية CPU. بفضل ابتكارات مثل مُحسِّن MuSGD و ProgLoss، يوفر YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU مقارنةً بالأجيال السابقة.

تعرف على المزيد حول YOLO26

نماذج أخرى للاستكشاف

RT-DETR: كاشف يعتمد على محول يتميز بدقته عندما لا تكون السرعة في الوقت الفعلي أمراً بالغ الأهمية.
YOLO: مثالي للكشف عن المفردات المفتوحة حيث تحتاج إلى detect غير موجودة في مجموعة بيانات التدريب.