تخطي إلى المحتوى

YOLO11 YOLOv9: نظرة متعمقة على البنية والأداء

يعد اختيار نموذج الكشف عن الكائنات المناسب قرارًا مهمًا يؤثر على سرعة ودقة وقابلية تطبيقات الرؤية الحاسوبية للتوسع. يقدم هذا الدليل مقارنة تقنية شاملة بين YOLO11، الإصدار القوي من Ultralytics و YOLOv9، وهي بنية معروفة بمعلومات التدرج القابلة للبرمجة (PGI).

يمثل كلا النموذجين قفزات كبيرة إلى الأمام في تاريخ نماذج الرؤية، لكنهما يلبيان احتياجات مختلفة قليلاً في مجال تطوير الذكاء الاصطناعي.

نظرة عامة على النموذج

YOLO11

YOLO11 يعتمد على Ultralytics القوي، ويحسن التوازن بين الكفاءة الحسابية ودقة الكشف. وهو مصمم كنموذج متعدد الاستخدامات وجاهز للإنتاج يتكامل بسلاسة مع سير عمل MLOps الحديث.

  • المؤلفون: غلين جوشر وجينغ تشيو
  • المؤسسة:Ultralytics
  • التاريخ: سبتمبر 2024
  • التركيز: السرعة في الوقت الفعلي، سهولة الاستخدام، دعم واسع للمهام (الكشف، التجزئة، التصنيف، الوضع، OBB).

تعرف على المزيد حول YOLO11

YOLOv9

YOLOv9 مفاهيم جديدة مثل GELAN (شبكة تجميع الطبقات الفعالة المعممة) و PGI لمعالجة فقدان المعلومات في الشبكات العميقة. على الرغم من أنه يحقق دقة عالية في المعايير الأكاديمية، إلا أنه غالبًا ما يتطلب موارد حسابية أكثر للتدريب.

  • المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
  • المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
  • التاريخ: فبراير 2024
  • التركيز: تعظيم كفاءة المعلمات وتقليل اختناق المعلومات في شبكات CNN العميقة.

تعرف على المزيد حول YOLOv9

تحليل الأداء

عند تقييم هذه النماذج، يجب الموازنة بين زمن الاستجابة (السرعة) و mAP (الدقة) أمر بالغ الأهمية. قام Ultralytics بتحسين YOLO11 إنتاجية فائقة على الأجهزة المتطورة ووحدات معالجة الرسومات على حد سواء.

مقارنة المؤشرات الرئيسية

يوضح الجدول التالي الاختلافات في الأداء على COCO . لاحظ كيف YOLO11 دقة مماثلة أو أفضل مع زمن انتقال أقل بكثير، وهو عامل حاسم لتطبيقات الاستدلال في الوقت الفعلي.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

تفسير البيانات

بينما يرفع YOLOv9e الحدود القصوى للدقة (55.6٪ mAP)، إلا أنه يفعل ذلك على حساب السرعة بشكل كبير (16.77 مللي ثانية مقابل 11.3 مللي ثانية لـ YOLO11x). بالنسبة لمعظم التطبيقات التجارية، فإن YOLO11 تقدم "نقطة مثالية" أكثر عملية، حيث توفر دقة عالية بسرعات قادرة على معالجة تدفقات الفيديو عالية الإطارات في الثانية.

الاختلافات المعمارية

يكمن الاختلاف الأساسي في فلسفة التصميم. YOLOv9 على التحسينات النظرية العميقة لتدفق التدرج، بينما YOLO11 على الهندسة العملية للنشر والتنوع.

YOLOv9: PGI و GELAN

YOLOv9 معلومات التدرج القابلة للبرمجة (PGI) لمنع فقدان المعلومات الدلالية أثناء مرور البيانات عبر الطبقات العميقة. وهو يوفر بشكل أساسي فرعًا إضافيًا للإشراف أثناء التدريب يتم إزالته أثناء الاستدلال. وبالاقتران مع بنية GELAN، فإنه يتيح للنموذج أن يكون خفيفًا ودقيقًا في الوقت نفسه. وهذا يجعله موضوعًا مثيرًا للاهتمام بالنسبة لأولئك الذين يدرسون البحث في البنية العصبية وتدفق التدرج.

YOLO11: C3k2 و C2PSA المُحسّنان

YOLO11 كتلة C3k2، وهي نسخة مطورة من عنق الزجاجة CSP المستخدم في الإصدارات السابقة، والمُحسّن GPU . كما أنه يشتمل على C2PSA (Cross-Stage Partial with Spatial Attention)، الذي يعزز قدرة النموذج على التركيز على الميزات الهامة في المشاهد المعقدة. تم ضبط هذه البنية خصيصًا لتقليل FLOPs دون التضحية بقدرات استخراج الميزات، مما أدى إلى مقاييس السرعة المذهلة الموضحة أعلاه.

كفاءة التدريب والنظام البيئي

واحدة من أهم مزايا اختيار Ultralytics هي النظام البيئي المحيط به.

سهولة الاستخدام والتوثيق

YOLO11 تدريب YOLO11 الحد الأدنى من الكود النمطي. تعملPython Ultralytics Python على توحيد العملية، مما يجعلها متاحة حتى للمبتدئين. في المقابل، على الرغم من YOLOv9 تطبيقه الأصلي قد يتطلب ملفات تكوين أكثر تعقيدًا وإعدادًا يدويًا.

from ultralytics import YOLO

# Load a YOLO11 model
model = YOLO("yolo11n.pt")

# Train on COCO8 with just one line
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

متطلبات الذاكرة

تشتهر Ultralytics بكفاءتها في استخدام الذاكرة. YOLO11 مُحسّن للتدريب على أجهزة المستهلكين ذات CUDA محدودة. وهذا يمثل ميزة واضحة مقارنة بالعديد من النماذج القائمة على المحولات أو البنى القديمة التي تعاني من تضخم الذاكرة أثناء خطوات التراجع.

تعدد الاستخدامات عبر المهام

في حين أن YOLOv9 في المقام الأول كاشف للأجسام، YOLO11 هو أداة قوية متعددة المهام. ضمن نفس الإطار، يمكنك التبديل بسلاسة بين:

مستقبل الذكاء الاصطناعي في مجال الرؤية: YOLO26

للمطورين الباحثين عن أحدث التقنيات، Ultralytics نموذج YOLO26. يمثل هذا النموذج الجيل التالي من الذكاء الاصطناعي للرؤية، حيث يدمج الدروس المستفادة من كل من YOLO11 YOLOv10.

يتميز YOLO26 بتصميم أصلي شامل NMS، مما يلغي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression. وينتج عن ذلك استنتاج أسرع وخطوط أنابيب نشر أبسط. كما يستخدم مُحسِّن MuSGD، وهو مزيج من SGD Muon، مما يضمن ديناميكيات تدريب مستقرة مشابهة لتلك الموجودة في تدريب نموذج اللغة الكبيرة (LLM). بفضل وظائف الخسارة المحسنة مثل ProgLoss + STAL، يتفوق YOLO26 في اكتشاف الأجسام الصغيرة، مما يجعله الخيار الأول لعام 2026 وما بعده.

تعرف على المزيد حول YOLO26

حالات الاستخدام المثالية

متى تختار YOLOv9

  • البحث الأكاديمي: ممتاز لدراسة الحدود النظرية للاحتفاظ بمعلومات CNN وبرمجة التدرج.
  • تحليل الصور الثابتة: في سيناريوهات مثل التصوير الطبي (على سبيل المثال، الكشف عن الأورام) حيث تكون سرعة الاستدلال ثانوية بالنسبة لاستخراج أقصى قدر من التفاصيل من إطار واحد.

متى تختار YOLO11

  • نشر الذكاء الاصطناعي على الحافة: مثالي للأجهزة مثل Raspberry Pi أو NVIDIA حيث TFLite تنسيقات التصدير مثل TensorRT TFLite ضرورية.
  • الإنتاج التجاري: لتحليلات البيع بالتجزئة، ومراقبة المدن الذكية، أو مراقبة جودة التصنيع حيث تعد الموثوقية والسرعة والدعم أمورًا بالغة الأهمية.
  • خطوط الأنابيب المعقدة: عندما يتطلب تطبيقك مهام رؤية متعددة (على سبيل المثال، اكتشاف شخص ثم تقدير وضعه) باستخدام واجهة برمجة تطبيقات واحدة موحدة.

الخلاصة

YOLOv9 كل من YOLO11 YOLOv9 أدوات استثنائية في ترسانة مهندسي الرؤية الحاسوبية. ومع ذلك، بالنسبة لمعظم التطبيقات الواقعية، YOLO11YOLO26 الأحدث) توازنًا فائقًا بين السرعة والدقة وتجربة المطور. وبدعم من Ultralytics النشط والتحديثات المتكررة، تضمن هذه الأدوات أن تظل مشاريعك فعالة ومستقبلية.

لمزيد من الاستكشاف، قد تكون مهتمًا أيضًا بمقارنة هذه النماذج مع RT-DETR للكشف القائم على المحولات أو استكشاف النموذج الخفيف الوزن YOLOv10 .


تعليقات