تخطي إلى المحتوى

YOLOv9 مقابل YOLO11: التطور المعماري وتحليل الأداء

يتسم مشهد الرؤية الحاسوبية بالابتكار السريع، حيث تدفع النماذج باستمرار حدود الدقة والسرعة والكفاءة. تستكشف هذه المقارنة معلمين هامين في مجال اكتشاف الأجسام: YOLOv9، وهو نموذج يركز على الأبحاث ويقدم مفاهيم معمارية جديدة، و Ultralytics YOLO11وهو أحدث تطور جاهز للإنتاج مصمم لتعدد الاستخدامات في العالم الحقيقي.

بينما YOLOv9 يركز على معالجة اختناقات معلومات التعلّم العميق من خلال الاختراقات النظرية, Ultralytics YOLO11 على تحسين الأداء المتطور (SOTA) مع التركيز على سهولة الاستخدام والكفاءة والتكامل السلس في نظامUltralytics البيئي.

مقاييس الأداء: السرعة والدقة

يعرض الجدول التالي مقارنة مباشرة لمقاييس الأداء الرئيسية التي تم تقييمها على مجموعة بياناتCOCO . عند اختيار نموذج، من الضروري الموازنة بين متوسط الدقة المتوسطةmAP) وسرعة الاستدلال والتكلفة الحسابية (FLOPs).

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

كما توضح البيانات، يُظهرYOLO11 كفاءة فائقة. على سبيل المثال، يُحقق نموذج YOLO11n mAP أعلى (39.5%) من YOLOv9t (38.3%) مع استخدام عدد أقل من وحدات FLOP وتشغيله بشكل أسرع بكثير على GPU. بينما يحتفظ نموذج YOLOv9e الأكبر بميزة طفيفة في الدقة الخام، إلا أنه يتطلب ضعف وقت الاستدلال الذي يستغرقه نموذج YOLOv11l تقريبًا، مما يجعل YOLO11 الخيار الأكثر واقعية لسيناريوهات الاستدلال في الوقت الفعلي.

YOLOv9: معالجة اختناق المعلومات

تم إصدار YOLOv9 بهدف أكاديمي محدد: حل مشكلة فقدان المعلومات أثناء مرور البيانات عبر الشبكات العصبية العميقة. تتأثر بنيتها بشدة بالحاجة إلى الاحتفاظ بمعلومات التدرج أثناء التدريب.

التفاصيل الفنية:
المؤلفون: تشين ياو وانغ، هونغ يوان مارك لياو
المنظمة:معهد علوم المعلومات، الأكاديمية الصينية للعلوم بتايوان
التاريخ: 2024-02-21
Arxiv:https://arxiv.org/abs/2402.13616
GitHub:https://github.com/WongKinYiu/yolov9
Docsultralytics

الميزات المعمارية الرئيسية

الابتكارات الأساسية في YOLOv9 هي معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).

  • PGI: يضمن إطار الإشراف الإضافي هذا حصول الطبقات العميقة على معلومات تدرجية موثوقة، مما يخفف من "عنق الزجاجة المعلوماتي" الذي غالبًا ما يعيق تقارب الشبكات العميقة.
  • GELAN: تعمل هذه البنية على تحسين كفاءة المعلمات من خلال الجمع بين نقاط القوة في شبكة CSPNet وELAN، مما يسمح بتوسيع نطاق الحوسبة المرنة.

التركيز الأكاديمي

يُعدّ YOLOv9 بمثابة دراسة حالة ممتازة للباحثين المهتمين بنظرية التعلّم العميق، وتحديدًا فيما يتعلق بتدفق التدرّج والحفاظ على المعلومات في الشبكات العصبية التلافيفية.

اعرف المزيد عن YOLOv9

Ultralytics YOLO11: تعدد الاستخدامات يلتقي مع الكفاءة

استناداً إلى إرث YOLOv8يمثل YOLO11 ذروة الرؤية الحاسوبية الموجهة للإنتاج. فهو مصمم ليس فقط لتحقيق نتائج قياسية، ولكن لإمكانية النشر العملي وسهولة الاستخدام والقدرة على القيام بمهام متعددة.

التفاصيل الفنية:
المؤلفون: جلين جوتشر، جينغ تشيو
المنظمة:Ultralytics
التاريخ: 2024-09-27 2024
GitHubultralytics
المستنداتyolo11

الميزات المعمارية الرئيسية

يقدم YOLO11 بنية محسّنة مصممة لزيادة استخراج الميزة إلى أقصى حد مع تقليل النفقات الحسابية. ويستخدم هيكلًا محسّنًا للعمود الفقري والرقبة يحسّن تكامل الميزات عبر مقاييس مختلفة، وهو أمر بالغ الأهمية للكشف عن الأجسام الصغيرة.

يتميز النموذج أيضًا بتصميمات محسّنة للرأس لتقارب أسرع أثناء التدريب. على عكس النماذج التي تركز على الأبحاث، تم تصميم YOLO11 ضمن إطار عمل موحد يدعم الكشف، والتقسيم، والتصنيف، وتقدير الوضعية، والمربعات المحددة الموجهة (OBB) بشكل أصلي.

تعرف على المزيد حول YOLO11

نقاط المقارنة التفصيلية

سهولة الاستخدام والنظام البيئي

يكمن أحد أهم الاختلافات في تجربة المستخدم. Ultralytics YOLO11 مصمم بعقلية "المطور أولاً". فهو يتكامل بسلاسة مع نظام Ultralytics الأوسع نطاقًا، والذي يتضمن أدوات للتعليق التوضيحي للبيانات وإدارة مجموعة البيانات وتصدير النماذج.

  • YOLO11 يمكن تدريبها والتحقق من صحتها ونشرها باستخدام بضعة أسطر من التعليمات البرمجية باستخدام ultralytics حزمة Python أو CLI. وهي تستفيد من التحديثات المتكررة، والتوثيق الشامل، ومجتمع ضخم.
  • YOLOv9: على الرغم من دعمه في مكتبة Ultralytics إلا أن التنفيذ الأصلي وبعض التكوينات المتقدمة قد تتطلب فهمًا أعمق لورقة البحث الأساسية.

متطلبات الذاكرة وكفاءة التدريب

يُعد الاستخدام الفعال للموارد سمة مميزة لنماذج Ultralytics . تم تحسين YOLO11 ليتطلب ذاكرة CUDA أقل أثناء التدريب مقارنةً بالعديد من البدائل القائمة على المحولات أو تكرارات YOLO الأقدم. يسمح ذلك للمطورين بتدريب أحجام دفعات أكبر على أجهزة من فئة المستهلك، مما يسرّع دورة التطوير.

علاوةً على ذلك، يوفر YOLO11 أوزاناً متاحة بسهولة وعالية الجودة مُدربة مسبقاً لجميع المهام، مما يضمن أن يكون التعلّم التناقلي سريعاً وفعالاً. وهذا يتناقض مع النماذج البحثية التي قد تقدم نقاط فحص محدودة مُدربة مسبقاً تركز في المقام الأول على اكتشاف COCO .

تعدد المهام

في حين أن YOLOv9 معروف في المقام الأول بإنجازاته في اكتشاف الأجسام، فإن YOLO11 يقدم دعمًا أصليًا لمجموعة واسعة من مهام الرؤية الحاسوبية ضمن إطار عمل واحد:

  • تجزئة المثيل: إخفاء دقيق للأجسام.
  • تقدير الوضعية: الكشف عن النقاط الرئيسية للهيكل العظمي (على سبيل المثال، لوضعية الإنسان).
  • التصنيف: تصنيف الصور الكاملة.
  • المربعات المحدودة الموجهة (OBB): الكشف عن الأجسام المدورة، وهو أمر حيوي للصور الجوية.

واجهة برمجة التطبيقات الموحدة

يكون التبديل بين المهام في YOLO11 بسيطًا مثل تغيير ملف وزن النموذج (على سبيل المثال، من yolo11n.pt للكشف عن yolo11n-seg.pt للتجزئة).

مثال على الكود: المقارنة في العمل

يوضح كود Python التالي كيف يمكن بسهولة تحميل كلا النموذجين واستخدامهما داخل إطار عمل Ultralytics مما يسلط الضوء على واجهة برمجة التطبيقات الموحدة التي تبسط اختبار البنى المختلفة.

from ultralytics import YOLO

# Load the research-focused YOLOv9 model (compact version)
model_v9 = YOLO("yolov9c.pt")

# Load the production-optimized YOLO11 model (medium version)
model_11 = YOLO("yolo11m.pt")

# Run inference on a local image
# YOLO11 provides a balance of speed and accuracy ideal for real-time apps
results_11 = model_11("path/to/image.jpg")

# Display results
results_11[0].show()

حالات الاستخدام المثالية

متى تختار YOLOv9

يُعدّ YOLOv9 خيارًا ممتازًا للبحث الأكاديمي والسيناريوهات التي تكون فيها الأولوية الوحيدة هي الدقة القصوى في الصور الثابتة، بغض النظر عن التكلفة الحسابية.

  • المشاريع البحثية: التحقيق في تدفق التدرج وبنية الشبكة العصبية.
  • المقارنة المعيارية: المنافسات التي يُحتسب فيها كل جزء من mAP .
  • عمليات نشر الخوادم المتطورة: حيث تتوفر وحدات معالجة رسومات قوية (مثل A100s) للتعامل مع وحدات معالجة الرسومات القوية (مثل A100s) للتعامل مع وحدات FLOP الأعلى من المتغير "E".

متى تختار Ultralytics YOLO11

YOLO11 هو الخيار الموصى به للتطبيقات التجارية، والحوسبة المتطورة والأنظمة متعددة المهام.

  • الذكاء الاصطناعي المتطور: النشر على أجهزة مثل NVIDIA Jetson أو Raspberry Pi بسبب نسب السرعة إلى الوزن الفائقة.
  • تحليلات الوقت الحقيقي: مراقبة حركة المرور، والتحليلات الرياضية، ومراقبة جودة التصنيع حيث يكون وقت الاستجابة حرجاً.
  • خطوط الأنابيب المعقدة: التطبيقات التي تتطلب الكشف والتجزئة وتقدير الوضعية في وقت واحد.
  • النماذج الأولية السريعة: الشركات الناشئة والمؤسسات التي تحتاج إلى الانتقال من المفهوم إلى النشر بسرعة باستخدام واجهة برمجة تطبيقاتUltralytics .

نماذج أخرى يمكن استكشافها

على الرغم من أن YOLOv9 و YOLO11 منافسان قويان، إلا أن مكتبة Ultralytics تدعم مجموعة متنوعة من النماذج الأخرى المصممة خصيصًا لتلبية احتياجات محددة:

  • YOLOv8: السلف الموثوق به لـ YOLO11 ولا يزال يُستخدم ويدعم على نطاق واسع.
  • RT-DETR: كاشف يعتمد على المحولات، وهو كاشف يعتمد على المحولات ويتفوق في الدقة ولكنه قد يتطلب المزيد من الذاكرة.
  • YOLOv10: بنية متميزة تركز على التدريب NMS لتقليل زمن الاستجابة في تكوينات محددة.

استكشف المجموعة الكاملة من الخيارات في قسم مقارنة الطرازات.

الخلاصة

تمثل كلتا البنيتين إنجازات مهمة في مجال الرؤية الحاسوبية. يسهم YOLOv9 برؤى نظرية قيّمة في تدريب الشبكات العميقة، بينما Ultralytics YOLO11 بتجميع هذه التطورات في أداة قوية ومتعددة الاستخدامات وذات كفاءة عالية للعالم. بالنسبة لمعظم المطورين والباحثين الذين يتطلعون إلى إنشاء تطبيقات قابلة للتطوير في الوقت الحقيقي، فإن توازن YOLO11 بين الأداء وسهولة الاستخدام والدعم الشامل للنظام البيئي يجعله الخيار الأفضل.


تعليقات