تخطي إلى المحتوى

YOLOv9 YOLO11: الجسر بين الابتكار المعماري والاستعداد للإنتاج

يتطور مجال الكشف عن الأجسام في الوقت الفعلي بسرعة، حيث يوسع كل جيل حدود الدقة والسرعة والكفاءة. تتعمق هذه المقارنة في YOLOv9، المعروف بإنجازاته النظرية في مجال معلومات التدرج، و YOLO11، القوة الإنتاجية Ultralytics المصممة للنشر السلس والتنوع.

على الرغم من أن كلا النموذجين ينحدران من YOLO الأسطورية، إلا أنهما يخدمان أغراضًا مختلفة في نظام الرؤية الحاسوبية. يحلل هذا الدليل هياكلهما ومقاييس أدائهما وحالات الاستخدام المثالية لمساعدة المطورين على اختيار الأداة المناسبة لاحتياجاتهم الخاصة.

ملخص تنفيذي: الابتكار مقابل النظام البيئي

YOLOv9 يركز على معالجة المشكلة الأساسية المتمثلة في فقدان المعلومات في الشبكات العميقة من خلال مفاهيم معمارية جديدة مثل معلومات التدرج القابلة للبرمجة (PGI). وهو خيار ممتاز للبحوث الأكاديمية والسيناريوهات التي تتطلب الاحتفاظ بأقصى قدر من الميزات في مجموعات البيانات المعقدة.

YOLO11، على العكس من ذلك، مصمم للعالم الحقيقي. باعتباره جزءًا أصيلًا من Ultralytics فإنه يوفر سهولة استخدام لا مثيل لها، وسرعات استدلال فائقة على الأجهزة المتطورة، ودعمًا أصيلًا لمجموعة واسعة من المهام التي تتجاوز مجرد الكشف البسيط. بالنسبة للمطورين الذين يبنون تطبيقات تجارية، YOLO11 مسارًا أكثر بساطة من التدريب إلى النشر.

المواصفات الفنية والأداء

يوضح الجدول التالي الاختلافات في الأداء بين النماذج على COCO . في حين YOLOv9 أداءً نظريًا قويًا، YOLO11 مزايا كبيرة في السرعة وكفاءة المعلمات، لا سيما في المتغيرات الأصغر للنموذج التي تعتبر حاسمة بالنسبة للذكاء الاصطناعي المتطور.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

YOLOv9: تعمق في التدرجات القابلة للبرمجة

YOLOv9 تقديم YOLOv9 لحل مشكلة "اختناق المعلومات" في الشبكات العصبية العميقة. مع تعمق الشبكات، غالبًا ما تفقد البيانات المدخلة معلومات مهمة قبل وصولها إلى طبقات التنبؤ.

الميزات المعمارية الرئيسية

  1. معلومات التدرج القابلة للبرمجة (PGI): تولد PGI تدرجات موثوقة عبر فرع إشراف إضافي، مما يضمن أن الفرع الرئيسي يتعلم ميزات قوية حتى في البنى العميقة جدًا. وهذا مفيد بشكل خاص في البحث في ديناميكيات التدرج التنازلي.
  2. GELAN (شبكة تجميع الطبقات الفعالة المعممة): بنية جديدة تعمل على تحسين استخدام المعلمات، وتجمع بين أفضل جوانب CSPNet و ELAN. وهذا يسمح YOLOv9 دقة عالية مع بنية خفيفة نسبيًا مقارنةUltralytics القديمةUltralytics .

تعرف على المزيد حول YOLOv9

YOLO11: مصمم للإنتاج والتنوع

YOLO11 تتويجًا لخبرة Ultralytics في دعم ملايين ممارسي الذكاء الاصطناعي. وهو يعطي الأولوية للفائدة العملية، ويضمن أن النماذج ليست دقيقة فقط في المعايير المرجعية، بل سهلة التدريب والتصدير والتشغيل على أجهزة متنوعة تتراوح من NVIDIA إلى أجهزة Raspberry Pi.

  • المؤلفون: Glenn Jocher و Jing Qiu
  • المؤسسة:Ultralytics
  • التاريخ: 27 سبتمبر 2024
  • ريبو:Ultralytics

ميزة Ultralytics

YOLO11 باندماجه مع نظام Ultralytics الأوسع نطاقًا. ويشمل ذلك:

  • كفاءة الذاكرة: YOLO11 تحسين YOLO11 بحيث يتطلب CUDA أقل بكثير أثناء التدريب مقارنة بالبنى الثقيلة للمحولات أو المستودعات غير المحسنة. وهذا يتيح الوصول إلى التدريب للجميع، مما يسمح للمستخدمين بضبط النماذج الحديثة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين مثل RTX 3060 أو 4070.
  • دعم واسع النطاق للمهام: على عكس YOLOv9، الذي يركز بشكل أساسي على الكشف في مستودعه الأساسي، يدعم YOLO11 :
  • قابلية التصدير: تصدير بنقرة واحدة إلى تنسيقات مثل ONNXو TensorRT و CoreML و TFLite YOLO11 الأمثل للنشر على الأجهزة المحمولة والمدمجة.

تعرف على المزيد حول YOLO11

تدريب مبسط مع Ultralytics

YOLO11 تدريب YOLO11 الحد الأدنى من الكود النمطي. يمكنك بدء التدريب على مجموعة بيانات مخصصة في ثوانٍ باستخدام Python :

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

حالات الاستخدام في العالم الحقيقي

يعتمد الاختيار بين هذين النموذجين بشكل كبير على قيود النشر وأهداف المشروع.

السيناريوهات المثالية لـ YOLOv9

  • المقارنة الأكاديمية: سيجد الباحثون الذين يدرسون طوبولوجيا الشبكات وتدفق المعلومات مفاهيم PGI في YOLOv9 بالنسبة للبحث في الهندسة العصبية.
  • استخراج الميزات عالية الدقة: بالنسبة للمهام التي يتطلب فيها التقاط الميزات الدقيقة في التصوير الطبي عالي الدقة أمراً بالغ الأهمية، يوفر العمود الفقري GELAN قوة تمثيلية قوية.
  • نشر GPU قياسي: في البيئات التي يكون فيها زمن الاستجابة أقل أهمية من استخراج آخر 0.1٪ من mAP يُعد نموذج YOLOv9e الأكبر منافسًا قويًا.

السيناريوهات المثالية لـ YOLO11

  • الذكاء الاصطناعي الحافي وإنترنت الأشياء: بفضل سرعات CPU فائقة (على سبيل المثال، 1.5 مللي ثانية لـ YOLO11n مقابل 2.3 مللي ثانية لـ YOLOv9t على GPU T4، وفجوات أكبر على CPU)، YOLO11 مثاليًا لملاحة الطائرات بدون طيار والكاميرات الذكية.
  • SaaS التجاري: يضمن استقرار Ultralytics وصيانتها النشطة أن تظل التطبيقات التجارية آمنة ومحدثة بأحدث PyTorch .
  • خطوط أنابيب متعددة المهام: تستفيد التطبيقات التي تتطلب الكشف والتتبع في وقت واحد، مثل تحليلات الرياضة، من قدرة YOLO11 على تبديل المهام دون تغيير الإطار الأساسي.
  • التدريب المحدود الموارد: يمكن للشركات الناشئة والطلاب الذين لديهم أجهزة محدودة تدريب YOLO11 الفعالة دون تكبد تكاليف السحابة المرتفعة المرتبطة بالبنى الثقيلة.

المستقبل: التطلع نحو YOLO26

في حين أن YOLOv9 YOLO11 خياران ممتازان، إلا أن مجال الرؤية الحاسوبية لا يهدأ أبدًا. Ultralytics طرحت Ultralytics مؤخرًا YOLO26، وهو نموذج يعيد تعريف الكفاءة لعام 2026 وما بعده.

يستند YOLO26 إلى الدروس المستفادة من كلتا البنيتين، ولكنه يقدم تصميمًا أصليًا شاملاً NMS، والذي تم ابتكاره لأول مرة في YOLOv10. وهذا يلغي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression، مما يبسط خطوط الإنتاج بشكل كبير.

لماذا تختار YOLO26؟

  • السرعة: CPU أسرع بنسبة تصل إلى 43٪ مقارنة بالأجيال السابقة، وذلك من خلال إزالة خسارة التركيز التوزيعي (DFL) وتحسين تنفيذ الرسم البياني.
  • الاستقرار: يستخدم محسن MuSGD الجديد، وهو مزيج من SGD Muon (مستوحى من تدريب LLM)، مما يوفر استقرار التدريب على مجموعات كبيرة لمهام الرؤية.
  • الدقة: تتميز بوظائف ProgLoss + STAL التي تحسن بشكل كبير من التعرف على الأجسام الصغيرة، وهي مشكلة شائعة في تحليل الصور الساتلية.

بالنسبة للمطورين الذين يبدؤون مشاريع جديدة اليوم، YOLO11 بشدة بتقييم YOLO26 جنبًا إلى جنب مع YOLO11 لضمان استمرارية تطبيقاتك في المستقبل.

تعرف على المزيد حول YOLO26

الخلاصة

YOLO11 كل من YOLOv9 YOLO11 معالم بارزة في تاريخ اكتشاف الأجسام. YOLOv9 تحسينات نظرية مهمة فيما يتعلق بالاحتفاظ بالمعلومات في الشبكات العميقة. ومع ذلك، YOLO11YOLO26 الأحدث) بشكل عام حزمة أكثر عملية لمعظم المستخدمين بفضل Ultralytics المتكامل ونسب السرعة إلى الدقة الفائقة وسهولة النشر.

من خلال الاستفادة من Ultralytics يمكن للمطورين تجربة كلا النموذجين بسهولة، ومقارنة أدائهما على مجموعات البيانات المخصصة، ونشر النموذج الفائز في الإنتاج ببضع نقرات فقط.

مزيد من القراءة

  • مقارنة النماذج: شاهد كيف تقارن هذه النماذج مع YOLOv8 و RT-DETR.
  • إدارة البيانات: تعرف على كيفية توضيح البيانات بكفاءة لهذه النماذج باستخدام Ultralytics .
  • النشر: استكشف أدلة تصدير النماذج إلى TensorRT للحصول على أقصى GPU .

تعليقات