YOLOv9 YOLO11: الجسر بين الابتكار المعماري والاستعداد للإنتاج

يتطور مجال الكشف عن الأجسام في الوقت الفعلي بسرعة، حيث يوسع كل جيل حدود الدقة والسرعة والكفاءة. تتعمق هذه المقارنة في YOLOv9، المعروف بإنجازاته النظرية في مجال معلومات التدرج، و YOLO11، القوة الإنتاجية Ultralytics المصممة للنشر السلس والتنوع.

على الرغم من أن كلا النموذجين ينحدران من YOLO الأسطورية، إلا أنهما يخدمان أغراضًا مختلفة في نظام الرؤية الحاسوبية. يحلل هذا الدليل هياكلهما ومقاييس أدائهما وحالات الاستخدام المثالية لمساعدة المطورين على اختيار الأداة المناسبة لاحتياجاتهم الخاصة.

ملخص تنفيذي: الابتكار مقابل النظام البيئي

YOLOv9 يركز على معالجة المشكلة الأساسية المتمثلة في فقدان المعلومات في الشبكات العميقة من خلال مفاهيم معمارية جديدة مثل معلومات التدرج القابلة للبرمجة (PGI). وهو خيار ممتاز للبحوث الأكاديمية والسيناريوهات التي تتطلب الاحتفاظ بأقصى قدر من الميزات في مجموعات البيانات المعقدة.

YOLO11، على العكس من ذلك، مصمم للعالم الحقيقي. باعتباره جزءًا أصيلًا من Ultralytics فإنه يوفر سهولة استخدام لا مثيل لها، وسرعات استدلال فائقة على الأجهزة المتطورة، ودعمًا أصيلًا لمجموعة واسعة من المهام التي تتجاوز مجرد الكشف البسيط. بالنسبة للمطورين الذين يبنون تطبيقات تجارية، YOLO11 مسارًا أكثر بساطة من التدريب إلى النشر.

المواصفات الفنية والأداء

يوضح الجدول التالي الاختلافات في الأداء بين النماذج على COCO . في حين YOLOv9 أداءً نظريًا قويًا، YOLO11 مزايا كبيرة في السرعة وكفاءة المعلمات، لا سيما في المتغيرات الأصغر للنموذج التي تعتبر حاسمة بالنسبة للذكاء الاصطناعي المتطور.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

YOLOv9: تعمق في التدرجات القابلة للبرمجة

YOLOv9 تقديم YOLOv9 لحل مشكلة "اختناق المعلومات" في الشبكات العصبية العميقة. مع تعمق الشبكات، غالبًا ما تفقد البيانات المدخلة معلومات مهمة قبل وصولها إلى طبقات التنبؤ.

المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 21 فبراير 2024
Arxiv:YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information

الميزات المعمارية الرئيسية

معلومات التدرج القابلة للبرمجة (PGI): تولد PGI تدرجات موثوقة عبر فرع إشراف إضافي، مما يضمن أن الفرع الرئيسي يتعلم ميزات قوية حتى في البنى العميقة جدًا. وهذا مفيد بشكل خاص في البحث في ديناميكيات التدرج التنازلي.
GELAN (شبكة تجميع الطبقات الفعالة المعممة): بنية جديدة تعمل على تحسين استخدام المعلمات، وتجمع بين أفضل جوانب CSPNet و ELAN. وهذا يسمح YOLOv9 دقة عالية مع بنية خفيفة نسبيًا مقارنةUltralytics القديمةUltralytics .

تعرف على المزيد حول YOLOv9

YOLO11: مصمم للإنتاج والتنوع

YOLO11 تتويجًا لخبرة Ultralytics في دعم ملايين ممارسي الذكاء الاصطناعي. وهو يعطي الأولوية للفائدة العملية، ويضمن أن النماذج ليست دقيقة فقط في المعايير المرجعية، بل سهلة التدريب والتصدير والتشغيل على أجهزة متنوعة تتراوح من NVIDIA إلى أجهزة Raspberry Pi.

المؤلفون: Glenn Jocher و Jing Qiu
المؤسسة:Ultralytics
التاريخ: 27 سبتمبر 2024
ريبو:Ultralytics

ميزة Ultralytics

YOLO11 باندماجه مع نظام Ultralytics الأوسع نطاقًا. ويشمل ذلك:

كفاءة الذاكرة: YOLO11 تحسين YOLO11 بحيث يتطلب CUDA أقل بكثير أثناء التدريب مقارنة بالبنى الثقيلة للمحولات أو المستودعات غير المحسنة. وهذا يتيح الوصول إلى التدريب للجميع، مما يسمح للمستخدمين بضبط النماذج الحديثة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين مثل RTX 3060 أو 4070.
دعم واسع النطاق للمهام: على عكس YOLOv9، الذي يركز بشكل أساسي على الكشف في مستودعه الأساسي، يدعم YOLO11 :
قابلية التصدير: تصدير بنقرة واحدة إلى تنسيقات مثل ONNXو TensorRT و CoreML و TFLite YOLO11 الأمثل للنشر على الأجهزة المحمولة والمدمجة.

تعرف على المزيد حول YOLO11

تدريب مبسط مع Ultralytics

YOLO11 تدريب YOLO11 الحد الأدنى من الكود النمطي. يمكنك بدء التدريب على مجموعة بيانات مخصصة في ثوانٍ باستخدام Python :

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

حالات الاستخدام في العالم الحقيقي

يعتمد الاختيار بين هذين النموذجين بشكل كبير على قيود النشر وأهداف المشروع.

السيناريوهات المثالية لـ YOLOv9

المقارنة الأكاديمية: سيجد الباحثون الذين يدرسون طوبولوجيا الشبكات وتدفق المعلومات مفاهيم PGI في YOLOv9 بالنسبة للبحث في الهندسة العصبية.
استخراج الميزات عالية الدقة: بالنسبة للمهام التي يتطلب فيها التقاط الميزات الدقيقة في التصوير الطبي عالي الدقة أمراً بالغ الأهمية، يوفر العمود الفقري GELAN قوة تمثيلية قوية.
نشر GPU قياسي: في البيئات التي يكون فيها زمن الاستجابة أقل أهمية من استخراج آخر 0.1٪ من mAP يُعد نموذج YOLOv9e الأكبر منافسًا قويًا.

السيناريوهات المثالية لـ YOLO11

الذكاء الاصطناعي الحافي وإنترنت الأشياء: بفضل سرعات CPU فائقة (على سبيل المثال، 1.5 مللي ثانية لـ YOLO11n مقابل 2.3 مللي ثانية لـ YOLOv9t على GPU T4، وفجوات أكبر على CPU)، YOLO11 مثاليًا لملاحة الطائرات بدون طيار والكاميرات الذكية.
SaaS التجاري: يضمن استقرار Ultralytics وصيانتها النشطة أن تظل التطبيقات التجارية آمنة ومحدثة بأحدث PyTorch .
خطوط أنابيب متعددة المهام: تستفيد التطبيقات التي تتطلب الكشف والتتبع في وقت واحد، مثل تحليلات الرياضة، من قدرة YOLO11 على تبديل المهام دون تغيير الإطار الأساسي.
التدريب المحدود الموارد: يمكن للشركات الناشئة والطلاب الذين لديهم أجهزة محدودة تدريب YOLO11 الفعالة دون تكبد تكاليف السحابة المرتفعة المرتبطة بالبنى الثقيلة.

المستقبل: التطلع نحو YOLO26

في حين أن YOLOv9 YOLO11 خياران ممتازان، إلا أن مجال الرؤية الحاسوبية لا يهدأ أبدًا. Ultralytics طرحت Ultralytics مؤخرًا YOLO26، وهو نموذج يعيد تعريف الكفاءة لعام 2026 وما بعده.

يستند YOLO26 إلى الدروس المستفادة من كلتا البنيتين، ولكنه يقدم تصميمًا أصليًا شاملاً NMS، والذي تم ابتكاره لأول مرة في YOLOv10. وهذا يلغي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression، مما يبسط خطوط الإنتاج بشكل كبير.

لماذا تختار YOLO26؟

السرعة: CPU أسرع بنسبة تصل إلى 43٪ مقارنة بالأجيال السابقة، وذلك من خلال إزالة خسارة التركيز التوزيعي (DFL) وتحسين تنفيذ الرسم البياني.
الاستقرار: يستخدم محسن MuSGD الجديد، وهو مزيج من SGD Muon (مستوحى من تدريب LLM)، مما يوفر استقرار التدريب على مجموعات كبيرة لمهام الرؤية.
الدقة: تتميز بوظائف ProgLoss + STAL التي تحسن بشكل كبير من التعرف على الأجسام الصغيرة، وهي مشكلة شائعة في تحليل الصور الساتلية.

بالنسبة للمطورين الذين يبدؤون مشاريع جديدة اليوم، YOLO11 بشدة بتقييم YOLO26 جنبًا إلى جنب مع YOLO11 لضمان استمرارية تطبيقاتك في المستقبل.

تعرف على المزيد حول YOLO26

الخلاصة

YOLO11 كل من YOLOv9 YOLO11 معالم بارزة في تاريخ اكتشاف الأجسام. YOLOv9 تحسينات نظرية مهمة فيما يتعلق بالاحتفاظ بالمعلومات في الشبكات العميقة. ومع ذلك، YOLO11 (و YOLO26 الأحدث) بشكل عام حزمة أكثر عملية لمعظم المستخدمين بفضل Ultralytics المتكامل ونسب السرعة إلى الدقة الفائقة وسهولة النشر.

من خلال الاستفادة من Ultralytics يمكن للمطورين تجربة كلا النموذجين بسهولة، ومقارنة أدائهما على مجموعات البيانات المخصصة، ونشر النموذج الفائز في الإنتاج ببضع نقرات فقط.

مزيد من القراءة

مقارنة النماذج: شاهد كيف تقارن هذه النماذج مع YOLOv8 و RT-DETR.
إدارة البيانات: تعرف على كيفية توضيح البيانات بكفاءة لهذه النماذج باستخدام Ultralytics .
النشر: استكشف أدلة تصدير النماذج إلى TensorRT للحصول على أقصى GPU .