تخطي إلى المحتوى

YOLO11 مقابل YOLOv9: مقارنة تقنية شاملة

في مجال الرؤية الحاسوبية سريع التقدم، يعد اختيار النموذج الصحيح لاكتشاف الأجسام أمرًا بالغ الأهمية لنجاح المشروع. تستكشف هذه المقارنة الفروق التقنية الدقيقة بين Ultralytics YOLO11وهو أحدث نموذج متطور مصمم لتحقيق الكفاءة في العالم الحقيقي، و YOLOv9وهي بنية تركز على الأبحاث ومعروفة بابتكاراتها النظرية. نقوم بتحليل الاختلافات المعمارية ومقاييس الأداء وملاءمتها لسيناريوهات النشر المتنوعة.

Ultralytics YOLO11: معيار الذكاء الاصطناعي للإنتاج

صدر في 27 سبتمبر 2024، بقلم جلين جوشر وجينغ تشيو في UltralyticsYOLO11 يمثل YOLO11 تتويجًا لجهود البحث والتطوير المكثفة في تصميم شبكة عصبية فعالة. على عكس النماذج الأكاديمية التي غالبًا ما تعطي الأولوية للمقاييس النظرية على سهولة الاستخدام العملي، تم تصميم YOLO11 لتحقيق التوازن الأمثل بين السرعة والدقة وكفاءة الموارد للمطورين والمؤسسات.

تفاصيل فنية:

البنية والميزات

YOLO11 بنية محسّنة تعزز استخراج الملامح مع الحفاظ على عامل الشكل المدمج. فهو يستخدم بنية محسنة للعمود الفقري والرقبة مصممة خصيصًا لالتقاط الأنماط المعقدة بمعلمات أقل مقارنة بالأجيال السابقة مثل YOLOv8. تضمن فلسفة التصميم هذه تشغيل نماذج YOLO11 بشكل جيد للغاية على الأجهزة محدودة الموارد، مثل الأجهزة المتطورة، دون التضحية بقدرة الكشف.

الميزة البارزة في YOLO11 هي تعدد استخداماته الأصلية. في حين أن العديد من النماذج عبارة عن كاشفات للأشياء بشكل صارم، يدعم YOLO11 مجموعة واسعة من مهام الرؤية الحاسوبية في إطار واحد:

نقاط القوة في الإنتاج

بالنسبة للمطورين، تتمثل الميزة الأساسية لـ YOLO11 في تكامله مع نظامUltralytics البيئي. ويضمن ذلك تجربة مستخدم مبسطة مع واجهة برمجة تطبيقاتPython بسيطة CLI برمجة تطبيقات شاملة.

لماذا يختار المطورون YOLO11

يقلل YOLO11 بشكل كبير من "وقت الوصول إلى السوق" لحلول الذكاء الاصطناعي. كما أن متطلبات الذاكرة المنخفضة أثناء التدريب والاستدلال تجعله متاحًا لمجموعة واسعة من الأجهزة، مما يجنّب التكاليف العالية لذاكرة التخزين الافتراضية (VRAM) المرتبطة بالبدائل القائمة على المحولات.

تعرف على المزيد حول YOLO11

YOLOv9: معالجة الاختناقات المعلوماتية

تم تقديم YOLOv9 في أوائل عام 2024 من قبل تشين ياو وانغ وهونغ يوان مارك لياو، ويركز على حل تحديات نظرية التعلم العميق، وتحديداً مشكلة عنق الزجاجة المعلوماتية. إنها شهادة على الدقة الأكاديمية، حيث تدفع حدود ما هو ممكن في الحفاظ على الميزات.

تفاصيل فنية:

الابتكارات المعمارية

تم بناء YOLOv9 حول مفهومين أساسيين: معلومات التدرج القابلة للبرمجة (PGI ) وشبكة تجميع الطبقات الفعالة المعممة (GELAN). يهدف PGI إلى الحفاظ على معلومات المدخلات أثناء مرورها عبر الطبقات العميقة، وحساب تدرج موثوق لدالة الخسارة. تعمل GELAN على تحسين استخدام البارامترات، مما يسمح للنموذج بتحقيق دقة عالية على مجموعة بياناتCOCO بالنسبة لحجمها.

الأداء والمقايضات

يتفوق YOLOv9 في معايير الدقة الأولية، حيث حقق متغيره الأكبر، YOLOv9 نتائج mAP في اختبار الدقة الخام. ومع ذلك، يمكن أن يُترجم هذا التركيز الأكاديمي إلى تعقيد أكبر في النشر. على الرغم من قوتها، إلا أن التطبيق الأصلي يفتقر إلى تعدد المهام الأصلي الموجود في إطار عمل Ultralytics مع التركيز بشكل أساسي على الاكتشاف. علاوةً على ذلك، يمكن أن يكون تدريب هذه البنى أكثر كثافة في استخدام الموارد مقارنةً بخطوط الأنابيب المحسّنة للغاية في YOLO11.

اعرف المزيد عن YOLOv9

مقاييس الأداء: السرعة مقابل الدقة

عند اختيار نموذج، من الضروري فهم المفاضلة بين سرعة الاستدلال ودقة الكشف. يقارن الجدول أدناه بين أداء عائلتي النماذج على مجموعة بيانات COCO .

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

التحليل

تسلط البيانات الضوء على توازن الأداء الذي تم تصميمه في YOLO11.

  • الكفاءة: يتفوق YOLO11n على YOLOv9t في الدقة (39.5% مقابل 38.3%) مع استهلاك عدد أقل من وحدات FLOP (6.5 مليار مقابل 7.7 مليار)، مما يجعله متفوقًا في النشر على الأجهزة المحمولة.
  • السرعة: في جميع المجالات، يُظهر YOLO11 أوقات استنتاج أسرع على وحدات معالجة الرسومات T4 باستخدام TensorRT وهو عامل حاسم لتحليلات الفيديو في الوقت الحقيقي.
  • الدقة: على الرغم من أن YOLOv9 يحتل المركز الأول في دقة mAP الخام، إلا أنه يأتي على حساب زمن انتقال أعلى بكثير (16.77 مللي ثانية مقابل 11.3 مللي ثانية لـ YOLO11x). بالنسبة لمعظم التطبيقات العملية، تفوق ميزة السرعة في YOLO11 ميزة السرعة في YOLO11 المكاسب الهامشية في mAP.

سهولة الاستخدام والنظام البيئي

إن الفرق في "المهارات الشخصية"، أي سهولة الاستخدام والتوثيق والدعم، هو ما يجعل نماذج Ultralytics تتألق حقًا.

سهولة الاستخدام وكفاءة التدريب

صُمم YOLO11 ليكون في متناول الجميع. مع معيار Python القياسية، يمكنك تدريب النماذج والتحقق من صحتها ونشرها في أسطر من التعليمات البرمجية. يوفر Ultralytics أوزاناً مُدرّبة مسبقاً تسمح بنقل التعلم، مما يقلل بشكل كبير من وقت التدريب والبصمة الكربونية لتطوير الذكاء الاصطناعي.

في المقابل، بينما يتوفر YOLOv9 ضمن حزمة Ultralytics فإن قاعدة رموزه البحثية الأصلية تتطلب فهمًا أعمق لتكوينات التعلم العميق. يستفيد مستخدمو YOLO11 من واجهة موحدة تعمل بشكل متماثل سواء كنت تقوم بالتجزئة أو التصنيف.

مقارنة الرموز: بساطة YOLO11

يعد تدريب نموذج YOLO11 بسيطًا ومباشرًا باستخدام واجهة برمجة تطبيقات Ultralytics Python .

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("path/to/image.jpg")

نظام بيئي جيد الصيانة

اختيار YOLO11 يعني الدخول في بيئة مدعومة. يتضمن نظامUltralytics البي ئي:

حالات الاستخدام المثالية

متى تختار YOLO11

إن YOLO11 هو الخيار الموصى به لـ 95% من المشاريع التجارية والهواة نظرًا لتعدد استخداماته وسرعته.

  • الذكاء الاصطناعي المتطور: النشر على أجهزة مثل Raspberry Pi أو NVIDIA Jetson حيث تكون الذاكرة وFLOPs محدودة.
  • المراقبة في الوقت الحقيقي: التطبيقات التي تتطلب سرعة عالية في الثانية من أجل المراقبة الأمنية.
  • تطبيقات متعددة المهام: المشاريع التي تحتاج إلى الكشف المتزامن والتجزئة وتقدير الوضعية دون إدارة العديد من بنيات النماذج المتميزة.

متى تختار YOLOv9

YOLOv9 هو الأنسب لسيناريوهات أكاديمية محددة أو عالية الدقة.

  • المقارنة المعيارية البحثية: عندما يكون الهدف الأساسي هو مقارنة البنى النظرية أو التغلب على درجة mAP محددة على مجموعة بيانات مثل COCO.
  • المعالجة دون اتصال بالإنترنت: السيناريوهات التي لا تمثل فيها سرعة الاستدلال قيدًا، وكل جزء من النسبة المئوية في الدقة مهم، مثل تحليل التصوير الطبي دون اتصال بالإنترنت.

الخلاصة

بينما YOLOv9 يقدم مفاهيم رائعة مثل PGI وGELAN للمجتمع الأكاديمي, Ultralytics YOLO11 يبرز كخيار عملي متفوق لبناء منتجات الذكاء الاصطناعي. إن الجمع الذي لا مثيل له بين السرعة والدقة وتعدد الاستخدامات وسهولة الاستخدام يجعله النموذج المفضل للرؤية الحاسوبية الحديثة. مدعومًا بنظام بيئي قوي ومصمم لتحقيق الكفاءة، يمكّن YOLO11 المطورين من الانتقال من المفهوم إلى النشر بثقة.

استكشف نماذج أخرى

إذا كنت مهتمًا بإجراء المزيد من المقارنات، ففكر في استكشاف هذه النماذج الأخرى عالية الأداء في مكتبة Ultralytics :

  • YOLOv10: الكشف عن الأجسام من البداية إلى النهاية في الوقت الفعلي.
  • YOLOv8: سلف YOLO11 ولا يزال يُستخدم على نطاق واسع في الإنتاج.
  • RT-DETR: كاشف قائم على المحولات يوفر دقة عالية لمن لديهم بيئات GPU.

تعليقات