تخطي إلى المحتوى

YOLOv9 مقابل YOLOv5: مقارنة تقنية

في مجال الرؤية الحاسوبية سريع التقدم، يعد اختيار النموذج الصحيح لاكتشاف الأجسام أمرًا بالغ الأهمية لنجاح المشروع. يقدم هذا التحليل مقارنة تقنية مفصلة بين YOLOv9الذي يركّز على الأبحاث، والذي يدفع حدود الدقة، و Ultralytics YOLOv5وهو النموذج القياسي في المجال الذي يشتهر بموثوقيته وسرعته وتعدد استخداماته. نستكشف الاختلافات المعمارية ومعايير الأداء وحالات الاستخدام المثالية لمساعدتك على اتخاذ قرار مستنير.

YOLOv9: ابتكار معماري لتحقيق أقصى قدر من الدقة

يستهدف YOLOv9 الذي تم إصداره في أوائل عام 2024، الحدود النظرية لاكتشاف الأجسام من خلال معالجة المشكلات الأساسية في تدفق معلومات التعلم العميق. وهو مصمم للسيناريوهات التي تكون فيها الدقة أمرًا بالغ الأهمية.

المؤلفون: تشين ياو وانغ، هونغ يوان مارك لياو
المنظمة:معهد علوم المعلومات، الأكاديمية الصينية للعلوم بتايوان
التاريخ: 2024-02-21
Arxiv:arXiv:2402.13616
GitHub:WongKinYiu/yolov9
المستندات:وثائقYOLOv9

البنية الأساسية

يقدم YOLOv9 مفهومين رائدين: معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN). يكافح PGI مشكلة عنق الزجاجة المعلوماتية المتأصلة في الشبكات العصبية العميقة من خلال ضمان الاحتفاظ بمعلومات المدخلات الكاملة لدالة الخسارة، مما يحسن موثوقية التدرج. تعمل GELAN على تحسين كفاءة البارامترات، مما يسمح للنموذج بتحقيق دقة أعلى بموارد حسابية أقل مقارنةً بالبنى السابقة التي تستخدم التدوير العميق.

نقاط القوة والضعف

تكمن القوة الأساسية YOLOv9 في دقته الفائقة على معايير مثل مجموعة بياناتCOCO . فهو يتفوق في الكشف عن الأجسام الصغيرة أو المحجوبة حيث قد تفشل النماذج الأخرى. ومع ذلك، يأتي هذا التركيز على دقة الكشف مصحوبًا بمقايضات. يمكن أن تكون عملية التدريب أكثر استهلاكا للموارد، وعلى الرغم من أنه مدمج في منظومة Ultralytics إلا أن دعم المجتمع الأوسع والأدوات الخارجية لا تزال في مرحلة النضج مقارنة بالنماذج الراسخة. بالإضافة إلى ذلك، يظل تركيزه الأساسي على الاكتشاف، في حين أن النماذج الأخرى تقدم دعمًا أصليًا أوسع متعدد المهام.

اعرف المزيد عن YOLOv9

Ultralytics YOLOv5: معيار الصناعة متعدد الاستخدامات

منذ إصداره في عام 2020، حدد Ultralytics YOLOv5 معيار نشر الذكاء الاصطناعي العملي في العالم الحقيقي. فهو يحقق توازناً دقيقاً بين الأداء وسهولة الاستخدام، مما يجعله أحد أكثر النماذج استخداماً على نطاق واسع في التاريخ.

المؤلف: جلين جوشر
المنظمة:Ultralytics
التاريخ: 2020-06-26
GitHub:yolov5
Docs:وثائقYOLOv5

البنية الأساسية

يستخدم YOLOv5 بنية محسّنة قائمة على المرساة تتميز بعمود فقري CSPDarknet53 وعنق PANet لتجميع الميزات القوي. يعطي تصميمه الأولوية لسرعة الاستدلال والتحسين الهندسي. يأتي النموذج بمقاييس مختلفة (من النانو إلى الحجم الكبير جدًا)، مما يسمح للمطورين بملاءمة النموذج بشكل مثالي لقيود أجهزتهم، بدءًا من الأجهزة المتطورة المدمجة إلى وحدات معالجة الرسومات السحابية.

ميزة Ultralytics

بينما يتخطى YOLOv9 الحدود الأكاديمية، يتفوق YOLOv5 في التطبيق العملي الهندسي.

  • سهولة الاستخدام: يشتهر YOLOv5 بتجربة "التثبيت والتشغيل". تعمل واجهة برمجة تطبيقاتPython المبسطة والوثائق الشاملة على تقليل وقت التطوير بشكل كبير.
  • نظام بيئي جيد الصيانة: بدعم من Ultralytics يتمتع YOLOv5 بصيانة نشطة، ومجتمع ضخم على GitHub، وتكامل سلس مع أدوات MLOPS.
  • تعدد الاستخدامات: بالإضافة إلى الاكتشاف، يدعم YOLOv5 أصلاً تجزئة النماذج وتصنيف الصور، مما يوفر حلاً موحدًا لمهام الرؤية المتنوعة.
  • كفاءة الذاكرة: تم تحسين نماذج Ultralytics من أجل تقليل آثار الذاكرة أثناء التدريب والاستدلال على حد سواء، على عكس المتطلبات الثقيلة للبدائل القائمة على المحولات.

تعرف على المزيد حول YOLOv5

مقاييس الأداء: السرعة مقابل الدقة

تبرز المقارنة أدناه الأدوار المتميزة لهذه النماذج. يُحقق YOLOv9 بشكل عام متوسطmAP أعلى (متوسط الدقة)، خاصةً في أحجام النماذج الأكبر (ج و هـ). وهذا يجعله متفوقًا في المهام التي تتطلب تفاصيل دقيقة.

وعلى العكس من ذلك، يوفر YOLOv5 سرعات استدلال لا تُضاهى، خاصةً مع متغيري Nano (n) وS Small (s). بالنسبة للتطبيقات في الوقت الحقيقي على الأجهزة المتطورة مثل NVIDIA Jetson أو Raspberry Pi، يظل YOLOv5 منافسًا رئيسيًا نظرًا لطبيعته خفيفة الوزن ونضج تحسين TensorRT .

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

نصيحة النشر

لتحقيق أقصى قدر من المرونة في النشر، يمكن تصدير كلا النموذجين إلى تنسيقات مثل ONNXTensorRT CoreML باستخدام وضع تصدير Ultralytics . يضمن ذلك تشغيل نماذجك بكفاءة على أي جهاز مستهدف.

التدريب وسهولة الاستخدام

تختلف منهجيات التدريب اختلافًا كبيرًا في تجربة المستخدم. صُممYOLOv5 Ultralytics YOLOv5 لتحقيق كفاءة التدريب، حيث يوفر إعدادات مسبقة قوية تعمل خارج الصندوق لمجموعات البيانات المخصصة. وهو يتميز بحساب الارتكاز التلقائي، وتطور المعلمة الفائقة، وتكامل غني بالتسجيل.

على الرغم من قوة YOLOv9 إلا أنه قد يتطلب ضبطًا أكثر دقة للمعاملات الفائقة لتحقيق الاستقرار والتقارب، خاصةً على مجموعات البيانات الأصغر. ومع ذلك، وبفضل تكامله في ultralytics حزمة Python يمكن للمطورين الآن تدريب YOLOv9 باستخدام نفس الصيغة البسيطة مثل YOLOv5 مما يسد الفجوة في سهولة الاستخدام.

مثال على الكود

باستخدام مكتبة Ultralytics يكون التبديل بين هاتين البنيتين بسيطًا مثل تغيير اسم النموذج. يوضّح هذا المقتطف كيفية تحميل وتشغيل الاستدلال بكلا النموذجين:

from ultralytics import YOLO

# Load the established industry standard YOLOv5 (nano version)
model_v5 = YOLO("yolov5nu.pt")

# Run inference on an image
results_v5 = model_v5("path/to/image.jpg")

# Load the high-accuracy YOLOv9 (compact version)
model_v9 = YOLO("yolov9c.pt")

# Run inference on the same image for comparison
results_v9 = model_v9("path/to/image.jpg")

حالات الاستخدام المثالية

متى تختار YOLOv9

  • فحص عالي الدقة: الكشف عن العيوب الدقيقة في خطوط التجميع التصنيعية حيث يكون لكل بكسل أهمية.
  • أبحاث متقدمة: مشاريع تستكشف بنيات التعلم العميق الجديدة مثل معلومات التدرج القابلة للبرمجة.
  • البيئات المعقدة: سيناريوهات ذات انسداد أو فوضى عالية حيث يوفر تجميع الميزات المتقدم ل GELAN ميزة حاسمة.

متى تختار YOLOv5

  • نشر الحافة: التشغيل على الأجهزة التي تعمل بالبطاريات أو المتحكمات الدقيقة حيث يكون استهلاك الطاقة وبصمة الذاكرة أمرًا بالغ الأهمية.
  • النماذج الأولية السريعة: عندما تحتاج إلى الانتقال من جمع البيانات إلى عرض توضيحي عملي في ساعات وليس أيام، والاستفادة من البرامج التعليمية المكثفة وموارد المجتمع.
  • أنظمة متعددة المهام: التطبيقات التي تتطلب تقدير الوضعية أو التصنيف إلى جانب الكشف ضمن قاعدة برمجية واحدة.
  • استقرار الإنتاج: بيئات المؤسسات التي تتطلب حلاً تم اختباره في المعارك مع سنوات من الموثوقية المثبتة.

الخلاصة

يعتمد الاختيار بين YOLOv9 و YOLOv5 على القيود الخاصة بك. YOLOv9 هو الخيار الأفضل لزيادة الدقة إلى أقصى حد، حيث يقدم تحسينات معمارية متطورة. YOLOv5 يظل بطل تعدد الاستخدامات وسهولة الاستخدام، حيث يوفر نظامًا بيئيًا قويًا ومدعومًا بشكل جيد يبسط دورة حياة الذكاء الاصطناعي بأكملها.

بالنسبة للمطورين الذين يبحثون عن أفضل ما في العالمين - الجمع بين سهولة استخدام YOLOv5 والأداء الذي يتجاوز YOLOv9باستكشاف YOLO11. باعتباره أحدث تكرار من Ultralytics يوفر YOLO11 أحدث ما توصلت إليه التكنولوجيا من سرعة ودقة في جميع مهام الرؤية، وهو ما يمثل مستقبل عائلة YOLO .

استكشف نماذج أخرى

  • YOLO11: النموذج الأحدث والأقوى من Ultralytics للكشف والتجزئة والوضع.
  • YOLOv8: سلف قوي لـ YOLO11 يقدم توازنًا رائعًا بين الميزات.
  • RT-DETR: كاشف قائم على محول مُحسَّن للأداء في الوقت الحقيقي.

تعليقات