تخطي إلى المحتوى

YOLOv5 مقابل YOLOv9: مقارنة تقنية شاملة

اتسم تطور الكشف عن الأجسام في الوقت الحقيقي بالتقدم السريع في الدقة والكفاءة. ومن المعالم البارزة في هذه الرحلة Ultralytics YOLOv5وهو النموذج الذي وضع معيار الصناعة لقابلية الاستخدام والنشر، و YOLOv9وهي بنية تركز على الأبحاث التي تدفع حدود نظرية التعلم العميق.

تحلل هذه المقارنة التقنية بنيتها ومقاييس أدائها وحالات الاستخدام المثالية لمساعدة المطورين والباحثين على اختيار الأداة المناسبة لمشاريعهم الخاصة بالرؤية الحاسوبية.

Ultralytics YOLOv5: معيار الصناعة لتعدد الاستخدامات

منذ إطلاقه YOLOv5 أحد أشهر نماذج الذكاء الاصطناعي للرؤية على مستوى العالم. تم تطويره من قِبل Ultralytics وهو يعطي الأولوية للتميز الهندسي وسهولة الاستخدام والأداء الواقعي. فهو يوازن بين السرعة والدقة مع توفير تجربة مستخدم سلسة من خلال نظام بيئي قوي.

تفاصيل فنية:

الهندسة المعمارية والتصميم

يستخدم YOLOv5 العمود الفقري لشبكة CSPDarknet مع عنق PANet لاستخراج الميزات وتجميعها بكفاءة. تم تحسين رأس الاكتشاف القائم على المرساة بشكل كبير من أجل السرعة، مما يجعله مناسبًا لمجموعة واسعة من الأجهزة. على عكس النماذج الأكاديمية البحتة، صُمم YOLOv5 مع وضع النشر في الاعتبار، حيث يقدم دعمًا أصليًا لـ iOS, Androidوالأجهزة المتطورة.

نقاط القوة الرئيسية

  • نظام بيئي جيد الصيانة: تستفيد YOLOv5 من سنوات من التطوير النشط، مما أدى إلى توثيق مكثف ودعم مجتمعي وتكامل مع أدوات مثل Ultralytics HUB.
  • كفاءة التدريب: تشتهر بأوقات تدريب سريعة ومتطلبات ذاكرة أقل مقارنةً بالبنى القائمة على المحولات، مما يجعلها متاحة على وحدات معالجة الرسومات الاستهلاكية القياسية.
  • تعدد الاستخدامات: بالإضافة إلى الاكتشاف، يدعم YOLOv5 أصلاً تجزئة النماذج وتصنيف الصور، مما يسمح للمطورين بمعالجة مهام رؤية متعددة باستخدام إطار عمل واحد.
  • جاهز للنشر: مع إمكانات التصدير المدمجة إلى ONNX, TensorRTCoreML TFLite فإن الانتقال من البحث إلى الإنتاج يتم بشكل مبسط.

تعرف على المزيد حول YOLOv5

YOLOv9: ابتكار معماري لتحقيق أقصى قدر من الدقة

صدر في عام 2024, YOLOv9 على حل مشكلات فقدان المعلومات في الشبكات العميقة. يقدم مفاهيم جديدة لتحسين كيفية انتشار البيانات من خلال النموذج، محققًا أحدث النتائج على معايير مثل COCO.

تفاصيل فنية:

الهندسة المعمارية والابتكارات

يقدم YOLOv9 تطورين معماريين أساسيين:

  1. معلومات التدرج القابلة للبرمجة (PGI): تقنية مصممة للتخفيف من مشكلة عنق الزجاجة في المعلومات، مما يضمن توفر معلومات المدخلات الكاملة لحساب دالة الخسارة.
  2. شبكة تجميع الطبقات المعممة الفعالة المعممة (GELAN): بنية شبكية خفيفة الوزن تعمل على تحسين كفاءة البارامترات، مما يسمح للنموذج بتحقيق دقة أعلى بمعلمات أقل من بعض النماذج السابقة.

نقاط القوة الرئيسية

  • دقة عالية: يضع YOLOv9 معايير مذهلة لدقة اكتشاف الأجسام، خاصةً في تكويناته الأكبرYOLOv9).
  • كفاءة المعلمة: تضمن بنية GELAN استخدام النموذج للمعلمات بفعالية، مما يوفر نسبة دقة إلى وزن قوية.
  • التقدم النظري: يعالج قضايا أساسية في التعلم العميق فيما يتعلق بحفظ المعلومات في الطبقات العميقة.

اعرف المزيد عن YOLOv9

مقارنة الأداء

عند مقارنة هذين النموذجين، تكمن المفاضلة عادةً بين السرعة والدقة المطلقة. يُحقّق YOLOv9 درجات mAPval أعلى على مجموعة بيانات COCO مما يدل على فعالية PGI وGELAN. ومع ذلك Ultralytics YOLOv5 منافسًا هائلًا في سرعة الاستدلال، لا سيما على وحدات المعالجة المركزية والأجهزة المتطورة، حيث تتألق بنيته المحسّنة.

توازن الأداء

بينما يتصدر YOLOv9 قوائم الدقة, YOLOv5 غالبًا ما يوفر توازنًا عمليًا أكثر للتطبيقات في الوقت الفعلي، حيث يوفر سرعات استنتاج أسرع بكثير (مللي ثانية) على الأجهزة القياسية مع الحفاظ على قدرات كشف قوية.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

التدريب والموارد

بالنسبة للمطورين، غالبًا ما تكون كفاءة التدريب بنفس أهمية سرعة الاستدلال. تشتهر Ultralytics YOLOv5 ببساطتها في "التدريب والانطلاق". وعادةً ما يتطلب ذاكرة أقل أثناء التدريب مقارنةً بالبنى الأحدث والأكثر تعقيدًا، خاصةً النماذج القائمة على المحولات (مثل RT-DETR). يسمح هذا الحاجز المنخفض للدخول للمستخدمين بتدريب نماذج مخصصة على إعدادات أجهزة متواضعة.

على الرغم من كفاءة YOLOv9 في البارامترات، إلا أن التدريب عليه قد يكون أكثر كثافة في الموارد بسبب تعقيد الفروع المساعدة المستخدمة في PGI، والتي تتم إزالتها أثناء الاستدلال ولكنها تضيف نفقات زائدة أثناء التدريب.

مثال على التعليمات البرمجية: الواجهة الموحدة

تتمثل إحدى المزايا الرئيسية لنظام Ultralytics البيئي في واجهة برمجة تطبيقاتPython الموحدة. يمكنك التبديل بين YOLOv5 و YOLOv9 بسطر واحد من التعليمات البرمجية، مما يجعل من السهل للغاية قياس كلاهما على مجموعة بياناتك المحددة.

from ultralytics import YOLO

# Load an Ultralytics YOLOv5 model (pre-trained on COCO)
model_v5 = YOLO("yolov5su.pt")

# Train the model on your custom data
results_v5 = model_v5.train(data="coco8.yaml", epochs=100, imgsz=640)

# Load a YOLOv9 model for comparison
model_v9 = YOLO("yolov9c.pt")

# Train YOLOv9 using the exact same API
results_v9 = model_v9.train(data="coco8.yaml", epochs=100, imgsz=640)

حالات الاستخدام المثالية

يعتمد الاختيار بين هذه النماذج على أولويات مشروعك:

متى تختار Ultralytics YOLOv5

  • نشر الحافة: مناسب بشكل مثالي لتطبيقات Raspberry Pi وتطبيقات الأجهزة المحمولة والأنظمة المدمجة حيث يكون كل جزء من الثانية من زمن الاستجابة مهمًا.
  • النماذج الأولية السريعة: تتيح سهولة الاستخدام، والبرامج التعليمية المكثفة، والدعم المجتمعي دورات تطوير سريعة للغاية.
  • متطلبات متعددة المهام: إذا كان مشروعك يتطلب تجزئة أو تصنيفاً إلى جانب الكشف، فإن YOLOv5 يوفر حلاً موحداً.
  • قيود الموارد: ستستفيد المشاريع ذات الذاكرة المحدودة GPU للتدريب من كفاءة YOLOv5.

متى تختار YOLOv9

  • الدقة القصوى: أمر بالغ الأهمية لتطبيقات مثل التصوير الطبي أو الفحص الصناعي عالي الدقة حيث يكون فقدان الكشف مكلفًا.
  • البحث الأكاديمي: ممتازة للباحثين الذين يستكشفون أحدث ما توصل إليه تدفق المعلومات المتدرج وتصميم بنية الشبكة.
  • الأجهزة القوية: يُستفاد منها على أفضل وجه عندما تتوفر موارد حاسوبية وافرة للتدريب والاستدلال للاستفادة من إمكاناتها الكاملة.

الخلاصة

يمثل كلا النموذجين التميز في مجال الرؤية الحاسوبية. Ultralytics YOLOv5 يظل الخيار العملي لمعظم المطورين، حيث يقدم مزيجًا لا يُضاهى من السرعة والموثوقية ودعم النظام البيئي. إنه فرس عمل تم اختباره في المعركة للنشر في العالم الحقيقي. YOLOv9من ناحية أخرى، يقدم لمحة عن مستقبل الكفاءة المعمارية، حيث يوفر دقة من الدرجة الأولى لمن يحتاجون إليها.

لأولئك الذين يبحثون عن أحدث ما توصلت إليه التكنولوجيا في الأداء وتعدد الاستخدامات، نوصي أيضاً باستكشاف YOLO11الذي يعتمد على نقاط القوة في YOLOv5 و YOLOv8 لتقديم أحدث النتائج في جميع المقاييس.

استكشف نماذج أخرى

إذا كنت مهتمًا بمزيد من الاستكشاف، يمكنك الاطلاع على هذه النماذج ذات الصلة في منظومة Ultralytics :

  • YOLO11: أحدث طراز من SOTA يقدم أداءً فائقاً وتعدد استخدامات.
  • YOLOv8: نموذج قوي خالٍ من الارتكاز يدعم الكشف والتجزئة والوضعية وOBB.
  • RT-DETR: كاشف قائم على المحولات في الوقت الحقيقي للتطبيقات عالية الدقة.

تعليقات