تخطي إلى المحتوى

YOLOv5 ضد DAMO-YOLO: مقارنة تقنية تفصيلية

في المشهد سريع التطور للرؤية الحاسوبية، يعد اختيار البنية الصحيحة لاكتشاف الأجسام أمرًا محوريًا لنجاح المشروع. تستكشف هذه المقارنة نموذجين مهمين: Ultralytics YOLOv5وهو معيار صناعي معتمد عالميًا ومعروف بموثوقيته وسرعته، ونموذج YOLO وهو نموذج يركز على الأبحاث من مجموعة علي بابا يقدم تقنيات بحث معمارية جديدة.

بينما يهدف كلا النموذجين إلى حل مهام اكتشاف الأجسام، إلا أنهما يلبيان احتياجات مختلفة. يولي YOLOv5 الأولوية لسهولة الاستخدام وتعدد الاستخدامات وتوازن الأداء في العالم الحقيقي، بينما يركز YOLOv5 YOLO على دفع الحدود الأكاديمية من خلال البحث في البنية العصبية (NAS) وآليات دمج الميزات الثقيلة.

مقاييس الأداء والمعايير المرجعية

من الضروري فهم المفاضلة بين سرعة الاستدلال ودقة الكشف عند اختيار نموذج للإنتاج. تسلط البيانات التالية الضوء على أداء هذه النماذج على مجموعة بياناتCOCO وهي معيار قياسي لاكتشاف الأجسام.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

تحليل النتائج

تكشف البيانات عن انقسام واضح في فلسفة التصميم. إن YOLOv5n (Nano) هو بطل السرعة والكفاءة بلا منازع، حيث يوفر وقت استدلال مذهل يبلغ 1.12 مللي ثانية على GPU وأداء CPU الذي يمكن الوصول إليه على نطاق واسع. وهذا يجعلها مثالية لتطبيقات الذكاء الاصطناعي المتطورة حيث يكون زمن الاستجابة المنخفض غير قابل للتفاوض.

طرازات YOLO مثل DAMO-YOLOlتحقيق زيادة هامشية أعلى من متوسط الدقة المتوسطةmAPبلغ ذروته عند 50.8ولكن على حساب التعتيم في مقاييس أداء CPU . يشير الافتقار إلى سرعات CPU المبلغ عنها في YOLO إلى أنها مُحسّنة بشكل أساسي لبيئات GPU المتطورة، مما يحد من مرونتها لسيناريوهات النشر الأوسع نطاقًا مثل تطبيقات الأجهزة المحمولة أو الأنظمة المدمجة.

Ultralytics YOLOv5: معيار الصناعة متعدد الاستخدامات

المؤلف: جلين جوشر
المنظمة:Ultralytics
التاريخ: 2020-06-26
GitHub:https://github.com/ultralytics/yolov5yolov5
الوثائقyolov5

منذ إطلاقه، أثبت YOLOv5 نفسه كحجر زاوية في مجتمع الرؤية الحاسوبية. تم تصميمه أصلاً في PyTorchوهو يوازن بين التعقيد وسهولة الاستخدام، موفرًا تجربة "مدمجة بالبطاريات". وتستخدم بنيتها العمود الفقري لشبكة CSPDarknet وعنق PANet، والتي تجمع الميزات بكفاءة على مقاييس مختلفة detect الأجسام من مختلف الأحجام.

نقاط القوة الرئيسية

  • سهولة الاستخدام: تعطي Ultralytics الأولوية لتجربة المطورين (DX). بفضل واجهة برمجة تطبيقات Python API البسيطة وأوامرCLI البديهية، يمكن للمستخدمين تدريب النماذج ونشرها في دقائق.
  • نظام بيئي جيد الصيانة: مدعومًا بمجتمع نشط وتحديثات متكررة، يضمن YOLOv5 التوافق مع أحدث الأدوات، بما في ذلك Ultralytics HUB لإدارة النماذج بسلاسة.
  • تعدد الاستخدامات: بالإضافة إلى الاكتشاف القياسي، يدعم YOLOv5 تجزئة النماذج وتصنيف الصور، مما يسمح للمطورين بمعالجة مهام رؤية متعددة باستخدام إطار عمل واحد.
  • مرونة النشر: من التصدير إلى ONNX TensorRT إلى التشغيل على iOS Android تم تصميم YOLOv5 للتشغيل في أي مكان.

تعرف على المزيد حول YOLOv5

انسيابية سير العمل

يتكامل YOLOv5 بسلاسة مع أدوات MLOps الشائعة. يمكنك track تجاربك باستخدام Weights & Biases أو Comet بأمر واحد، مما يضمن أن تكون عمليات التدريب الخاصة بك قابلة للتكرار وسهلة التحليل.

YOLO: الدقة القائمة على البحث العلمي

المؤلفون: شيانزهي شو، وييكي جيانغ، وويهوا تشن، وويلون هوانغ، ويوان تشانغ، وشيويو صن
المنظمة: مجموعة علي بابا
التاريخ: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHubYOLO

YOLO هي طريقة طورتها أكاديمية DAMO التابعة لشركة علي بابا. وهي تقدم مجموعة من التقنيات المتقدمة بما في ذلك البحث المعماري العصبي (NAS) لتصميم العمود الفقري الفعال تلقائيًا (MAE-NAS)، وهيكل عنق ثقيل يُعرف باسم RepGFPN (شبكة هرم السمات المعممة المعاد تحديدها)، ورأس خفيف الوزن يسمى ZeroHead.

الخصائص الرئيسية

  • العمود الفقري MAE-NAS: يستخدم طريقة تسمى MAE-NAS للعثور على بنية الشبكة المثلى في ظل قيود كمون محددة، على الرغم من أن هذا يمكن أن يجعل البنية أكثر تعقيدًا لتعديلها يدويًا.
  • تعيين التسمية AlignedOTA: يستخدم استراتيجية تعيين تسمية ديناميكية تسمى AlignedOTA لحل حالات عدم التوافق بين مهام التصنيف والانحدار.
  • التركيز على الدقة: الهدف الأساسي من YOLO هو تعظيم mAP على مجموعة بيانات COCO مما يجعلها منافسًا قويًا للمسابقات أو الأبحاث الأكاديمية حيث يكون كل جزء من النسبة المئوية مهمًا.

تعرف على المزيد حول DAMO-YOLO

الاختلافات المعمارية والتشغيلية

يمتد الاختلاف بين YOLOv5 YOLO إلى ما هو أبعد من المقاييس البسيطة إلى فلسفات التصميم الأساسية والمتطلبات التشغيلية.

الهندسة المعمارية: البساطة مقابل التعقيد

يستخدم YOLOv5 بنية مصممة يدويًا وبديهية. نهجها القائم على الارتكاز مفهوم جيدًا وسهل التصحيح. على النقيض من ذلك، يعتمد YOLO على إعادة المعلمات الثقيلة والبحث الآلي (NAS). في حين أن NAS يمكن أن ينتج عنه هياكل فعالة، إلا أنه غالبًا ما ينتج عنه نماذج "الصندوق الأسود" التي يصعب على المطورين تخصيصها أو تفسيرها. بالإضافة إلى ذلك، تزيد الرقبة الثقيلة (RepGFPPN) في YOLO من العبء الحسابي أثناء التدريب، مما يتطلب المزيد من ذاكرةGPU مقارنةً بتصميم YOLOv5 الفعال في نظام CSP الفعال.

كفاءة التدريب والذاكرة

تشتهر نماذج Ultralytics بكفاءة التدريب. يتطلب YOLOv5 عادةً ذاكرة CUDA أقل، مما يسمح بتدريبها على وحدات معالجة الرسومات من فئة المستهلكين. أما نموذج YOLO مع عملياته المعقدة لإعادة المعلمات والتقطير، فغالباً ما يتطلب أجهزة متطورة للتدريب بفعالية. علاوة على ذلك، يوفر Ultralytics مكتبة واسعة من الأوزان المدربة مسبقًا والضبط الآلي للمعاملات الفائقة لتسريع مسار التقارب.

النظام البيئي وسهولة الاستخدام

ربما يكمن الاختلاف الأكثر أهمية في النظام البيئي. إن YOLOv5 ليس مجرد نموذج، بل هو جزء من مجموعة شاملة من الأدوات.

  • التوثيق: تحتفظ Ultralytics بوثائق شاملة ومتعددة اللغات ترشد المستخدمين من جمع البيانات إلى النشر.
  • المجتمع: يضمن المجتمع العالمي الضخم حل المشكلات بسرعة، كما أن البرامج التعليمية متاحة بسهولة.
  • عمليات التكامل: الدعم الأصلي ل Roboflow ومجموعات البيانات وأهداف النشر مثل NVIDIA Jetson لتبسيط خط الأنابيب بالكامل.

يفتقر YOLO وهو مستودع بحثي في المقام الأول، إلى هذا المستوى من الدعم المصقول، مما يجعل التكامل في المنتجات التجارية أكثر صعوبة بشكل كبير.

حالات الاستخدام في العالم الحقيقي

غالباً ما يعتمد الاختيار بين هذه النماذج على بيئة النشر المحددة.

أين يتفوق YOLOv5

  • الزراعة الذكية: إن متطلباتها المنخفضة من الموارد تجعلها مثالية للتشغيل على الطائرات بدون طيار أو الجرارات ذاتية القيادة للكشف عن أمراض المحاصيل.
  • التصنيع: في الأتمتة الصناعية، تسمح سرعة YOLOv5 العالية باكتشاف العيوب في الوقت الحقيقي على سيور النقل سريعة الحركة.
  • تحليلات البيع بالتجزئة: بالنسبة لحساب الكائنات وإدارة قوائم الانتظار، يتيح أداء CPU YOLOv5 إمكانية النشر الفعال من حيث التكلفة على أجهزة المتجر الحالية.

أين يتفوق YOLO

  • الأبحاث الأكاديمية: سيجد الباحثون الذين يدرسون فعالية تقنية RepGFPN أو تقنيات NAS أن YOLO خط أساس قيّم.
  • المراقبة المتطورة: في السيناريوهات التي تحتوي على وحدات معالجة رسومات مخصصة على مستوى الخادم حيث يتم إعطاء الأولوية للدقة على زمن الوصول، يمكن أن يوفر YOLO اكتشافًا دقيقًا في المشاهد المعقدة.

مثال على الكود: البدء باستخدام YOLOv5

يعد تشغيل YOLOv5 أمرًا بسيطًا ومباشرًا بفضل حزمة Ultralytics Python . يوضح المثال التالي كيفية تحميل نموذج مُدرَّب مسبقًا وتشغيل الاستدلال على صورة.

import torch

# Load a pre-trained YOLOv5s model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Define an image URL or local path
img = "https://ultralytics.com/images/zidane.jpg"

# Run inference
results = model(img)

# Print results to the console
results.print()

# Show the image with bounding boxes
results.show()

الخلاصة

يساهم كل من YOLOv5 و YOLO بشكل كبير في مجال اكتشاف الأجسام. يُظهر YOLO إمكانات البحث عن البنية العصبية ودمج الميزات المتقدمة لتحقيق معايير عالية الدقة.

ومع ذلك، بالنسبة للغالبية العظمى من المطورين والمهندسين والشركات, Ultralytics YOLOv5 يظل الخيار الأفضل. حيث يضمن سهولة استخدامه التي لا مثيل لها، وتوازن الأداء القوي، وأمان النظام البيئي الذي يتم صيانته بشكل جيد انتقال المشاريع من النموذج الأولي إلى الإنتاج بأقل قدر من الاحتكاك. كما أن القدرة على النشر بكفاءة عبر وحدات المعالجة المركزية ووحدات معالجة الرسومات، بالإضافة إلى انخفاض متطلبات الذاكرة للتدريب، تجعل من YOLOv5 حلاً عمليًا للغاية للتطبيقات في العالم الحقيقي.

بالنسبة لأولئك الذين يتطلعون إلى الاستفادة من أحدث ما توصلت إليه تكنولوجيا الرؤية الحاسوبية على الإطلاق، واصلت Ultralytics الابتكار مع YOLOv8 وأحدث ما توصلت إليه YOLO11. تعتمد هذه النماذج الأحدث على الأساس المتين ل YOLOv5 مما يوفر سرعة ودقة وتنوعًا أكبر في المهام.

استكشف مقارنات أخرى

ولمزيد من الفهم لكيفية تناسب هذه النماذج مع النظام البيئي الأوسع، استكشف هذه المقارنات التفصيلية:


تعليقات