تخطي إلى المحتوى

YOLOv5 PP-YOLOE+: مقارنة تقنية بين أجهزة الكشف عن الأجسام في الوقت الفعلي

يعد اختيار البنية المثلى لاكتشاف الكائنات قرارًا بالغ الأهمية يؤثر على كفاءة ودقة وقابلية تطبيقات الرؤية الحاسوبية للتوسع. يقدم هذا الدليل مقارنة تقنية مفصلة بين YOLOv5، المعيار المعتمد عالميًا للذكاء الاصطناعي المتاح، و PP-YOLOE+، وهي بنية متطورة من PaddlePaddle .

بينما يقدم PP-YOLOE+ مفاهيم مثيرة للاهتمام خالية من المراسي، YOLOv5 قوة مهيمنة بفضل نظامه البيئي الفريد ومتانته وتوازنه بين السرعة والدقة. بالنسبة للمطورين الذين يتطلعون إلى المستقبل، نتطرق أيضًا إلى YOLO26، الذي يعيد تعريف الأداء المتطور من خلال الاستدلال NMS.

مقاييس ومعايير الأداء

التوازن بين متوسط الدقة (mAP) وزمن الاستدلال يحدد فائدة النموذج. الجدول أدناه يقارن أداء YOLOv5 PP-YOLOE+ على COCO .

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

YOLOv5 Ultralytics YOLOv5

صدر في عام 2020 عن جلين جوشر و Ultralytics، YOLOv5 ثورة في هذا المجال من خلال إتاحة إمكانية الكشف عن الأجسام عالية الأداء للجميع. تم إنشاؤه أصلاً في PyTorch، وأعطت الأولوية لسهولة الاستخدام "من البداية إلى النهاية"، مما مكن المطورين من الانتقال من مجموعة البيانات إلى النشر في وقت قياسي.

الهندسة المعمارية والتصميم

YOLOv5 شبكة CSPDarknet (Cross Stage Partial Network) لتعظيم تدفق التدرج مع تقليل التكلفة الحسابية إلى الحد الأدنى. ويستخدم رأس كشف قائم على المراسي ، والذي يستخدم مربعات مراسي محددة مسبقًا للتنبؤ بمواقع الكائنات. وقد تم اختبار هذه الطريقة في ظروف قاسية وتوفر تقاربًا مستقرًا عبر مجموعة متنوعة من مجموعات البيانات، من الصور الجوية إلى الفحوصات الطبية.

المزايا الرئيسية

  • الاستعداد للإنتاج: YOLOv5 نشر YOLOv5 في ملايين التطبيقات حول العالم، مما يضمن استقرارًا فائقًا.
  • تعدد الاستخدامات: بالإضافة إلى detect، يدعم النظام أصلاً تجزئة الكائنات (instance segmentation) وتصنيف الصور.
  • قابلية التصدير: يوفر النموذج إمكانية التصدير السلس إلى ONNX و TensorRT و CoreML و TFLite الأجهزة المستهدفة.

تعرف على المزيد حول YOLOv5

نظرة عامة على PP-YOLOE+

PP-YOLOE+ هو تطور لـ PP-YOLOE، تم تطويره بواسطة PaddlePaddle في Baidu. تم إصداره في أبريل 2022، ويركز على تحسين آلية بدون مرساة وصقل بنية العمود الفقري لبيئات الحوسبة عالية الأداء.

الهندسة المعمارية والتصميم

يعتمد PP-YOLOE+ نموذجًا خاليًا من المراسي ، مما يلغي الحاجة إلى ضبط المعلمات الفائقة لمربع المراسي. ويستخدم هيكل CSPRepResStage، الذي يجمع بين الاتصالات المتبقية وتقنيات إعادة المعلمات (نمط RepVGG) لتسريع الاستدلال مع الحفاظ على قدرة استخراج الميزات. كما يستخدم تعلم محاذاة المهام (TAL) لمحاذاة مهام التصنيف والتوطين بشكل أفضل أثناء التدريب.

اعتبارات حالة الاستخدام

على الرغم من أن PP-YOLOE+ يحقق mAP عالٍ mAP COCO إلا أنه يرتبط ارتباطًا وثيقًا PaddlePaddle . وقد يشكل ذلك تحديًا للفرق التي تعتمد بنيتها التحتية على TensorFlow PyTorch TensorFlow القياسي. وتكمن قوته الأساسية في السيناريوهات التي تعطي الأولوية للدقة القصوى على مرونة النشر أو سهولة التدريب.

تعرف على المزيد حول PP-YOLOE+

مقارنة فنية تفصيلية

1. منهجية التدريب وسهولة الاستخدام

أحد الاختلافات الجوهرية يكمن في تجربة المستخدم. YOLOv5 يشتهر بسير عمله "Zero to Hero". يعمل Ultralytics على أتمتة المهام المعقدة مثل زيادة البيانات (Mosaic، MixUp) وتطور المعلمات الفائقة.

  • YOLOv5: يستخدم واجهة سطر أوامر بديهية (CLI) أو Python . يتعامل تلقائيًا مع حسابات مربع التثبيت باستخدام AutoAnchor، مما يضمن تكيف النموذج مع مجموعات البيانات المخصصة دون تدخل يدوي.
  • PP-YOLOE+: يعتمد على نظام تكوين PaddleDetection. على الرغم من قوته، إلا أنه غالبًا ما يتطلب فهمًا أعمق لملفات التكوين المحددة PaddlePaddle مما يجعله صعبًا على العديد من المطورين.

2. سرعة الاستدلال والنشر

YOLOv5 بسرعةCPU ، مما يجعله الخيار الأمثل لتطبيقات الذكاء الاصطناعي المتطورة على أجهزة مثل Raspberry Pi أو الهواتف المحمولة. كما هو موضح في الجدول، يحقق نموذج YOLOv5n (Nano) سرعات مذهلة، وهو أمر بالغ الأهمية للتتبع في الوقت الفعلي.

يركز PP-YOLOE+ بشكل كبير على GPU باستخدام TensorRT. على الرغم من أنه يعمل بشكل جيد على الأجهزة من فئة الخوادم (مثل GPU T4)، إلا أنه غالبًا ما يفتقر إلى التحسينات الخفيفة المطلوبةGPU مقارنة Ultralytics عالية التحسين.

3. كفاءة الذاكرة

تم تصميم Ultralytics لتكون فعالة من حيث الذاكرة. تم تحسين عملية تدريب YOLOv5 لتعمل على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين، مما يتيح الوصول إلى الذكاء الاصطناعي للجميع. في المقابل، غالبًا ما تتطلب التصميمات المعمارية الأحدث القائمة على المحولات أو المعقدة CUDA كبيرة، مما يرفع حاجز الدخول. تضمن بنية YOLOv5 المتوازنة أن يظل استخراج الميزات قويًا دون تضخم غير ضروري في المعلمات.

تطبيقات عملية في أرض الواقع

  • YOLOv5 هو الخيار الأمثل لتقنيات الزراعة (مثل الكشف عن أمراض المحاصيل) وتحليلات البيع بالتجزئة نظرًا لقدرته على العمل على الأجهزة الطرفية في المواقع النائية أو المتاجر التي لا تحتوي على خوادم مخصصة.
  • غالبًا ما يكون PP-YOLOE+ مناسبًا للفحص الصناعي في البيئات الخاضعة للرقابة حيث تتوفر GPU قوية للتعامل مع الحسابات الأكثر تعقيدًا قليلاً من أجل تحقيق مكاسب هامشية في الدقة.

نصيحة حول سير العمل: Ultralytics

عند استخدام Ultralytics يمكنك الوصول إلى Ultralytics . تتيح لك هذه الواجهة الموحدة إدارة مجموعات البيانات والتدريب في السحابة والنشر بأي تنسيق (ONNX TFLite إلخ) بنقرة واحدة، مما يقلل بشكل كبير من عبء MLOps مقارنة بإدارة البرامج النصية الأولية للإطار.

المستقبل: الترقية إلى YOLO26

على الرغم من YOLOv5 نموذج أسطوري، YOLOv5 هذا المجال قد تطور. للمطورين الذين يبحثون عن أفضل أداء على الإطلاق، نوصي باستخدام YOLO26.

يمثل YOLO26 تحولًا جذريًا بفضل تصميمه الشامل NMS. من خلال التخلص من تقنية Non-Maximum Suppression (NMS)، يقلل YOLO26 من زمن الاستدلال وتعقيد النشر. كما يتميز أيضًا بما يلي:

  • MuSGD Optimizer: مزيج من SGD Muon لتحقيق استقرار التدريب على مستوى LLM.
  • CPU أسرع بنسبة تصل إلى 43٪ CPU : مُحسّن خصيصًا للحوسبة الطرفية.
  • ProgLoss + STAL: وظائف خسارة متقدمة تعمل على تحسين اكتشاف الأجسام الصغيرة، وهو مجال بالغ الأهمية لتطبيقات الطائرات بدون طيار وإنترنت الأشياء.

تعرف على المزيد حول YOLO26

سهولة الترقية

يمكن الانتقال من YOLOv5 Ultralytics الأحدث بسهولة بفضل Python الموحدة.

from ultralytics import YOLO

# Load the latest YOLO26 model (auto-downloads pretrained weights)
model = YOLO("yolo26n.pt")

# Run inference on an image
# The API remains consistent, allowing easy upgrades
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

الخلاصة

كلتا البنيتين لهما مزاياهما. توفر PP-YOLOE+ أداءً نظريًا قويًا على COCO لأحمال العمل GPU. ومع ذلك، YOLOv5 تظل هي الأفضل من حيث سهولة الاستخدام ومرونة النشر والأداء المتطور.

بالنسبة لمعظم المطورين والباحثين، يضمن البقاء ضمن نظام Ultralytics قابلية الصيانة على المدى الطويل والوصول إلى أحدث الإنجازات. سواء كنت تفضل الاستمرار في استخدام YOLOv5 الموثوق YOLOv5 الترقية إلى أحدث إصدار YOLO26، ستستفيد من منصة محسّنة للغاية ومدعومة من المجتمع ومصممة لتحقيق النجاح في العالم الحقيقي.

لاستكشاف خيارات أخرى، ضع في اعتبارك مراجعة YOLO11 أو نماذج متخصصة مثل RT-DETR للحصول على دقة قائمة على المحولات.


تعليقات