PP-YOLOE+ مقابل YOLOv5: التنقل بين معماريات كشف الأجسام

عند اختيار إطار عمل التعلم العميق المناسب لرؤية الحاسوب، غالباً ما يجد المطورون أنفسهم يقارنون بين قدرات المعماريات المختلفة للعثور على التوازن المثالي بين السرعة والدقة وسهولة النشر. في هذا التحليل المتعمق، سنستكشف الفروق الفنية بين PP-YOLOE+ و YOLOv5. من خلال تحليل معمارياتهما، ومقاييس الأداء، وسيناريوهات النشر المثالية، يمكنك اتخاذ قرار مدروس لمشروعك التالي، سواء كان يتضمن الروبوتات في الوقت الفعلي، أو النشر على الحافة، أو تحليلات الفيديو القائمة على السحابة.

أصول النموذج وبياناته الوصفية

ينحدر كلا النموذجين من فرق هندسية عالية الكفاءة ولكنهما يستهدفان أنظمة بيئية مختلفة قليلاً. يوفر فهم أصولهما سياقاً قيماً لخيارات التصميم المعماري الخاصة بهما.

تفاصيل PP-YOLOE+:

تعرف على المزيد حول PP-YOLOE+

تفاصيل YOLOv5:

اعرف المزيد حول YOLOv5

مقارنة معمارية

بنية PP-YOLOE+

PP-YOLOE+ هو تطور ضمن النظام البيئي لـ Baidu، مبني على أساس النماذج السابقة مثل PP-YOLOv2. يقدم العمود الفقري CSPRepResNet المحسن بشكل كبير، والذي يعزز استخراج الميزات من خلال الجمع بين مبادئ شبكات Cross Stage Partial (CSP) وتقنيات إعادة التقييم (re-parameterization). يسمح هذا للنموذج بالحفاظ على دقة عالية أثناء التدريب مع الانهيار إلى بنية أكثر انسيابية لاستنتاج أسرع.

بالإضافة إلى ذلك، يستخدم PP-YOLOE+ تقنية Task Alignment Learning (TAL) ورأس المهمة الموائمة بكفاءة (ET-head). يهدف هذا المزيج إلى حل مشكلة عدم المواءمة بين مهام التصنيف والتموضع، وهي عقبة شائعة في كاشفات الأجسام الكثيفة. على الرغم من أن البنية مبهرة، إلا أنها مرتبطة ارتباطاً وثيقاً بـ إطار عمل PaddlePaddle، مما قد يفرض تحديات تكامل للفرق التي توحد معاييرها على مكتبات تعلم آلي أخرى سائدة.

معمارية YOLOv5

على النقيض من ذلك، تم تصميم YOLOv5 بشكل أصلي في PyTorch، وهو المعيار الصناعي لكل من الأبحاث الأكاديمية والإنتاج المؤسسي. وهو يستخدم عموداً فقرياً معدلاً من CSPDarknet53، معروف بتدفق التدرج الاستثنائي وكفاءة المعلمات.

من سمات YOLOv5 خوارزمية AutoAnchor الخاصة به، والتي تتحقق ديناميكياً من أحجام صناديق الارتساء (anchor boxes) وتعدلها بناءً على مجموعة بياناتك المخصصة قبل التدريب. هذا يلغي الضبط اليدوي للمعلمات الفائقة لصناديق الإحاطة. يضمن عنق شبكة تجميع المسار (PANet) للنموذج دمجاً قوياً للميزات متعددة المقاييس، مما يجعله فعالاً للغاية في اكتشاف الأجسام عبر أحجام مختلفة.

نشر انسيابي في PyTorch

نظراً لأن YOLOv5 مبني مباشرة على PyTorch، فإن التصدير إلى تنسيقات محسنة مثل ONNX و TensorRT يتطلب تكوين برامج وسيطة أقل بكثير من النماذج المرتبطة بإطارات عمل محلية.

تحليل الأداء

يتطلب تقييم هذه النماذج النظر في المقايضة بين متوسط دقة الموضع (mAP) وزمن الاستجابة. يعرض الجدول التالي المقاييس عبر أحجام النماذج المختلفة.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

بينما يحقق PP-YOLOE+ نتائج mAP تنافسية للغاية في المقاييس الأكبر (مثل متغير X)، يوفر YOLOv5 سرعة فائقة وعدد معلمات أقل في الطرف الأصغر من الطيف. يتطلب YOLOv5 Nano (YOLOv5n) 2.6 مليون معلمة فقط، مما يجعله مناسباً للغاية لأجهزة الحافة المحدودة حيث تكون متطلبات الذاكرة صارمة. علاوة على ذلك، يستهلك تدريب نماذج YOLO عادةً ذاكرة CUDA أقل مقارنة بالبدائل الثقيلة القائمة على Transformer مثل RT-DETR.

ميزة Ultralytics

عند اختيار معمارية، تكون المقاييس الخام جزءاً فقط من المعادلة. غالباً ما تحدد تجربة المطور، ودعم النظام البيئي، وخطوط أنابيب النشر نجاح المشروع في العالم الحقيقي. وهنا تبرز نماذج Ultralytics.

سهولة استخدام لا تضاهى

تعمل واجهة برمجة تطبيقات Python لـ Ultralytics على تجريد الأكواد النمطية المعقدة. يمكن للمطورين بدء التدريب، والتحقق من الأداء، ونشر النماذج بسلاسة. المستندات شاملة، ومحدثة باستمرار، ومدعومة من قبل مجتمع ضخم عالمي مفتوح المصدر.

تعدد الاستخدامات عبر المهام

بينما يعد PP-YOLOE+ كاشف أجسام متخصص، يسمح نظام Ultralytics البيئي للمستخدمين بمعالجة مهام رؤية حاسوبية متعددة تحت واجهة برمجة تطبيقات واحدة موحدة. مع YOLOv5 وخلفائه، يمكنك الانتقال دون عناء من صناديق الإحاطة القياسية إلى تجزئة الصور وسير عمل التصنيف.

مثال على الكود: تدريب YOLOv5

لا يتطلب البدء سوى بضعة أسطر من الكود. هذه البساطة تسرع بشكل كبير دورات البحث والتطوير.

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

حالات الاستخدام الواقعية

متى تختار PP-YOLOE+: إذا كانت مؤسستك متجذرة بعمق ضمن حزمة برامج Baidu أو تعتمد بشكل كبير على أجهزة متخصصة تفرض استخدام إطار عمل PaddlePaddle، فإن PP-YOLOE+ هو خيار قوي. يُستخدم بشكل متكرر في خطوط الإنتاج المتخصصة في جميع أنحاء آسيا حيث يوجد تكامل قديم مع Paddle.

متى تختار YOLOv5: بالنسبة للغالبية العظمى من المطورين والباحثين والشركات الدولية، يظل YOLOv5 قوة جبارة. تعني جذوره في PyTorch أنه متوافق فوراً مع أدوات مثل Weights & Biases للتتبع، كما أنه يصدر بشكل نظيف إلى TensorRT لتسريع GPU الخاص بـ NVIDIA أو CoreML لأجهزة Apple. إنه يتفوق في مجالات متنوعة تتراوح من مراقبة المحاصيل الزراعية إلى ملاحة الطائرات بدون طيار عالية السرعة.

مستقبل الكشف: Ultralytics YOLO26

بينما يعد YOLOv5 نموذجاً أيقونياً، إلا أن حدود رؤية الحاسوب قد تقدمت. بالنسبة لجميع التطورات الجديدة، نوصي بشدة بالانتقال إلى YOLO26، الذي تم إصداره في يناير 2026. يتوفر YOLO26 بسلاسة عبر منصة Ultralytics، ويعيد تعريف الكفاءة تماماً.

اعرف المزيد عن YOLO26

الابتكارات الرئيسية في YOLO26:

  • تصميم من طرف إلى طرف خالٍ من NMS: يلغي YOLO26 معالجة ما بعد الكشف NMS بالكامل. هذا يقلل من تباين زمن الاستجابة ويبسط خط أنابيب النشر بشكل كبير.
  • سرعة استنتاج على CPU أسرع بنسبة تصل إلى 43%: من خلال الإزالة الاستراتيجية لـ Distribution Focal Loss (DFL)، يزيد YOLO26 السرعة بشكل كبير على أجهزة الحافة بدون GPUs.
  • مُحسِّن MuSGD: مستوحى من النماذج اللغوية الكبيرة الرائدة، يعمل هذا المُحسِّن الهجين على استقرار ديناميكيات التدريب ويسمح بتقارب أسرع بكثير في مجموعات البيانات المخصصة.
  • تحسينات خاصة بالمهمة: يتميز بوظائف خسارة متقدمة مثل ProgLoss و STAL، مما يحقق دقة غير مسبوقة في الأجسام الصغيرة. كما يدعم بشكل أصلي الكشف عن صندوق الإحاطة الموجه (OBB) للصور الجوية.

إذا كنت تستكشف نماذج الرؤية المتطورة، فقد تكون مهتماً أيضاً بمقارنة الجيل السابق YOLO11 أو الأساليب القائمة على Transformer مثل RT-DETR. في النهاية، يعزز النظام البيئي القوي، جنباً إلى جنب مع التطورات المعمارية المتطورة، مكانة Ultralytics كخيار أول لمهام رؤية الحاسوب الحديثة.

تعليقات