تخطي إلى المحتوى

PP-YOLOE+ مقابل YOLOv7: استكشاف بنى الكشف عن الأجسام في الوقت الفعلي

عند إنشاء خطوط أنابيب للرؤية الحاسوبية، يعد اختيار نموذج الكشف عن الكائنات المناسب أمرًا بالغ الأهمية. قدمت بنيةان مهمتان من عام 2022، وهما PP-YOLOE+ و YOLOv7 تطورات قوية في الكشف عن الكائنات في الوقت الفعلي. توفر هذه المقارنة الفنية نظرة متعمقة على بنيتيهما ومنهجيات التدريب والأداء في العالم الواقعي لمساعدتك في اتخاذ قرارات مستنيرة لتطبيقاتك.

نظرة عامة على النماذج

تم تصميم كل من PP-YOLOE+ وYOLOv7 لدفع حدود الدقة والسرعة، لكنهما ينبعان من أنظمة بيئية تطويرية وفلسفات تصميم مختلفة.

PP-YOLOE+

تم تطوير PP-YOLOE+ بواسطة PaddlePaddle في Baidu، وهو يعتمد على PP-YOLOv2 الأصلي. تم تقديمه لتوفير كاشف كائنات فعال وعالي الدقة ومُحسّن لنظام PaddlePaddle .

تعرف على المزيد حول PP-YOLOE+

YOLOv7

تم تطوير YOLOv7 بواسطة Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao، YOLOv7 "trainable bag-of-freebies" لتضع معايير جديدة متطورة لأجهزة الكشف عن الأجسام في الوقت الفعلي عند إصدارها.

  • المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
  • المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
  • التاريخ: 2022-07-06
  • أرشيف:2207.02696
  • GitHub:مستودع YOLOv7
  • الوثائق:وثائق Ultralytics YOLOv7

تعرف على المزيد حول YOLOv7

الابتكارات المعمارية

بنية PP-YOLOE+

يعتمد PP-YOLOE+ بشكل كبير على نموذج بدون مرساة، مما يجعل عملية النشر أبسط من خلال التخلص من الحاجة إلى ضبط مربعات المرساة لمجموعات البيانات المخصصة. وهو يشتمل على هيكل RepResNet قوي وشبكة PAN (شبكة تجميع المسارات) على غرار CSPNet من أجل دمج فعال للميزات متعددة النطاقات. بالإضافة إلى ذلك، فإنه يستفيد من مفهوم تعلم محاذاة المهام (TAL) لمحاذاة مهام التصنيف والتوطين ديناميكيًا أثناء التدريب، مما يضمن دقة عالية عبر مختلف مهام الرؤية الحاسوبية.

هندسة YOLOv7 المعمارية

YOLOv7 نهجًا مختلفًا من خلال إدخال شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN). تسمح هذه البنية للشبكة بتعلم ميزات أكثر تنوعًا دون تدمير مسار التدرج الأصلي، مما يؤدي إلى تقارب أفضل. YOLOv7 يستخدم YOLOv7 بشكل مكثف إعادة معايرة النموذج — على وجه التحديد، التلافيف المعايرة المخطط لها — التي تدمج الطبقات التلافيفية أثناء الاستدلال لتسريع التنفيذ دون التضحية بالدقة. وهذا يجعل YOLOv7 قويًا YOLOv7 في مهام مثل تتبع الكائنات المتعددة وأنظمة الإنذار الأمنية المعقدة.

الاختلافات في النظم البيئية

بينما يتكامل PP-YOLOE+ بشكل وثيق مع PaddlePaddle من Baidu، YOLOv7 إنشاء YOLOv7 في PyTorch، الذي يوفر تاريخياً مجتمعاً أكبر وتوافقاً أوسع نطاقاً مع خطوط أنابيب النشر مثل ONNX و TensorRT.

تحليل الأداء

عند الموازنة بين السرعة والمعلمات والدقة (mAP)، تتبادل النماذج الضربات اعتمادًا على المتغير المحدد والأجهزة المستهدفة. فيما يلي مقارنة شاملة لمقاييسها.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

بينما يحقق نموذج PP-YOLOE+x معدل دقة متوسط ( mAP أعلى قليلاً، توفر YOLOv7 نسبة قوية جداً بين المعلمات والدقة. تظل YOLOv7 المفضلة للبيانات الأولية GPU حيث يوفر TensorRT زمن انتقال منخفضًا للغاية.

ميزة Ultralytics

عند تدريب ونشر هذه النماذج، فإن الإطار الذي تختاره لا يقل أهمية عن النموذج نفسه. Ultralytics استخدام Ultralytics تجربة مستخدم مبسطة بفضل Python موحدة للغاية تعمل على تبسيط دورة حياة التعلم الآلي بأكملها.

  • نظام بيئي يتم صيانته جيدًا: تستفيد نماذج Ultralytics YOLO من نظام بيئي محدث باستمرار، ووثائق قوية، ومجتمع نشط.
  • متطلبات الذاكرة: تقوم Ultralytics بتحسين تحميل البيانات وأنظمة التدريب بشكل كبير. يتطلب تدريب نماذج Ultralytics YOLO عادةً ذاكرة CUDA أقل بكثير مقارنة بالبنى المعمارية الثقيلة القائمة على المحولات (transformers)، مما يسمح للمطورين باستخدام أحجام دفعات أكبر على الأجهزة الاستهلاكية.
  • كفاءة التدريب: بالاستفادة من استراتيجيات تعزيز البيانات القوية والضبط المدمج للمعاملات الفائقة، تضمن Ultralytics تقارب النماذج بسرعة مع الأوزان المدربة مسبقًا المتاحة بسهولة.

تنفيذ واجهة برمجة تطبيقات بسيطة

Ultralytics تدريب YOLOv7 باستخدام Ultralytics سوى بضع أسطر من التعليمات البرمجية، مما يؤدي إلى تجريد البرامج النصية المعقدة للتدريب من مضمونها تمامًا:

from ultralytics import YOLO

# Load a pretrained YOLOv7 model
model = YOLO("yolov7.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to TensorRT for deployment
model.export(format="engine", device=0)

المعيار الجديد: تقديم YOLO26

في حين أن PP-YOLOE+ و YOLOv7 علامات فارقة في مجال الكشف عن الأجسام، فإن مجال الذكاء الاصطناعي يتطور بسرعة. بالنسبة لأي مشروع جديد في مجال الرؤية الحاسوبية، نوصي بشدة Ultralytics . تم إصدار YOLO26 في يناير 2026، وهو يمثل قفزة هائلة إلى الأمام في مجال الذكاء الاصطناعي للرؤية الحاسوبية.

لماذا يتفوق YOLO26 على البنى القديمة:

  • تصميم شامل بدون NMS: يتميز YOLO26 بتصميم شامل بطبيعته. من خلال إلغاء المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، فإنه يضمن زمن استجابة استدلال يمكن التنبؤ به ومحدد، وهو إنجاز شوهد لأول مرة في YOLOv10.
  • إزالة DFL: تبسط إزالة Distribution Focal Loss عملية التصدير وتحسن بشكل كبير التوافق مع الأجهزة الطرفية منخفضة الطاقة.
  • سرعة استدلال أسرع بنسبة تصل إلى 43% على الـ CPU: للسيناريوهات التي تفتقر إلى وحدات GPU مخصصة—مثل مستشعرات إنترنت الأشياء للمدن الذكية—تم تحسين YOLO26 بشكل كبير للعمل بكفاءة مباشرة على وحدات CPU.
  • مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغات الكبيرة (LLM) المتقدمة (مثل Kimi K2 من Moonshot AI)، يستخدم YOLO26 هجينًا من SGD و Muon لتحقيق تدريب مستقر بشكل لا يصدق وتقارب سريع.
  • ProgLoss + STAL: تحقق دوال الخسارة المحسّنة هذه مكاسب ملحوظة في detect الأجسام الصغيرة، وهو أمر حيوي لحالات الاستخدام مثل الصور الجوية للطائرات بدون طيار وdetect عيوب التصنيع.

تعرف على المزيد حول YOLO26

حالات الاستخدام المثالية وسيناريوهات النشر

متى تستخدم PP-YOLOE+

يتميز PP-YOLOE+ بأدائه المتميز عندما تكون متجذرًا بعمق في نظامي Baidu و PaddlePaddle . إذا كان هدف النشر الخاص بك يستخدم أجهزة متخصصة مصممة خصيصًا لنماذج Paddle (على سبيل المثال، في بعض خطوط الإنتاج الآسيوية)، فإن PP-YOLOE+ يوفر دقة ممتازة وتكاملًا سلسًا. وهو فعال للغاية في أتمتة التصنيع الصناعي.

متى تستخدم YOLOv7

YOLOv7 خيارًا ممتازًا للاستدلال العام عالي الأداء، لا سيما عند النشر على NVIDIA باستخدام TensorRT. إن دمجه في نظام PyTorch يجعله متعدد الاستخدامات للغاية في مجال البحث الأكاديمي والخطوط التجارية المخصصة، مثل إدارة الحشود في الوقت الفعلي أو مهام تقدير الوضع المعقدة حيث تكون سلامة الشبكة الهيكلية أمرًا بالغ الأهمية.

نماذج أخرى يجب أخذها في الاعتبار

بناءً على احتياجاتك الدقيقة، قد تكون مهتمًا أيضًا بمقارنة هذه البنى المعمارية بـ YOLO11 لمرونة واسعة وجاهزة للإنتاج، أو RT-DETR إذا كان مشروعك يتطلب المزايا المحددة لمُحوّلات الرؤية على الشبكات التلافيفية التقليدية.

الخلاصة

قدم كل من PP-YOLOE+ وYOLOv7 تحسينات كبيرة لعالم اكتشاف الكائنات في الوقت الفعلي. بينما يتفوق PP-YOLOE+ في البيئات الموحدة حول PaddlePaddle، يقدم YOLOv7 مرونة وأداءً لا يصدقان عبر أنظمة PyTorch وUltralytics البيئية.

ومع ذلك، مع استمرار تقدم حلول الرؤية الحاسوبية، أصبح استخدام الأدوات الحديثة أمراً ضرورياً. من خلال اعتماد Ultralytics وبنيات الجيل التالي مثل YOLO26، يمكن للمطورين ضمان بقاء تطبيقاتهم في طليعة السرعة والدقة وسهولة الاستخدام.


تعليقات