YOLOv7 مقابل PP-YOLOE+: مقارنة شاملة لأجهزة الكشف في الوقت الفعلي

عند تقييم نماذج الرؤية الحاسوبية المتطورة لخطوط إنتاج العمليات، غالبًا ما يوازن المطورون بين مزايا البنى المختلفة. اثنان من النماذج البارزة في مشهد اكتشاف الأجسام هما YOLOv7 و PP-YOLOE+. يقدم هذا الدليل مقارنة فنية مفصلة لهياكلها، ومقاييس أدائها، وسيناريوهات النشر المثالية لمساعدتك في اتخاذ قرار مستنير لمشروع الرؤية الحاسوبية التالي.

الابتكارات المعمارية

يعد فهم الاختلافات الهيكلية الأساسية بين هذه النماذج أمراً بالغ الأهمية للتنبؤ بكيفية تصرفها أثناء التدريب والاستدلال.

أبرز مميزات بنية YOLOv7

قدمت YOLOv7 العديد من التحسينات الرئيسية المصممة لزيادة الدقة دون زيادة تكاليف الاستدلال بشكل كبير.

  • شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN): تتحكم هذه البنية في أقصر وأطول مسارات التدرج. ومن خلال القيام بذلك، فإنها تمكن الشبكة من تعلم ميزات أكثر تنوعاً وتحسن قدرة التعلم الشاملة دون تدمير مسار التدرج الأصلي.
  • استراتيجيات تحجيم النماذج: تستخدم YOLOv7 تحجيماً مركباً للنماذج، حيث يتم ضبط العمق والعرض في وقت واحد مع دمج الطبقات للحفاظ على بنية مثالية عبر الأحجام المختلفة.
  • مجموعة التدريب المجانية القابلة للتدريب (Trainable Bag-of-Freebies): قام المؤلفون بدمج طريقة التفاف مُعاد معاملتها (RepConv) بدون روابط هوية، مما يعزز سرعة الاستدلال بشكل كبير دون المساس بقوة التنبؤ للنموذج.

تفاصيل YOLOv7:
المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، Academia Sinica، تايوان
التاريخ: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696

اعرف المزيد عن YOLOv7

أبرز مميزات بنية PP-YOLOE+

تعتمد PP-YOLOE+، التي طورها فريق Baidu ضمن نظام PaddlePaddle البيئي، على سابقتها PP-YOLOv2، مع تركيز مكثف على المنهجيات الخالية من المثبتات (anchor-free) وتمثيلات الميزات المحسنة.

  • تصميم خالٍ من المثبتات (Anchor-Free): على عكس النهج القائمة على المثبتات، يعمل هذا التصميم على تبسيط رأس التنبؤ وتقليل عدد المعلمات الفائقة، مما يجعل النموذج أسهل في الضبط لمجموعات البيانات المخصصة.
  • العمود الفقري CSPRepResNet: يدمج هذا العمود الفقري روابط متبقية وشبكات جزئية عبر المراحل لتحسين قدرات استخراج الميزات مع الحفاظ على الكفاءة الحسابية.
  • تعلم محاذاة المهام (TAL): تستخدم PP-YOLOE+ رأس ET-head (رأس محاذاة المهام الفعال) لمحاذاة مهام التصنيف والتوطين بشكل أفضل، مما يعالج عنق الزجاجة الشائع في أجهزة الكشف أحادية المرحلة.

تفاصيل PP-YOLOE+:
المؤلفون: مؤلفو PaddlePaddle
المنظمة: Baidu
التاريخ: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250

تعرف على المزيد حول PP-YOLOE+

مقاييس الأداء والمعايير

يعتمد اختيار النموذج الصحيح غالباً على قيود محددة لأجهزتك ومتطلبات زمن الاستجابة. يوضح الجدول أدناه المفاضلات بين الدقة (mAP)، والسرعة، وتعقيد النموذج.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

تحليل النتائج

  • سيناريوهات الدقة العالية: يُظهر نموذج YOLOv7x أداءً قوياً، حيث يحقق mAP عالياً يجعله منافساً لمهام الكشف المعقدة. وفي حين أن PP-YOLOE+x يتدرج بشكل أعلى قليلاً في mAP، إلا أنه يفعل ذلك مع زيادة كبيرة في المعلمات و FLOPs.
  • الكفاءة والسرعة: توفر المتغيرات الأصغر من PP-YOLOE+ (t و s) سرعات استدلال منخفضة للغاية باستخدام TensorRT، مما يجعلها مناسبة جداً لعمليات النشر عند الحافة (edge) حيث تكون قيود الأجهزة صارمة.
  • النقطة المثالية: يوفر YOLOv7l توازناً مقنعاً، حيث يقدم أكثر من 51% mAP مع الحفاظ على زمن استدلال أقل من 7 مللي ثانية على وحدات معالجة الرسومات T4، مما يجعله خياراً قوياً لتطبيقات الخادم القياسية في الوقت الفعلي.
التحسين للإنتاج

عند نشر هذه النماذج، يمكن أن يؤدي الاستفادة من تنسيقات التصدير مثل TensorRT أو ONNX إلى تقليل زمن الاستجابة بشكل كبير مقارنة باستدلال PyTorch الأصلي.

ميزة Ultralytics

بينما توفر كل من YOLOv7 و PP-YOLOE+ أداءً مرجعياً قوياً، فإن تجربة التطوير ودعم النظام البيئي لها نفس القدر من الأهمية لنجاح المشروع.

تجربة مستخدم مبسطة

تضع نماذج Ultralytics الأولوية لـ سهولة الاستخدام من خلال واجهة برمجة تطبيقات Python موحدة. على عكس PP-YOLOE+، الذي يتطلب التنقل في نظام PaddlePaddle البيئي وملفات التكوين الخاصة به، تتيح لك Ultralytics الانتقال من التدريب إلى النشر بسلاسة.

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolov7.pt")

# Train the model effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export for optimized deployment
model.export(format="engine")  # TensorRT export

كفاءة الموارد

تتمثل إحدى نقاط القوة الرئيسية لنماذج Ultralytics YOLO في انخفاض متطلبات الذاكرة أثناء التدريب والاستدلال. تسمح هذه الكفاءة للباحثين والمطورين باستخدام أحجام دفعات (batch sizes) أكبر على الأجهزة الاستهلاكية، مما يسرع عملية التدريب مقارنة بالنماذج الأثقل أو بنيات Transformer المعقدة مثل RT-DETR.

النظام البيئي وتعدد الاستخدامات

يتمتع نظام Ultralytics البيئي بكونه مُصاناً جيداً بشكل استثنائي، حيث يتميز بتحديثات متكررة، ووثائق شاملة، ودعم أصلي لمهام متنوعة تتجاوز الكشف القياسي. مع Ultralytics، يدعم إطار عمل واحد تجزئة المثيلات، وتقدير الوضع، والتصنيف، وصناديق التحديد الموجهة (OBB)، مما يوفر تعدد استخدامات لا مثيل له تفتقر إليه النماذج المنافسة غالباً.

مستقبل الرؤية بالذكاء الاصطناعي: YOLO26

مع التطور السريع للرؤية الحاسوبية، ظهرت بنيات أحدث تعيد تعريف معايير السرعة والكفاءة. يمثل Ultralytics YOLO26، الذي تم إصداره في يناير 2026، ذروة هذا التطور وهو الخيار الموصى به بشدة لجميع المشاريع الجديدة.

ابتكارات YOLO26 الرئيسية:

  • تصميم نهائي متكامل بدون NMS: تلغي YOLO26 المعالجة اللاحقة لقمع غير الأقصى (NMS). يبسط هذا النهج المتكامل أصلاً منطق النشر بشكل كبير ويقلل من زمن الاستجابة المتغير، وهو إنجاز تم تقديمه لأول مرة في YOLOv10.
  • أداء غير مسبوق عند الحافة: من خلال إزالة خسارة بؤرة التوزيع (DFL)، تحقق YOLO26 استدلالاً على وحدة المعالجة المركزية (CPU) أسرع بنسبة تصل إلى 43%، مما يجعلها متفوقة على الأجيال السابقة لأجهزة IoT وأجهزة الحافة.
  • ديناميكيات تدريب متقدمة: يضمن دمج محسن MuSGD—المستوحى من ابتكارات LLM مثل Kimi K2 من Moonshot AI—تدريباً أكثر استقراراً وتقارباً أسرع.
  • اكتشاف فائق للأجسام الصغيرة: تعالج وظائف الخسارة المحسنة، وتحديداً ProgLoss + STAL، نقاط الضعف التاريخية في التعرف على الأجسام الصغيرة، وهو أمر حيوي لتطبيقات مثل التصوير الجوي.

تطبيقات العالم الحقيقي

يعتمد الاختيار بين هذه البنيات غالباً على بيئة النشر المحددة.

متى تختار PP-YOLOE+

  • تكامل PaddlePaddle: إذا كانت بنيتك التحتية مدمجة بالفعل بشكل عميق مع نظام Baidu PaddlePaddle، فإن PP-YOLOE+ يوفر توافقاً أصلياً.
  • التفتيش الصناعي في آسيا: يُستخدم غالباً في مراكز التصنيع الآسيوية حيث يتم تهيئة مكدسات الأجهزة والبرامج مسبقاً لأدوات Baidu.

متى تختار YOLOv7

  • أنظمة معجلة بواسطة GPU: تعمل بشكل استثنائي جيد على وحدات معالجة الرسومات بمستوى الخوادم للمهام التي تتطلب إنتاجية عالية، مثل تحليلات الفيديو.
  • تكامل الروبوتات: مثالية لـ دمج الرؤية الحاسوبية في الروبوتات، مما يسمح باتخاذ قرارات سريعة في البيئات الديناميكية.
  • البحث الأكاديمي: مدعومة على نطاق واسع وتُستخدم بشكل متكرر كخط أساس موثوق في الأبحاث القائمة على PyTorch.

في حين أن النماذج الأقدم تحمل أهمية تاريخية، فإن الانتقال إلى البنيات الحديثة مثل YOLO26 أو YOLO11 عبر منصة Ultralytics يضمن الوصول إلى أحدث التحسينات، وأبسط سير عمل للتدريب، وأوسع دعم للمهام المتعددة المتاح اليوم.

التعليقات