تخطي إلى المحتوى

PP-YOLOE+ مقابل YOLOv7: استكشاف بنى الكشف عن الأجسام في الوقت الفعلي

عند إنشاء خطوط أنابيب للرؤية الحاسوبية، يعد اختيار نموذج الكشف عن الكائنات المناسب أمرًا بالغ الأهمية. قدمت بنيةان مهمتان من عام 2022، وهما PP-YOLOE+ و YOLOv7 تطورات قوية في الكشف عن الكائنات في الوقت الفعلي. توفر هذه المقارنة الفنية نظرة متعمقة على بنيتيهما ومنهجيات التدريب والأداء في العالم الواقعي لمساعدتك في اتخاذ قرارات مستنيرة لتطبيقاتك.

نظرة عامة على النماذج

YOLOv7 تصميم كل من PP-YOLOE+ و YOLOv7 لتجاوز حدود الدقة والسرعة، ولكنهما ينبعان من أنظمة تطوير وفلسفات تصميم مختلفة.

PP-YOLOE+

تم تطوير PP-YOLOE+ بواسطة PaddlePaddle في Baidu، وهو يعتمد على PP-YOLOv2 الأصلي. تم تقديمه لتوفير كاشف كائنات فعال وعالي الدقة ومُحسّن لنظام PaddlePaddle .

تعرف على المزيد حول PP-YOLOE+

YOLOv7

تم تطوير YOLOv7 بواسطة Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao، YOLOv7 "trainable bag-of-freebies" لتضع معايير جديدة متطورة لأجهزة الكشف عن الأجسام في الوقت الفعلي عند إصدارها.

  • المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
  • المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
  • التاريخ: 2022-07-06
  • أرشيف:2207.02696
  • GitHub:مستودع YOLOv7
  • المستندات:YOLOv7 Ultralytics YOLOv7

تعرف على المزيد حول YOLOv7

الابتكارات المعمارية

بنية PP-YOLOE+

يعتمد PP-YOLOE+ بشكل كبير على نموذج بدون مرساة، مما يجعل عملية النشر أبسط من خلال التخلص من الحاجة إلى ضبط مربعات المرساة لمجموعات البيانات المخصصة. وهو يشتمل على هيكل RepResNet قوي وشبكة PAN (شبكة تجميع المسارات) على غرار CSPNet من أجل دمج فعال للميزات متعددة النطاقات. بالإضافة إلى ذلك، فإنه يستفيد من مفهوم تعلم محاذاة المهام (TAL) لمحاذاة مهام التصنيف والتوطين ديناميكيًا أثناء التدريب، مما يضمن دقة عالية عبر مختلف مهام الرؤية الحاسوبية.

هندسة YOLOv7 المعمارية

YOLOv7 نهجًا مختلفًا من خلال إدخال شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN). تسمح هذه البنية للشبكة بتعلم ميزات أكثر تنوعًا دون تدمير مسار التدرج الأصلي، مما يؤدي إلى تقارب أفضل. YOLOv7 يستخدم YOLOv7 بشكل مكثف إعادة معايرة النموذج — على وجه التحديد، التلافيف المعايرة المخطط لها — التي تدمج الطبقات التلافيفية أثناء الاستدلال لتسريع التنفيذ دون التضحية بالدقة. وهذا يجعل YOLOv7 قويًا YOLOv7 في مهام مثل تتبع الكائنات المتعددة وأنظمة الإنذار الأمنية المعقدة.

الاختلافات في النظم البيئية

بينما يتكامل PP-YOLOE+ بشكل وثيق مع PaddlePaddle من Baidu، YOLOv7 إنشاء YOLOv7 في PyTorch، الذي يوفر تاريخياً مجتمعاً أكبر وتوافقاً أوسع نطاقاً مع خطوط أنابيب النشر مثل ONNX و TensorRT.

تحليل الأداء

عند الموازنة بين السرعة والمعلمات والدقة (mAP)، تتبادل النماذج الضربات اعتمادًا على المتغير المحدد والأجهزة المستهدفة. فيما يلي مقارنة شاملة لمقاييسها.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

بينما يحقق نموذج PP-YOLOE+x معدل دقة متوسط ( mAP أعلى قليلاً، توفر YOLOv7 نسبة قوية جداً بين المعلمات والدقة. تظل YOLOv7 المفضلة للبيانات الأولية GPU حيث يوفر TensorRT زمن انتقال منخفضًا للغاية.

ميزة Ultralytics

عند تدريب ونشر هذه النماذج، فإن الإطار الذي تختاره لا يقل أهمية عن النموذج نفسه. Ultralytics استخدام Ultralytics تجربة مستخدم مبسطة بفضل Python موحدة للغاية تعمل على تبسيط دورة حياة التعلم الآلي بأكملها.

  • نظام بيئي جيد الصيانة: تستفيدYOLO Ultralytics YOLO من نظام بيئي يتم تحديثه باستمرار، ووثائق قوية، ومجتمع نشط.
  • متطلبات الذاكرة: تعمل Ultralytics على تحسين عمليات تحميل البيانات وأنظمة التدريب Ultralytics . يتطلب تدريبYOLO Ultralytics YOLO عادةً CUDA أقل بكثير مقارنة بالبنى القائمة على المحولات الثقيلة، مما يسمح للمطورين باستخدام أحجام دفعات أكبر على الأجهزة الاستهلاكية.
  • كفاءة التدريب: من خلال الاستفادة من استراتيجيات تعزيز البيانات القوية وضبط المعلمات الفائقة المدمجة، Ultralytics تقارب النماذج بسرعة مع الأوزان المعدة مسبقًا والمتاحة بسهولة.

تنفيذ واجهة برمجة تطبيقات بسيطة

Ultralytics تدريب YOLOv7 باستخدام Ultralytics سوى بضع أسطر من التعليمات البرمجية، مما يؤدي إلى تجريد البرامج النصية المعقدة للتدريب من مضمونها تمامًا:

from ultralytics import YOLO

# Load a pretrained YOLOv7 model
model = YOLO("yolov7.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to TensorRT for deployment
model.export(format="engine", device=0)

المعيار الجديد: تقديم YOLO26

في حين أن PP-YOLOE+ و YOLOv7 علامات فارقة في مجال الكشف عن الأجسام، فإن مجال الذكاء الاصطناعي يتطور بسرعة. بالنسبة لأي مشروع جديد في مجال الرؤية الحاسوبية، نوصي بشدة Ultralytics . تم إصدار YOLO26 في يناير 2026، وهو يمثل قفزة هائلة إلى الأمام في مجال الذكاء الاصطناعي للرؤية الحاسوبية.

لماذا يتفوق YOLO26 على البنى القديمة:

  • تصميم شامل NMS: YOLO26 هو تصميم شامل بطبيعته. من خلال التخلص من المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، فإنه يضمن زمن استدلال قابل للتنبؤ وحتمي — وهو إنجاز رائد ظهر لأول مرة في YOLOv10.
  • إزالة DFL: تعمل إزالة فقدان بؤرة التوزيع على تبسيط عملية التصدير وتحسين التوافق بشكل كبير للأجهزة الطرفية منخفضة الطاقة.
  • CPU أسرع بنسبة تصل إلى 43٪ CPU : بالنسبة للسيناريوهات التي تفتقر إلى وحدات معالجة رسومات مخصصة — مثل أجهزة استشعار إنترنت الأشياء في المدن الذكية— تم تحسين YOLO26 بشكل كبير ليعمل بكفاءة مباشرة على وحدات المعالجة المركزية.
  • MuSGD Optimizer: مستوحى من تقنيات التدريب المتقدمة LLM (مثل Moonshot AI's Kimi K2)، يستخدم YOLO26 مزيجًا من SGD Muon لتدريب مستقر للغاية وتقارب سريع.
  • ProgLoss + STAL: توفر وظائف الخسارة المحسّنة هذه مكاسب ملحوظة في اكتشاف الأجسام الصغيرة، وهو أمر بالغ الأهمية في حالات الاستخدام مثل التصوير الجوي بالطائرات بدون طيار واكتشاف عيوب التصنيع.

تعرف على المزيد حول YOLO26

حالات الاستخدام المثالية وسيناريوهات النشر

متى تستخدم PP-YOLOE+

يتميز PP-YOLOE+ بأدائه المتميز عندما تكون متجذرًا بعمق في نظامي Baidu و PaddlePaddle . إذا كان هدف النشر الخاص بك يستخدم أجهزة متخصصة مصممة خصيصًا لنماذج Paddle (على سبيل المثال، في بعض خطوط الإنتاج الآسيوية)، فإن PP-YOLOE+ يوفر دقة ممتازة وتكاملًا سلسًا. وهو فعال للغاية في أتمتة التصنيع الصناعي.

متى تستخدم YOLOv7

YOLOv7 خيارًا ممتازًا للاستدلال العام عالي الأداء، لا سيما عند النشر على NVIDIA باستخدام TensorRT. إن دمجه في نظام PyTorch يجعله متعدد الاستخدامات للغاية في مجال البحث الأكاديمي والخطوط التجارية المخصصة، مثل إدارة الحشود في الوقت الفعلي أو مهام تقدير الوضع المعقدة حيث تكون سلامة الشبكة الهيكلية أمرًا بالغ الأهمية.

نماذج أخرى يجب أخذها في الاعتبار

بناءً على احتياجاتك المحددة، قد تكون مهتمًا أيضًا بمقارنة هذه البنى مع YOLO11 للحصول على مرونة واسعة وجاهزة للإنتاج، أو RT-DETR إذا كان مشروعك يتطلب مزايا محددة لمحولات الرؤية مقارنة بالشبكات التلافيفية التقليدية.

الخلاصة

YOLOv7 كل من PP-YOLOE+ و YOLOv7 تحسينات كبيرة في عالم الكشف عن الكائنات في الوقت الفعلي. في حين يتفوق PP-YOLOE+ في البيئات الموحدة حول PaddlePaddle YOLOv7 مرونة وأداء مذهلين عبر Ultralytics PyTorch Ultralytics .

ومع ذلك، مع استمرار تقدم حلول الرؤية الحاسوبية، أصبح استخدام الأدوات الحديثة أمراً ضرورياً. من خلال اعتماد Ultralytics وبنيات الجيل التالي مثل YOLO26، يمكن للمطورين ضمان بقاء تطبيقاتهم في طليعة السرعة والدقة وسهولة الاستخدام.


تعليقات