YOLOv7 PP-YOLOE+: مقارنة شاملة بين أجهزة الكشف في الوقت الحقيقي
عند تقييم أحدث نماذج الرؤية الحاسوبية لخطوط الإنتاج، غالبًا ما يوازن المطورون بين مزايا البنى المختلفة. هناك نموذجان بارزان في مجال اكتشاف الأجسام هما YOLOv7 و PP-YOLOE+. يقدم هذا الدليل مقارنة تقنية مفصلة بين هندستهما ومقاييس أدائهما وسيناريوهات النشر المثالية لمساعدتك في اتخاذ قرار مستنير بشأن مشروع الرؤية الحاسوبية التالي.
الابتكارات المعمارية
إن فهم الاختلافات الهيكلية الأساسية بين هذه النماذج أمر بالغ الأهمية للتنبؤ بكيفية تصرفها أثناء التدريب والاستدلال.
أهم ميزات YOLOv7
YOLOv7 العديد من التحسينات الرئيسية المصممة لتحسين الدقة دون زيادة تكاليف الاستدلال بشكل كبير.
- شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN): تتحكم هذه البنية في أقصر وأطول مسارات التدرج. وبذلك، فإنها تمكّن الشبكة من تعلم ميزات أكثر تنوعًا وتحسن القدرة الإجمالية على التعلم دون تدمير مسار التدرج الأصلي.
- استراتيجيات تحجيم النموذج: YOLOv7 تحجيم النموذج المركب، حيث يقوم بضبط العمق والعرض في وقت واحد مع ربط الطبقات للحفاظ على بنية هندسية مثالية عبر أحجام مختلفة.
- حقيبة هدايا قابلة للتدريب: قام المؤلفون بدمج طريقة التحويل المُعاد معايرتها (RepConv) بدون اتصالات هوية، مما يعزز سرعة الاستدلال بشكل كبير دون المساس بقدرة النموذج على التنبؤ.
YOLOv7 :
المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان
التاريخ: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
أبرز ملامح هندسة PP-YOLOE+
تم تطوير PP-YOLOE+ بواسطة Baidu ضمن PaddlePaddle وهو يعتمد على سابقه PP-YOLOv2، مع التركيز بشكل كبير على المنهجيات الخالية من المراسي وتمثيلات الميزات المحسّنة.
- تصميم بدون مرساة: على عكس الأساليب القائمة على المرساة، يبسط هذا التصميم رأس التنبؤ ويقلل من عدد المعلمات الفائقة، مما يجعل النموذج أسهل في الضبط لمجموعات البيانات المخصصة.
- الهيكل الأساسي CSPRepResNet: يشتمل هذا الهيكل الأساسي على اتصالات متبقية وشبكات جزئية عبر المراحل لتحسين قدرات استخراج الميزات مع الحفاظ على الكفاءة الحسابية.
- تعلم مواءمة المهام (TAL): يستخدم PP-YOLOE+ ET-head (رأس فعال وموائم للمهام) لتحسين مواءمة مهام التصنيف والتحديد المكاني، مما يعالج أحد العوائق الشائعة في أجهزة الكشف أحادية المرحلة.
تفاصيل PP-YOLOE+:
المؤلفون: PaddlePaddle
المنظمة: Baidu
التاريخ: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250
مقاييس ومعايير الأداء
غالبًا ما يعتمد اختيار النموذج المناسب على القيود المحددة لأجهزتك ومتطلبات زمن الاستجابة. يوضح الجدول أدناه المفاضلة بين الدقة (mAP) والسرعة وتعقيد النموذج.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
تحليل النتائج
- سيناريوهات الدقة العالية: يُظهر YOLOv7x أداءً قويًا، mAP يحقق معدل mAP مرتفعًا mAP في مهام الكشف المعقدة. في حين أن PP-YOLOE+x يحقق معدل mAP أعلى قليلاً، إلا أنه يفعل ذلك مع زيادة كبيرة في المعلمات وعمليات FLOP.
- الكفاءة والسرعة: توفر الإصدارات الأصغر حجماً من PP-YOLOE+ (t و s) TensorRT منخفضة للغاية، مما يجعلها مناسبة للغاية لعمليات النشر الطرفية حيث تكون قيود الأجهزة صارمة.
- النقطة المثالية: يوفر YOLOv7l توازناً مقنعاً، حيث يقدم أكثر من 51٪ mAP الحفاظ على وقت استدلال أقل من 7 مللي ثانية على وحدات معالجة الرسومات T4، مما يجعله خياراً قوياً لتطبيقات الخادم القياسية في الوقت الفعلي.
التحسين من أجل الإنتاج
عند نشر هذه النماذج، يمكن الاستفادة من تنسيقات التصدير مثل TensorRT أو ONNX يمكن أن يقلل بشكل كبير من زمن الاستجابة مقارنة PyTorch الأصلي PyTorch .
ميزة Ultralytics
في حين أن كلا من YOLOv7 PP-YOLOE+ يقدمان أداءً قوياً في المعايير المرجعية، فإن تجربة التطوير ودعم النظام البيئي لا يقلان أهمية عنهما في نجاح المشروع.
تجربة مستخدم مبسطة
تمنح Ultralytics الأولوية لسهولة الاستخدام من خلال Python موحدة. على عكس PP-YOLOE+، الذي يتطلب التنقل في PaddlePaddle وملفات التكوين الخاصة به، Ultralytics لك Ultralytics الانتقال من التدريب إلى النشر بسلاسة.
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolov7.pt")
# Train the model effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export for optimized deployment
model.export(format="engine") # TensorRT export
كفاءة الموارد
تتمثل إحدى نقاط القوة الرئيسيةYOLO Ultralytics YOLO في متطلباتها المنخفضة من الذاكرة أثناء التدريب والاستدلال. تتيح هذه الكفاءة للباحثين والمطورين استخدام أحجام دفعات أكبر على الأجهزة الاستهلاكية، مما يسرع عملية التدريب مقارنة بالنماذج الأثقل أو بنى Transformer المعقدة مثل RT-DETR.
النظام البيئي والتنوع
يتم صيانة Ultralytics بشكل استثنائي، حيث يتم تحديثه بشكل متكرر، ويحتوي على وثائق شاملة، ودعم أصلي لمهام متنوعة تتجاوز الكشف القياسي. مع Ultralytics يدعم إطار عمل واحد تقسيم الحالات، وتقدير الوضع، والتصنيف، والمربعات المحددة الاتجاه (OBB)، مما يوفر تنوعًا لا مثيل له غالبًا ما تفتقر إليه النماذج المنافسة.
مستقبل الذكاء الاصطناعي في مجال الرؤية: YOLO26
مع التطور السريع للرؤية الحاسوبية، ظهرت هياكل جديدة أعادت تعريف معايير السرعة والكفاءة. تم إصدار Ultralytics في يناير 2026، وهو يمثل قمة هذا التطور ويُعد الخيار الموصى به بشدة لجميع المشاريع الجديدة.
أهم ابتكارات YOLO26:
- تصميم شامل NMS: يزيل YOLO26 المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). هذا النهج الشامل الأصلي يبسط بشكل كبير منطق النشر ويقلل من زمن الاستجابة المتغير، وهو اختراق تم تقديمه لأول مرة في YOLOv10.
- أداء حافة غير مسبوق: من خلال إزالة فقدان التركيز التوزيعي (DFL)، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU مما يجعله متفوقًا على الأجهزة المتصلة بالإنترنت وأجهزة الحافة مقارنةً بالأجيال السابقة.
- ديناميكيات التدريب المتقدمة: يضمن دمج MuSGD Optimizer— المستوحى من ابتكارات LLM مثل Kimi K2 من Moonshot AI — تدريبًا أكثر استقرارًا وتقاربًا أسرع.
- كشف الأجسام الصغيرة بشكل فائق: تعالج وظائف الخسارة المحسّنة، وتحديداً ProgLoss + STAL، نقاط الضعف التاريخية في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لتطبيقات مثل التصوير الجوي.
تطبيقات عملية في أرض الواقع
غالبًا ما يعتمد الاختيار بين هذه البنى على بيئة النشر المحددة.
متى تختار PP-YOLOE+
- PaddlePaddle : إذا كانت البنية التحتية الخاصة بك متكاملة بالفعل مع PaddlePaddle من Baidu، فإن PP-YOLOE+ يوفر تكاملاً أصليًا.
- التفتيش الصناعي في آسيا: غالبًا ما يستخدم في مراكز التصنيع الآسيوية حيث يتم تهيئة الأجهزة والبرامج مسبقًا لاستخدام أدوات Baidu.
متى تختار YOLOv7
- أنظمةGPU: تعمل بشكل استثنائي على وحدات معالجة الرسومات (GPU) من فئة الخوادم للمهام التي تتطلب إنتاجية عالية، مثل تحليلات الفيديو.
- تكامل الروبوتات: مثالي لتكامل الرؤية الحاسوبية في الروبوتات، مما يتيح اتخاذ قرارات سريعة في البيئات الديناميكية.
- البحوث الأكاديمية: تحظى بدعم واسع النطاق وتستخدم بشكل متكرر كأساس موثوق به في البحوث PyTorch.
في حين أن النماذج القديمة لها أهمية تاريخية، فإن الانتقال إلى البنى الحديثة مثل YOLO26 أو YOLO11 عبر Ultralytics يضمن الوصول إلى أحدث التحسينات وأبسط سير عمل للتدريب وأوسع دعم متعدد المهام المتاح اليوم.