PP-YOLOE+ مقابل YOLOv7: استكشاف بنى الكشف عن الأجسام في الوقت الفعلي
تطورت الرؤية الحاسوبية بسرعة، مما زود المطورين بأدوات أكثر قوة للكشف عن الأشياء في الوقت الفعلي. ومن المعالم الهامة في هذا التطور PP-YOLOE+ من Baidu و YOLOv7 من قبل مؤلفي YOLOv4. يهدف كلا النموذجين إلى تحقيق التوازن بين السرعة والدقة، لكنهما يحققان ذلك من خلال فلسفات معمارية ومنهجيات تدريب مختلفة جذريًا.
يحلل هذا الدليل الشامل هاتين البنيتين، ويقارن بين مقاييس أدائهما وسهولة استخدامهما ومدى ملاءمتهما لتطبيقات الذكاء الاصطناعي الحديثة. كما نستكشف كيف تضع الابتكارات الحديثة مثل YOLO26 معايير جديدة للكفاءة والنشر.
ملخص تنفيذي: الاختلافات الرئيسية
| ميزة | PP-YOLOE+ | YOLOv7 |
|---|---|---|
| البنية | بدون مرساة، CSPRepResStage | مستند إلى المرساة، E-ELAN |
| الابتكار الأساسي | التعلم المتوافق مع المهام (TAL) | حقيبة هدايا قابلة للتدريب |
| الإطار الأساسي | PaddlePaddle | PyTorch |
| أفضل حالة استخدام | البيئات الصناعية التي تستخدم Paddle Inference | البحث والنشر للأغراض العامة |
PP-YOLOE+: كشف مُحسَّن بدون نقاط ارتكاز
PP-YOLOE+ هو تطورYOLO تم تطويره بواسطة فريق Baidu لتحسين الدقة وسرعة الاستدلال على أجهزة متنوعة. تم إصداره في عام 2022، ويستخدم بشكل كبير آليات بدون مرساة لتبسيط رأس الكشف.
تفاصيل فنية:
- المؤلفون: مؤلفو PaddlePaddle
- المؤسسة:بايدو
- التاريخ: 2022-04-02
- Arxiv:ورقة PP-YOLOE
- GitHub:مستودع PaddleDetection
الهيكلة ونقاط القوة
يقدم PP-YOLOE+ هيكل CSPRepResStage، الذي يجمع بين الاتصالات المتبقية وشبكات CSP (Cross Stage Partial). ومن الميزات الرئيسية آلية تعلم محاذاة المهام (TAL) ، التي تعمل على محاذاة مهام التصنيف والتحديد المكاني بشكل ديناميكي أثناء التدريب. وهذا يساعد في حل المشكلة الشائعة المتمثلة في أن عمليات الكشف عالية الثقة لا تتمتع بالضرورة بأفضل تداخل للمربعات المحيطة.
يتم دعم النموذج بشكل أساسي من قبل PaddlePaddle مما يجعله عالي الكفاءة عند نشره على محركات الاستدلال الخاصة بـ Baidu أو الأجهزة مثل أجهزة FPGA و NPU التي غالبًا ما تستخدم في الأسواق الصناعية الآسيوية.
YOLOv7: مجموعة التحسينات القابلة للتدريب
تم إصداره بعد فترة وجيزة من إصدار PP-YOLOE+، YOLOv7 على تحسين عملية التدريب نفسها دون زيادة تكلفة الاستدلال، وهو مفهوم أطلق عليه المؤلفون اسم "bag-of-freebies".
تفاصيل فنية:
- المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
- الجهة المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
- التاريخ: 2022-07-06
- Arxiv:ورقةYOLOv7
- GitHub:مستودع YOLOv7
الهيكلة ونقاط القوة
YOLOv7 شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN). على عكس ELAN التقليدية، تسمح E-ELAN للشبكة بتعلم ميزات أكثر تنوعًا من خلال التحكم في أطوال مسارات التدرج. كما أنها تستخدم مقياس النموذج المركب، الذي يضبط العمق والعرض في وقت واحد للحفاظ على الكفاءة المثلى.
على الرغم من أدائه العالي، YOLOv7 على مربعات الربط، والتي قد تتطلب ضبطًا دقيقًا للمعلمات الفائقة لمجموعات البيانات المخصصة ذات الأشكال غير العادية.
معايير الأداء
يقارن الجدول التالي النماذج على COCO وهي معيار قياسي لاكتشاف الكائنات. لاحظ أنه في حين أن PP-YOLOE+ يُظهر mAP قويًا، فإن YOLOv7 يوفر YOLOv7 سرعات استدلال تنافسية على GPU القياسية.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
التدريب ومقارنة النظم البيئية
عند اختيار نموذج لمشروع رؤية حاسوبية، غالبًا ما تكون سهولة التدريب والنظام البيئي المحيط بهما بنفس أهمية المقاييس الأولية.
الإطار العام وقابلية الاستخدام
PP-YOLOE+ يتطلب PaddlePaddle . على الرغم من قوته، إلا أنه قد يمثل منحنى تعليمي حاد للمطورين المعتادين على PyTorch . غالبًا ما يتطلب إعداده استنساخ مستودعات محددة مثل PaddleDetection وإدارة التبعيات التي تختلف عن حزم pip العالمية القياسية.
YOLOv7، كونه PyTorch، يتكامل بشكل أكثر طبيعية مع سير العمل البحثي الغربي القياسي. ومع ذلك، يفتقر المستودع الأصلي إلى تجربة "من الصفر إلى القمة" السلسة الموجودة في Ultralytics الحديثة.
ميزة Ultralytics
Ultralytics ، مثل YOLOv8 و YOLO26 الجديدة، توفر Python موحدة تعمل على تبسيط عملية التدريب المعقدة. وهذا يسمح للمطورين بالتركيز على البيانات بدلاً من التركيز على الكود النمطي.
تدريب مبسط مع Ultralytics
Ultralytics تدريب نموذج متطور باستخدام Ultralytics بضع أسطر فقط من التعليمات البرمجية، حيث يتم التعامل مع زيادة البيانات وتسجيلها تلقائيًا.
from ultralytics import YOLO
# Load a pretrained model (YOLO26 recommended for best performance)
model = YOLO("yolo26s.pt")
# Train on your custom data
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
تتعدى هذه البساطة إلى خيارات النشر، مما يسمح بالتصدير المبسط إلى تنسيقات مثل ONNX و TensorRT للحصول على أقصى أداء.
مستقبل الكشف: YOLO26
في حين أن PP-YOLOE+ و YOLOv7 أحدث التقنيات عند إصدارهما، إلا أن هذا المجال قد تطور بشكل كبير. تم إصدار YOLO26 في يناير 2026، وهو يمثل قمة الكفاءة والدقة.
أهم ابتكارات YOLO26:
- NMS من البداية إلى النهاية: على عكس YOLOv7 تتطلب معالجة لاحقة لـ Non-Maximum Suppression (NMS)، فإن YOLO26 هي خالية من NMS من البداية إلى النهاية. وهذا يزيل تقلب زمن الاستجابة الناتج عن NMS المشاهد المزدحمة، مما يجعلها مثالية لتطبيقات المدن الذكية ومراقبة حركة المرور.
- MuSGD Optimizer: مستوحى من تقنيات تدريب LLM، يجمع هذا المحسن SGD Muon لضمان ديناميكيات تدريب مستقرة، وهي ميزة غير متوفرة في البنى القديمة.
- تحسين الحافة: من خلال إزالة Distribution Focal Loss (DFL)، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعله أفضل بكثير للأجهزة الطرفية مقارنة بمتطلبات الحوسبة الأثقل لـ PP-YOLOE+.
- ProgLoss + STAL: تعمل وظائف الخسارة المتقدمة على تحسين اكتشاف الأجسام الصغيرة، وهو أمر بالغ الأهمية في مجالات مثل الزراعة والصور الجوية.
تطبيقات عملية في أرض الواقع
غالبًا ما يحدد اختيار النموذج نجاح تطبيقات معينة.
حالات استخدام PP-YOLOE+
- الفحص الصناعي في آسيا: نظرًا PaddlePaddle القوي الذي يقدمه PaddlePaddle في مراكز التصنيع الآسيوية، غالبًا ما يستخدم PP-YOLOE+ للكشف عن العيوب في خطوط التجميع حيث يتم تهيئة الأجهزة مسبقًا لمكدس Baidu.
- تحليل الصور الثابتة: إن mAP المرتفع mAP مناسبًا للمعالجة دون اتصال بالإنترنت حيث يكون زمن الاستجابة في الوقت الفعلي أقل أهمية من الدقة المطلقة.
حالات YOLOv7
- البحث العام: يستخدم على نطاق واسع كأساس في الأوراق الأكاديمية بسبب PyTorch .
- أنظمةGPU: تعمل بشكل جيد على وحدات معالجة الرسومات (GPU) من فئة الخوادم في مهام مثل تحليلات الفيديو.
حالات استخدام Ultralytics (YOLO26)
- Edge AI & IoT: إن الاستهلاك المنخفض للذاكرة CPU العالية Ultralytics تجعلها مثالية لاستخدامات Raspberry Pi والأجهزة المحمولة.
- المهام متعددة الوسائط: بالإضافة إلى الصناديق البسيطة، Ultralytics تقدير الوضع والصناديق المحددة الاتجاه (OBB)، مما يسمح بتطبيقات معقدة مثل الإمساك الآلي أو تحليل المستندات.
- النماذج الأولية السريعة: تتيح Ultralytics للفرق الانتقال من تعليق مجموعة البيانات إلى النموذج المطبق في غضون دقائق، مما يقلل بشكل كبير من وقت طرح المنتج في السوق.
الخلاصة
YOLOv7 كل من PP-YOLOE+ و YOLOv7 بشكل كبير في مجال الرؤية الحاسوبية. YOLOv7 وسّع PP-YOLOE+ حدود الكشف بدون مرساة، بينما YOLOv7 كفاءة البنى القائمة على المرساة.
ومع ذلك، بالنسبة للمطورين الذين يبحثون عن حل مستقبلي يجمع بين أفضل ما في العالمين - السرعة والدقة وسهولة الاستخدام - فإنYOLO26 هو الخيار الموصى به. بفضل تصميمه NMS وقدراته القوية في التصدير وتكامله السلس مع Ultralytics فإنه يوفر مجموعة أدوات متعددة الاستخدامات لمواجهة تحديات الذكاء الاصطناعي الحديثة.
لاستكشاف خيارات أخرى عالية الأداء، راجع الوثائق الخاصة بـ YOLOv9 أو YOLOv10.