YOLOv7 PP-YOLOE+: مقارنة شاملة بين أجهزة الكشف في الوقت الحقيقي
عند تقييم أحدث نماذج الرؤية الحاسوبية لخطوط الإنتاج، غالبًا ما يوازن المطورون بين مزايا البنى المختلفة. هناك نموذجان بارزان في مجال اكتشاف الأجسام هما YOLOv7 و PP-YOLOE+. يقدم هذا الدليل مقارنة تقنية مفصلة بين هندستهما ومقاييس أدائهما وسيناريوهات النشر المثالية لمساعدتك في اتخاذ قرار مستنير بشأن مشروع الرؤية الحاسوبية التالي.
الابتكارات المعمارية
إن فهم الاختلافات الهيكلية الأساسية بين هذه النماذج أمر بالغ الأهمية للتنبؤ بكيفية تصرفها أثناء التدريب والاستدلال.
أهم ميزات YOLOv7
YOLOv7 العديد من التحسينات الرئيسية المصممة لتحسين الدقة دون زيادة تكاليف الاستدلال بشكل كبير.
- شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN): تتحكم هذه البنية في أقصر وأطول مسارات التدرج. وبذلك، تمكّن الشبكة من تعلم ميزات أكثر تنوعًا وتحسن القدرة الكلية للتعلم دون تدمير مسار التدرج الأصلي.
- استراتيجيات قياس النموذج: يستخدم YOLOv7 قياس النموذج المركب، حيث يقوم بتعديل العمق والعرض في وقت واحد أثناء ربط الطبقات للحفاظ على هيكل معماري أمثل عبر الأحجام المختلفة.
- مجموعة من التحسينات القابلة للتدريب: قام المؤلفون بدمج طريقة التفاف معاد تحديد معاملاتها (RepConv) بدون اتصالات هوية، مما يعزز سرعة الاستدلال بشكل كبير دون المساس بالقوة التنبؤية للنموذج.
تفاصيل YOLOv7:
المؤلفون: تشين-ياو وانغ، أليكسي بوتشكوفسكي، وهونغ-يوان مارك لياو
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2022-07-06
أرشيف: https://arxiv.org/abs/2207.02696
أبرز ملامح هندسة PP-YOLOE+
تم تطوير PP-YOLOE+ بواسطة Baidu ضمن PaddlePaddle وهو يعتمد على سابقه PP-YOLOv2، مع التركيز بشكل كبير على المنهجيات الخالية من المراسي وتمثيلات الميزات المحسّنة.
- تصميم خالٍ من المراسي: على عكس الأساليب القائمة على المراسي، يبسط هذا التصميم رأس التنبؤ ويقلل من عدد المعلمات الفائقة، مما يجعل النموذج أسهل في الضبط لمجموعات البيانات المخصصة.
- العمود الفقري CSPRepResNet: يدمج هذا العمود الفقري الاتصالات المتبقية وشبكات Cross Stage Partial لتحسين قدرات استخراج الميزات مع الحفاظ على الكفاءة الحسابية.
- تعلم محاذاة المهام (TAL): يستخدم PP-YOLOE+ رأس ET (رأس فعال ومحاذٍ للمهام) لتحسين محاذاة مهام التصنيف والتوطين، معالجةً بذلك عنق الزجاجة الشائع في كاشفات المرحلة الواحدة.
تفاصيل PP-YOLOE+:
المؤلفون: مؤلفو PaddlePaddle
المنظمة: Baidu
التاريخ: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250
مقاييس ومعايير الأداء
غالبًا ما يتوقف اختيار النموذج المناسب على القيود المحددة لأجهزتك ومتطلبات زمن الاستجابة. يوضح الجدول أدناه المفاضلات بين الدقة (mAP) والسرعة وتعقيد النموذج.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
تحليل النتائج
- سيناريوهات الدقة العالية: يُظهر YOLOv7x أداءً قويًا، محققًا mAP عاليًا ينافس في مهام detect المعقدة. بينما يتفوق PP-YOLOE+x قليلاً في mAP، فإنه يفعل ذلك بزيادة كبيرة في المعلمات وعمليات FLOPs.
- الكفاءة والسرعة: توفر المتغيرات الأصغر من PP-YOLOE+ (t و s) سرعات TensorRT منخفضة للغاية، مما يجعلها مناسبة جدًا لعمليات النشر على الحافة حيث تكون قيود الأجهزة صارمة.
- النقطة المثلى: يوفر YOLOv7l توازنًا مقنعًا، محققًا أكثر من 51% mAP مع الحفاظ على زمن استدلال أقل من 7 مللي ثانية على وحدات GPU T4، مما يجعله خيارًا قويًا لتطبيقات الخادم القياسية في الوقت الفعلي.
التحسين من أجل الإنتاج
عند نشر هذه النماذج، يمكن الاستفادة من تنسيقات التصدير مثل TensorRT أو ONNX يمكن أن يقلل بشكل كبير من زمن الاستجابة مقارنة PyTorch الأصلي PyTorch .
ميزة Ultralytics
في حين أن كلا من YOLOv7 PP-YOLOE+ يقدمان أداءً قوياً في المعايير المرجعية، فإن تجربة التطوير ودعم النظام البيئي لا يقلان أهمية عنهما في نجاح المشروع.
تجربة مستخدم مبسطة
تمنح Ultralytics الأولوية لسهولة الاستخدام من خلال Python موحدة. على عكس PP-YOLOE+، الذي يتطلب التنقل في PaddlePaddle وملفات التكوين الخاصة به، Ultralytics لك Ultralytics الانتقال من التدريب إلى النشر بسلاسة.
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolov7.pt")
# Train the model effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export for optimized deployment
model.export(format="engine") # TensorRT export
كفاءة الموارد
من نقاط القوة الرئيسية لنماذج Ultralytics YOLO هو انخفاض متطلبات الذاكرة الخاصة بها أثناء التدريب والاستدلال على حد سواء. تسمح هذه الكفاءة للباحثين والمطورين باستخدام أحجام دفعات أكبر على الأجهزة الاستهلاكية، مما يسرع عملية التدريب مقارنة بالنماذج الأثقل أو بنيات المحولات المعقدة مثل RT-DETR.
النظام البيئي والتنوع
يتم صيانة Ultralytics بشكل استثنائي، حيث يتم تحديثه بشكل متكرر، ويحتوي على وثائق شاملة، ودعم أصلي لمهام متنوعة تتجاوز الكشف القياسي. مع Ultralytics يدعم إطار عمل واحد تقسيم الحالات، وتقدير الوضع، والتصنيف، والمربعات المحددة الاتجاه (OBB)، مما يوفر تنوعًا لا مثيل له غالبًا ما تفتقر إليه النماذج المنافسة.
مستقبل الذكاء الاصطناعي في مجال الرؤية: YOLO26
مع التطور السريع للرؤية الحاسوبية، ظهرت معماريات أحدث تعيد تعريف معايير السرعة والكفاءة. يمثل Ultralytics YOLO26، الذي تم إصداره في يناير 2026، ذروة هذا التطور وهو الخيار الموصى به بشدة لجميع المشاريع الجديدة.
أهم ابتكارات YOLO26:
- تصميم شامل خالٍ من NMS: يلغي YOLO26 المعالجة اللاحقة لقمع غير الأقصى (NMS). يبسط هذا النهج الشامل بطبيعته منطق النشر بشكل كبير ويقلل من زمن الانتقال المتغير، وهو إنجاز تم تقديمه لأول مرة في YOLOv10.
- أداء طرفي (Edge) غير مسبوق: عن طريق إزالة Distribution Focal Loss (DFL)، يحقق YOLO26 سرعة استدلال على CPU أسرع بنسبة تصل إلى 43%، مما يجعله متفوقًا لأجهزة إنترنت الأشياء (IoT) والأجهزة الطرفية مقارنة بالأجيال السابقة.
- ديناميكيات التدريب المتقدمة: يضمن دمج مُحسِّن MuSGD—المستوحى من ابتكارات نماذج اللغة الكبيرة (LLM) مثل Kimi K2 من Moonshot AI—تدريبًا أكثر استقرارًا وتقاربًا أسرع.
- اكتشاف الكائنات الصغيرة الفائق: دوال خسارة محسّنة، وتحديداً ProgLoss + STAL، تعالج نقاط الضعف التاريخية في التعرف على الكائنات الصغيرة، وهو أمر بالغ الأهمية لتطبيقات مثل التصوير الجوي.
تطبيقات عملية في أرض الواقع
غالبًا ما يعتمد الاختيار بين هذه المعماريات على بيئة النشر المحددة.
متى تختار PP-YOLOE+
- تكامل PaddlePaddle: إذا كانت بنيتك التحتية مدمجة بعمق بالفعل مع منظومة PaddlePaddle من Baidu، فإن PP-YOLOE+ يوفر تكاملاً أصليًا.
- الفحص الصناعي في آسيا: غالبًا ما يُستخدم في مراكز التصنيع الآسيوية حيث يتم تهيئة حزم الأجهزة والبرامج مسبقًا لأدوات Baidu.
متى تختار YOLOv7
- الأنظمة المسرّعة بواسطة GPU: تعمل بشكل استثنائي على وحدات GPU من فئة الخوادم للمهام التي تتطلب إنتاجية عالية، مثل تحليلات الفيديو.
- تكامل الروبوتات: مثالي لدمج الرؤية الحاسوبية في الروبوتات، مما يسمح باتخاذ قرارات سريعة في البيئات الديناميكية.
- البحث الأكاديمي: مدعوم على نطاق واسع ويُستخدم بشكل متكرر كأساس موثوق به في الأبحاث القائمة على PyTorch.
في حين أن النماذج القديمة لها أهمية تاريخية، فإن الانتقال إلى البنى الحديثة مثل YOLO26 أو YOLO11 عبر Ultralytics يضمن الوصول إلى أحدث التحسينات وأبسط سير عمل للتدريب وأوسع دعم متعدد المهام المتاح اليوم.