PP-YOLOE+ مقابل YOLOv9: دراسة تقنية متعمقة حول الكشف الحديث عن الأجسام
يتغير مشهد الرؤية الحاسوبية في الوقت الفعلي باستمرار، حيث يعمل الباحثون والمطورون على توسيع حدود الدقة وسرعة الاستدلال. عند مقارنة PP-YOLOE+ و YOLOv9، فإننا ننظر إلى فلسفتين متميزتين في هندسة النموذج وتصميم النظام البيئي.
تحلل هذه المقارنة التقنية الشاملة ابتكاراتها المعمارية ومقاييس الأداء ومنهجيات التدريب وحالات الاستخدام المثالية لمساعدتك في اختيار نموذج الكشف عن الكائنات المناسب لنشره في المرة القادمة.
سلسلة النماذج والأسس التقنية
إن فهم أصول هذه النماذج والخيارات المعمارية لها أمر بالغ الأهمية لتحديد مدى ملاءمتها لمشاريع الرؤية الحاسوبية الخاصة بك.
نظرة عامة على PP-YOLOE+
تم تطوير PP-YOLOE+ بواسطة PaddlePaddle في Baidu، وتم طرحه في 2 أبريل 2022. وهو يعتمد على الإصدارات السابقة ضمن إطار عمل PaddleDetection لتقديم أداء عالٍ في اكتشاف الكائنات.
- المؤلفون: مؤلفو PaddlePaddle
- المؤسسة:بايدو
- التاريخ: 2022-04-02
- Arxiv:2203.16250
- GitHub:مستودع PaddleDetection
يقدم PP-YOLOE+ بنية قوية خالية من المراسي، ومُحسّنة بشكل كبير للنشر داخل PaddlePaddle . ويستخدم هذا النظام العمود الفقري CSPRepResNet المعدل ورأس ET لتحسين استخراج الميزات وانحدار الصندوق المحيط. وعلى الرغم من أنه يحقق متوسط دقة عالي (mAP)، إلا أن اعتماده على PaddlePaddle قد يؤدي في بعض الأحيان إلى حدوث احتكاك في التكامل للمطورين المعتادين على PyTorch TensorFlow.
نظرة عامة على YOLOv9
قدمه Chien-Yao Wang و Hong-Yuan Mark Liao من معهد علوم المعلومات، أكاديمية سينكا، تايوان، YOLOv9 قفزة كبيرة في التعامل الفعال مع اختناقات معلومات التعلم العميق.
- المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
- المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
- التاريخ: 2024-02-21
- Arxiv:2402.13616
- GitHub:WongKinYiu/yolov9
يتمثل الاختراق الرئيسي YOLOv9 في معلومات التدرج القابلة للبرمجة (PGI)، التي تمنع فقدان البيانات أثناء مرور الميزات عبر الشبكات العصبية العميقة. بالاقتران مع شبكة تجميع الطبقات الفعالة المعممة (GELAN)، YOLOv9 كفاءة المعلمات وتدفق الحوسبة. علاوة على ذلك، فهي مدمجة أصلاً في Ultralytics مما يجعلها سهلة الوصول للغاية لكل من التطبيقات البحثية والتجارية.
Ultralytics الأخرى
إذا كنت تبحث عن أحدث الخيارات المتاحة، فقد تهمك أيضًا YOLO11 و RT-DETR، اللذين يوفران توازنًا متنوعًا بين الدقة القائمة على المحولات والأداء الفائق في الوقت الفعلي.
مقارنة الأداء والمقاييس
عند تحليل الأداء الخام، YOLOv9 كفاءة استثنائية في المعلمات. فهو يحقق دقة مماثلة أو أعلى مع الحاجة إلى معلمات وعمليات FLOP أقل، مما يترجم إلى متطلبات VRAM أقل أثناء تدريب النموذج.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
كما يتضح من الجدول، يحقق YOLOv9c قيمة mAP قوية تبلغ 53.0 مع عدد أقل بكثير من المعلمات (25.3 مليون) مقارنة بـ PP-YOLOE+l المماثل (52.2 مليون). هذا الاستخدام الأقل للذاكرة يجعل YOLOv9 خيارًا متفوقًا للمطورين الذين يعملون بموارد GPU محدودة.
النظام البيئي، والتنوع، وسهولة الاستخدام
YOLOv9 الميزة المميزة لـ YOLOv9 في تكاملها السلس مع Ultralytics الذي يتم صيانته جيدًا. في حين يتطلب PP-YOLOE+ التنقل بين ملفات PaddlePaddle المعقدة، YOLOv9 من Python مبسطة.
تتيح Python Ultralytics Python للمطورين تحميل الأوزان المدربة مسبقًا وإدارة زيادة البيانات وبدء التدريب باستخدام الحد الأدنى من التعليمات البرمجية النمطية.
from ultralytics import YOLO
# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Export the model to ONNX format
model.export(format="onnx")
علاوة على ذلك، يوفر Ultralytics تنوعًا لا مثيل له. بالإضافة إلى الكشف عن الصناديق المحددة، يدعم الإطار بشكل أساسي تقسيم الحالات وتقدير الوضع والكشف عن الصناديق المحددة الموجهة (OBB). وهذا يجعل تكييف نموذجك مع خطوط الإنتاج المعقدة في العالم الواقعي فعالًا للغاية.
خيارات التصدير
يمكن تصدير النماذج التي تم تدريبها باستخدام Ultralytics إلى تنسيقات متعددة، بما في ذلك TensorRT و OpenVINO، مما يضمن استنتاجًا محسّنًا للغاية عبر أجهزة متنوعة.
حالات الاستخدام والتوصيات
يعتمد الاختيار بين PP-YOLOE+ وYOLOv9 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
متى تختار PP-YOLOE+
PP-YOLOE+ هو خيار قوي لـ:
- تكامل منظومة PaddlePaddle: المنظمات ذات البنية التحتية الحالية المبنية على إطار عمل وأدوات PaddlePaddle من Baidu.
- نشر Paddle Lite على الحوسبة الطرفية: النشر على أجهزة بنواة استدلال محسّنة للغاية خصيصًا لمحرك استدلال Paddle Lite أو Paddle.
- الكشف عالي الدقة من جانب الخادم: السيناريوهات التي تعطي الأولوية لأقصى دقة detect على خوادم GPU القوية حيث لا يمثل الاعتماد على الإطار مشكلة.
متى تختار YOLOv9
YOLOv9 في الحالات التالية:
- أبحاث عن عنق الزجاجة المعلوماتي: مشاريع أكاديمية تدرس بنى معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
- دراسات تحسين تدفق التدرج: أبحاث تركز على فهم وتخفيف فقدان المعلومات في طبقات الشبكة العميقة أثناء التدريب.
- قياس الأداء للكشف عالي الدقة: السيناريوهات التي تتطلب أداء YOLOv9 القوي في معيار COCO كنقطة مرجعية للمقارنات المعمارية.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
- بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
- اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.
التطلع إلى المستقبل: ميزة YOLO26
في حين أن كلا من PP-YOLOE+ و YOLOv9 YOLO26 الذي تم إصداره مؤخرًا يمثل الخطوة التالية الحاسمة لبيئات الإنتاج. تم إصدار YOLO26 في يناير 2026، وهو يضع معيارًا جديدًا للحوسبة المتطورة ونشر السحابة. نوصي بشدة باستخدام YOLO26 لجميع مشاريع الرؤية الحاسوبية الجديدة نظرًا لابتكاراته الثورية:
- تصميم شامل بدون NMS: يتميز YOLO26 بتصميم شامل بطبيعته، مما يلغي تمامًا الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يبسط مسارات النشر بشكل كبير ويقلل من زمن الاستجابة.
- سرعة استدلال على CPU أسرع بنسبة تصل إلى 43%: عن طريق تحسين البنية خصيصًا للحوسبة الطرفية، يعد YOLO26 أسرع بكثير على الأجهزة التي تفتقر إلى GPUs مخصصة.
- إزالة DFL: تمت إزالة Distribution Focal Loss، مما يجعل عمليات التصدير أبسط ويحسن بشكل كبير التوافق مع الأجهزة الطرفية منخفضة الطاقة.
- مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (مثل Kimi K2 من Moonshot AI)، يضمن هذا المزيج من SGD و Muon ديناميكيات تدريب مستقرة للغاية وتقاربًا سريعًا.
- ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهي ترقية أساسية لـالتصوير الجوي والروبوتات.
- تحسينات خاصة بالمهام: يتضمن YOLO26 معماريات مخصصة لمهام محددة، مثل النموذج الأولي متعدد المقاييس لـ segmentation وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتقدير الوضعية.
يمكنك بسهولة تدريب ونشر نماذج YOLO26 من خلال Ultralytics وهي حل شامل لتعليق مجموعات البيانات والتدريب السحابي ومراقبة النماذج.
تطبيقات عملية في أرض الواقع
غالبًا ما يعتمد الاختيار بين هذه المعماريات على بيئة النشر المستهدفة الخاصة بك.
PP-YOLOE+ يتم نشره بشكل متكرر في مراكز التصنيع الصناعية، خاصة في المناطق التي تتكامل فيها PaddlePaddle ومكدس أجهزة Baidu بعمق في البنية التحتية للمؤسسات. يتفوق في تحليل الصور الثابتة حيث تُعطى الأولوية للدقة المطلقة على قيود الوقت الفعلي الصارمة.
YOLOv9 يتفوق في البيئات الديناميكية التي تتطلب استدلالًا سريعًا في الوقت الفعلي. كفاءته الفائقة في المعلمات تجعله مثاليًا للملاحة الذاتية للطائرات بدون طيار وأنظمة الأمان القائمة على الحافة. علاوة على ذلك، يقلل استهلاكه المنخفض لذاكرة الفيديو (VRAM) من حاجز الدخول للباحثين الذين يتدربون على وحدات معالجة الرسوميات (GPU) الاستهلاكية.
للحصول على أفضل أداء على الإطلاق في إدارة حركة المرور في المدن الذكية والروبوتات عالية السرعة، لا يوجد ما يضاهي الإصدار الأحدث YOLO26، الذي يوفر كفاءة شاملة دون أعباء NMS .