PP-YOLOE+ مقابل YOLOv9: دراسة تقنية متعمقة حول الكشف الحديث عن الأجسام
يتغير مشهد الرؤية الحاسوبية في الوقت الفعلي باستمرار، حيث يعمل الباحثون والمطورون على توسيع حدود الدقة وسرعة الاستدلال. عند مقارنة PP-YOLOE+ و YOLOv9، فإننا ننظر إلى فلسفتين متميزتين في هندسة النموذج وتصميم النظام البيئي.
تحلل هذه المقارنة التقنية الشاملة ابتكاراتها المعمارية ومقاييس الأداء ومنهجيات التدريب وحالات الاستخدام المثالية لمساعدتك في اختيار نموذج الكشف عن الكائنات المناسب لنشره في المرة القادمة.
سلسلة النماذج والأسس التقنية
إن فهم أصول هذه النماذج والخيارات المعمارية لها أمر بالغ الأهمية لتحديد مدى ملاءمتها لمشاريع الرؤية الحاسوبية الخاصة بك.
نظرة عامة على PP-YOLOE+
تم تطوير PP-YOLOE+ بواسطة PaddlePaddle في Baidu، وتم طرحه في 2 أبريل 2022. وهو يعتمد على الإصدارات السابقة ضمن إطار عمل PaddleDetection لتقديم أداء عالٍ في اكتشاف الكائنات.
- المؤلفون: مؤلفو PaddlePaddle
- المؤسسة:بايدو
- التاريخ: 2022-04-02
- Arxiv:2203.16250
- GitHub:مستودع PaddleDetection
يقدم PP-YOLOE+ بنية قوية خالية من المراسي، ومُحسّنة بشكل كبير للنشر داخل PaddlePaddle . ويستخدم هذا النظام العمود الفقري CSPRepResNet المعدل ورأس ET لتحسين استخراج الميزات وانحدار الصندوق المحيط. وعلى الرغم من أنه يحقق متوسط دقة عالي (mAP)، إلا أن اعتماده على PaddlePaddle قد يؤدي في بعض الأحيان إلى حدوث احتكاك في التكامل للمطورين المعتادين على PyTorch TensorFlow.
نظرة عامة على YOLOv9
قدمه Chien-Yao Wang و Hong-Yuan Mark Liao من معهد علوم المعلومات، أكاديمية سينكا، تايوان، YOLOv9 قفزة كبيرة في التعامل الفعال مع اختناقات معلومات التعلم العميق.
- المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
- المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
- التاريخ: 2024-02-21
- Arxiv:2402.13616
- GitHub:WongKinYiu/yolov9
يتمثل الاختراق الرئيسي YOLOv9 في معلومات التدرج القابلة للبرمجة (PGI)، التي تمنع فقدان البيانات أثناء مرور الميزات عبر الشبكات العصبية العميقة. بالاقتران مع شبكة تجميع الطبقات الفعالة المعممة (GELAN)، YOLOv9 كفاءة المعلمات وتدفق الحوسبة. علاوة على ذلك، فهي مدمجة أصلاً في Ultralytics مما يجعلها سهلة الوصول للغاية لكل من التطبيقات البحثية والتجارية.
Ultralytics الأخرى
إذا كنت تبحث عن أحدث الخيارات المتاحة، فقد تهمك أيضًا YOLO11 و RT-DETR، اللذين يوفران توازنًا متنوعًا بين الدقة القائمة على المحولات والأداء الفائق في الوقت الفعلي.
مقارنة الأداء والمقاييس
عند تحليل الأداء الخام، YOLOv9 كفاءة استثنائية في المعلمات. فهو يحقق دقة مماثلة أو أعلى مع الحاجة إلى معلمات وعمليات FLOP أقل، مما يترجم إلى متطلبات VRAM أقل أثناء تدريب النموذج.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
كما هو موضح في الجدول، يحقق YOLOv9c معدل دقة متوسط قوي يبلغ 53.0 mAP عدد أقل بكثير من المعلمات (25.3 مليون) مقارنةً بـ PP-YOLOE+l (52.2 مليون). هذا الاستخدام المنخفض للذاكرة يجعل YOLOv9 متميزًا للمطورين الذين يعملون GPU محدودة.
النظام البيئي، والتنوع، وسهولة الاستخدام
YOLOv9 الميزة المميزة لـ YOLOv9 في تكاملها السلس مع Ultralytics الذي يتم صيانته جيدًا. في حين يتطلب PP-YOLOE+ التنقل بين ملفات PaddlePaddle المعقدة، YOLOv9 من Python مبسطة.
تتيح Python Ultralytics Python للمطورين تحميل الأوزان المدربة مسبقًا وإدارة زيادة البيانات وبدء التدريب باستخدام الحد الأدنى من التعليمات البرمجية النمطية.
from ultralytics import YOLO
# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Export the model to ONNX format
model.export(format="onnx")
علاوة على ذلك، يوفر Ultralytics تنوعًا لا مثيل له. بالإضافة إلى الكشف عن الصناديق المحددة، يدعم الإطار بشكل أساسي تقسيم الحالات وتقدير الوضع والكشف عن الصناديق المحددة الموجهة (OBB). وهذا يجعل تكييف نموذجك مع خطوط الإنتاج المعقدة في العالم الواقعي فعالًا للغاية.
خيارات التصدير
يمكن تصدير النماذج التي تم تدريبها باستخدام Ultralytics إلى تنسيقات متعددة، بما في ذلك TensorRT و OpenVINO، مما يضمن استنتاجًا محسّنًا للغاية عبر أجهزة متنوعة.
حالات الاستخدام والتوصيات
YOLOv9 الاختيار بين PP-YOLOE+ و YOLOv9 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار PP-YOLOE+
PP-YOLOE+ هو خيار قوي لـ:
- تكاملPaddlePaddle : المؤسسات التي تمتلك بنية تحتية قائمة مبنية على إطار عمل وأدوات PaddlePaddle من Baidu.
- نشر Paddle Lite Edge: النشر على الأجهزة باستخدام نوى استدلال محسّنة للغاية خصيصًا لمحرك الاستدلال Paddle Lite أو Paddle.
- الكشف عالي الدقة من جانب الخادم: سيناريوهات تعطي الأولوية لأقصى دقة في الكشف على GPU قوية حيث لا تشكل تبعية إطار العمل مشكلة.
متى تختار YOLOv9
YOLOv9 في الحالات التالية:
- أبحاث عن اختناق المعلومات: مشاريع أكاديمية تدرس هياكل معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
- دراسات تحسين التدفق التدرجي: تركز الأبحاث على فهم وتخفيف فقدان المعلومات في طبقات الشبكة العميقة أثناء التدريب.
- مقارنة أداء الكشف عالي الدقة: سيناريوهات تتطلب أداء YOLOv9 القوي COCO كنقطة مرجعية لمقارنات الهندسة المعمارية.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
- كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.
التطلع إلى المستقبل: ميزة YOLO26
في حين أن كلا من PP-YOLOE+ و YOLOv9 YOLO26 الذي تم إصداره مؤخرًا يمثل الخطوة التالية الحاسمة لبيئات الإنتاج. تم إصدار YOLO26 في يناير 2026، وهو يضع معيارًا جديدًا للحوسبة المتطورة ونشر السحابة. نوصي بشدة باستخدام YOLO26 لجميع مشاريع الرؤية الحاسوبية الجديدة نظرًا لابتكاراته الثورية:
- تصميم شامل NMS: YOLO26 هو نظام شامل بطبيعته، مما يلغي تمامًا الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يبسط بشكل كبير خطوط النشر ويقلل من زمن الاستجابة.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : من خلال تحسين البنية بشكل خاص للحوسبة الطرفية، أصبح YOLO26 أسرع بشكل ملحوظ على الأجهزة التي تفتقر إلى وحدات معالجة رسومات مخصصة.
- إزالة DFL: تمت إزالة فقدان بؤرة التوزيع (DFL)، مما يجعل عمليات التصدير أكثر بساطة ويحسن التوافق بشكل كبير مع الأجهزة الطرفية منخفضة الطاقة.
- MuSGD Optimizer: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (مثل Kimi K2 من Moonshot AI)، يضمن هذا المزيج من SGD Muon ديناميكيات تدريب عالية الاستقرار وتقاربًا سريعًا.
- ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو تحسين أساسي للصور الجوية والروبوتات.
- تحسينات خاصة بالمهام: يتضمن YOLO26 هياكل مخصصة لمهام محددة، مثل البروتو متعدد المقاييس للتجزئة وتقدير الاحتمالية المتبقية (RLE) لتقدير الوضع.
يمكنك بسهولة تدريب ونشر نماذج YOLO26 من خلال Ultralytics وهي حل شامل لتعليق مجموعات البيانات والتدريب السحابي ومراقبة النماذج.
تطبيقات عملية في أرض الواقع
غالبًا ما يعتمد الاختيار بين هذه البنى على بيئة النشر المستهدفة.
يتم استخدام PP-YOLOE+ بشكل متكرر في مراكز التصنيع الصناعي، لا سيما في المناطق التي يتم فيها PaddlePaddle ومجموعة أجهزة Baidu بشكل عميق في البنية التحتية للمؤسسات. وهو يتفوق في تحليل الصور الثابتة حيث يتم إعطاء الأولوية للدقة المطلقة على القيود الصارمة في الوقت الفعلي.
YOLOv9 تتفوق في البيئات الديناميكية التي تتطلب استنتاجات سريعة في الوقت الفعلي. كفاءتها الفائقة في المعلمات تجعلها مثالية للملاحة الذاتية للطائرات بدون طيار وأنظمة الأمان القائمة على الحافة. علاوة على ذلك، فإن استهلاكها المنخفض لذاكرة VRAM يقلل من عوائق الدخول للباحثين الذين يتدربون على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين.
للحصول على أفضل أداء على الإطلاق في إدارة حركة المرور في المدن الذكية والروبوتات عالية السرعة، لا يوجد ما يضاهي الإصدار الأحدث YOLO26، الذي يوفر كفاءة شاملة دون أعباء NMS .