PP-YOLOE+ مقابل YOLOv9: نظرة تقنية متعمقة في كشف الكائنات الحديث

يشهد مشهد رؤية الحاسوب في الوقت الفعلي تغيراً مستمراً، حيث يدفع الباحثون والمطورون باستمرار حدود الدقة وسرعة الاستدلال. عند مقارنة PP-YOLOE+ و YOLOv9، نحن ننظر إلى فلسفتين متميزتين في بنية النموذج وتصميم النظام البيئي.

تحلل هذه المقارنة التقنية الشاملة ابتكاراتهما المعمارية، ومقاييس الأداء، ومنهجيات التدريب، وحالات الاستخدام المثالية لمساعدتك في اختيار نموذج كشف الكائنات المناسب لنشرك القادم.

سلالة النماذج والأسس التقنية

يعد فهم أصول هذه النماذج وخياراتها المعمارية أمراً حاسماً لتحديد مدى ملاءمتها لـ مشاريع رؤية الحاسوب الخاصة بك.

نظرة عامة على PP-YOLOE+

تم تطوير PP-YOLOE+ بواسطة مؤلفي PaddlePaddle في شركة Baidu، وتم تقديمه في 2 أبريل 2022. وهو يعتمد على الإصدارات السابقة ضمن إطار عمل PaddleDetection لتقديم أداء عالٍ في كشف الكائنات.

يقدم PP-YOLOE+ بنية قوية خالية من المراسي (anchor-free)، ومُحسَّنة بشكل كبير للنشر داخل نظام PaddlePaddle البيئي. وهو يستخدم بنية أساسية من نوع CSPRepResNet معدلة ورأس ET لتحسين استخراج الميزات وانحدار مربعات الإحاطة. وبينما يحقق متوسط دقة متوسط (mAP) عالٍ، فإن اعتماده على إطار عمل PaddlePaddle قد يؤدي أحياناً إلى صعوبات في التكامل للمطورين المعتادين على PyTorch أو TensorFlow.

تعرف على المزيد حول PP-YOLOE+

نظرة عامة على YOLOv9

يُمثل YOLOv9، الذي قدمه Chien-Yao Wang و Hong-Yuan Mark Liao من معهد علوم المعلومات في أكاديمية Sinica في تايوان، قفزة كبيرة في التعامل بكفاءة مع اختناقات معلومات التعلم العميق.

  • المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
  • المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
  • التاريخ: 2024-02-21
  • Arxiv: 2402.13616
  • GitHub: WongKinYiu/yolov9

يتمثل الاختراق الرئيسي لـ YOLOv9 في معلومات التدرج القابلة للبرمجة (PGI)، والتي تمنع فقدان البيانات أثناء مرور الميزات عبر الشبكات العصبية العميقة. وبالاقتران مع شبكة تجميع الطبقات الفعالة المعممة (GELAN)، يعمل YOLOv9 على زيادة كفاءة المعلمات وتدفق الحساب. علاوة على ذلك، فهو مدمج أصلاً في نظام Ultralytics البيئي، مما يجعله متاحاً للغاية لكل من الأبحاث والتطبيقات التجارية.

اعرف المزيد حول YOLOv9

نماذج Ultralytics أخرى

إذا كنت تستكشف خيارات متطورة، فقد تكون مهتماً أيضاً بـ YOLO11 و RT-DETR، اللذين يوفران توازنات متنوعة بين الدقة القائمة على Transformer والأداء على الحافة في الوقت الفعلي.

مقارنة الأداء والمقاييس

عند تحليل الأداء الخام، يظهر YOLOv9 كفاءة استثنائية في المعلمات. فهو يحقق دقة مماثلة أو متفوقة مع تطلب عدد أقل من المعلمات وFLOPs، مما يترجم إلى متطلبات VRAM أقل أثناء تدريب النموذج.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

كما يظهر في الجدول، يحقق YOLOv9c دقة 53.0 mAP قوية مع معلمات أقل بكثير (25.3 مليون) من النموذج المقارن PP-YOLOE+l (52.2 مليون). يجعل هذا الاستخدام المنخفض للذاكرة من YOLOv9 خياراً متفوقاً للمطورين الذين يعملون بموارد GPU محدودة.

النظام البيئي، وتعدد الاستخدامات، وسهولة الاستخدام

تكمن الميزة المحددة لـ YOLOv9 في تكامله السلس مع نظام Ultralytics البيئي الذي يتم صيانته جيداً. بينما يتطلب PP-YOLOE+ التعامل مع ملفات تهيئة معقدة في PaddlePaddle، يستفيد YOLOv9 من واجهة برمجة تطبيقات Python مبسطة.

تسمح واجهة برمجة تطبيقات Ultralytics Python للمطورين بتحميل الأوزان المدربة مسبقاً، وإدارة تعزيز البيانات، وبدء التدريب بأقل قدر من التعليمات البرمجية النموذجية.

from ultralytics import YOLO

# Load a pretrained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export the model to ONNX format
model.export(format="onnx")

علاوة على ذلك، يوفر نظام Ultralytics البيئي تعدد استخدامات لا مثيل له. فإلى جانب كشف مربعات الإحاطة، يدعم إطار العمل أصلاً تجزئة الكائنات، وتقدير الوضعية، وكشف مربعات الإحاطة الموجهة (OBB). وهذا يجعل تكييف نموذجك مع خطوط أنابيب معقدة في العالم الحقيقي فعالاً للغاية.

خيارات التصدير

يمكن تصدير النماذج المدربة باستخدام إطار عمل Ultralytics إلى تنسيقات متعددة، بما في ذلك TensorRT و OpenVINO، مما يضمن استدلالاً مُحسَّناً للغاية عبر أجهزة متنوعة.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين PP-YOLOE+ و YOLOv9 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار PP-YOLOE+

يعد PP-YOLOE+ خياراً قوياً لـ:

  • تكامل نظام PaddlePaddle البيئي: المنظمات ذات البنية التحتية الحالية المبنية على إطار عمل Baidu's PaddlePaddle والأدوات المرتبطة به.
  • نشر حافة Paddle Lite: النشر على أجهزة تحتوي على نوى استدلال مُحسَّنة للغاية خصيصًا لمحرك Paddle Lite أو محرك استدلال Paddle.
  • الكشف عالي الدقة من جانب الخادم: السيناريوهات التي تعطي الأولوية لأقصى دقة للكشف على خوادم GPU قوية حيث لا يمثل الاعتماد على إطار العمل مصدر قلق.

متى تختار YOLOv9

يُوصى بـ YOLOv9 لـ:

  • أبحاث عنق زجاجة المعلومات: المشاريع الأكاديمية التي تدرس معمارية معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
  • دراسات تحسين تدفق التدرج: الأبحاث التي تركز على فهم وتخفيف فقدان المعلومات في طبقات الشبكة العميقة أثناء التدريب.
  • قياس أداء الاكتشاف عالي الدقة: السيناريوهات التي تحتاج فيها إلى أداء قياس COCO القوي لـ YOLOv9 كنقطة مرجعية للمقارنات المعمارية.

متى تختار Ultralytics (YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطورين:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استدلالاً ثابتاً ومنخفض التأخير دون تعقيد المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئات تعتمد فقط على CPU: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث توفر سرعة استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

نظرة مستقبلية: ميزة YOLO26

بينما يعد كل من PP-YOLOE+ و YOLOv9 قويين، يمثل YOLO26 الذي تم إصداره حديثاً الخطوة التالية الحاسمة لبيئات الإنتاج. أطلق YOLO26 في يناير 2026، ويضع معياراً جديداً لحوسبة الحافة وعمليات النشر السحابية. نوصي بشدة بـ YOLO26 لجميع مشاريع رؤية الحاسوب الجديدة نظراً لابتكاراته الرائدة:

  • تصميم من طرف إلى طرف بدون NMS: يعد YOLO26 أصلاً من طرف إلى طرف، مما يلغي تماماً الحاجة إلى المعالجة اللاحقة غير القصوى (NMS). وهذا يبسط بشكل كبير خطوط أنابيب النشر ويقلل من زمن الانتقال.
  • استدلال CPU أسرع بنسبة تصل إلى 43%: من خلال تحسين البنية خصيصاً لحوسبة الحافة، يعد YOLO26 أسرع بكثير على الأجهزة التي تفتقر إلى وحدات معالجة الرسوميات (GPU) المخصصة.
  • إزالة DFL: تمت إزالة توزيع فقدان التركيز (Distribution Focal Loss)، مما يجعل عمليات التصدير أكثر بساطة ويحسن التوافق بشكل كبير مع أجهزة الحافة منخفضة الطاقة.
  • مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغات الكبيرة (مثل Kimi K2 من Moonshot AI)، يضمن هذا الهجين بين SGD و Muon ديناميكيات تدريب مستقرة للغاية وتقارباً سريعاً.
  • ProgLoss + STAL: تحقق دوال الفقد المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهي ترقية أساسية لـ الصور الجوية والروبوتات.
  • تحسينات خاصة بالمهمة: يتضمن YOLO26 بنى مخصصة لمهام محددة، مثل البروتو متعدد المقاييس للتجزئة وتقدير احتمالية السجل المتبقية (RLE) لتقدير الوضعية.

يمكنك بسهولة تدريب ونشر نماذج YOLO26 من خلال منصة Ultralytics، وهو حل متكامل لتوسيم مجموعات البيانات، والتدريب السحابي، ومراقبة النماذج.

تطبيقات العالم الحقيقي

غالباً ما يعتمد الاختيار بين هذه البنى على بيئة النشر المستهدفة الخاصة بك.

PP-YOLOE+ يُنشر بشكل متكرر في مراكز التصنيع الصناعي، خاصة في المناطق التي يكون فيها تكامل PaddlePaddle ومكدس أجهزة Baidu مدمجين بعمق في البنية التحتية للمؤسسات. وهو يتفوق في تحليل الصور الثابتة حيث تُعطى الأولوية للدقة المطلقة على قيود الوقت الفعلي الصارمة.

YOLOv9 يتفوق في البيئات الديناميكية التي تتطلب استدلالاً سريعاً في الوقت الفعلي. تجعل كفاءته المتفوقة في المعلمات منه مثالياً للملاحة الذاتية للطائرات بدون طيار وأنظمة الأمن القائمة على الحافة. علاوة على ذلك، يقلل استهلاكه المنخفض لـ VRAM من عائق الدخول للباحثين الذين يتدربون على وحدات GPU من فئة المستهلكين.

للحصول على أفضل أداء مطلق عبر إدارة حركة المرور في المدن الذكية والروبوتات عالية السرعة، فإن YOLO26 الأحدث لا مثيل له، حيث يوفر كفاءة من طرف إلى طرف دون عبء اختناقات NMS.

التعليقات