PP-YOLOE+ مقابل YOLOX: استكشاف تطور كاشفات الكائنات في الوقت الفعلي

لقد تشكل مشهد رؤية الحاسوب بشكل كبير من خلال التطور السريع لنماذج كشف الكائنات. ومن بين المحطات البارزة في هذه المسيرة PP-YOLOE+ و YOLOX، وهما بنيتان دفعتا حدود الأداء والدقة في الوقت الفعلي. إن فهم الفروق الدقيقة في بنيتهما، والمقايضات في الأداء، وسيناريوهات النشر المثالية أمر بالغ الأهمية للباحثين والمطورين الذين يبنون الجيل التالي من أنظمة التعرف البصري.

نسخة النموذج وتفاصيله

قبل الغوص في البنيات التقنية، من المفيد وضع سياق لأصول كلا النموذجين. تم تطوير كل منهما لمعالجة اختناقات محددة في كشف الكائنات، متأثرين بشدة بالمنظمات الداعمة لهما.

تفاصيل PP-YOLOE+:

تعرف على المزيد حول PP-YOLOE+

تفاصيل YOLOX:

تعرف على المزيد حول YOLOX

الابتكارات المعمارية

تكمن الاختلافات الجوهرية بين هذين الكاشفين في نهجهما تجاه استخراج الميزات والتنبؤ بصناديق الإحاطة (Bounding Box).

أحدث YOLOX ضجة في عام 2021 من خلال تكييف عائلة YOLO بنجاح مع تصميم خالٍ من المراسي (anchor-free). من خلال إزالة صناديق المراسي (anchor boxes)، قلل YOLOX بشكل كبير من عدد معلمات التصميم والضبط الاستدلالي المطلوب لمجموعات البيانات المخصصة. علاوة على ذلك، قدم نموذجًا منفصلاً للرأس (decoupled head)، والذي يفصل بين مهام التصنيف والتوطين في مسارات عصبية متميزة. حلت هذه التفرقة الصراع المتأصل بين تصنيف كائن ما وانحدار إحداثياته المكانية، مما أدى إلى تقارب أسرع أثناء التدريب.

تم تطوير PP-YOLOE+ بواسطة Baidu، وهو مُحسَّن بشكل كبير لنظام PaddlePaddle البيئي. يعتمد النموذج على سلفه، PP-YOLOv2، من خلال تقديم استراتيجية تعيين تسميات ديناميكية (TAL) وعمود فقري جديد يسمى CSPRepResNet. يستفيد هذا العمود الفقري من إعادة المعلمات الهيكلية، مما يسمح للنموذج بالاستفادة من بنيات معقدة متعددة الفروع أثناء التدريب مع الطي بسلاسة في شبكة سريعة أحادية المسار للاستنتاج.

إعادة المعلمات الهيكلية

تسمح إعادة المعلمات الهيكلية للنموذج بالتدريب باستخدام فروع متوازية متعددة (تحسين تدفق التدرج) ثم طي تلك الفروع رياضيًا في طبقة تلافيفية واحدة للنشر، مما يعزز سرعات الاستنتاج دون التضحية بالدقة.

مقارنة الأداء والمقاييس

عند مقارنة هذه النماذج وجهاً لوجه، يصبح من الواضح أنها تخدم نهايات مختلفة قليلاً من طيف الأداء. يحقق PP-YOLOE+ عموماً دقة مطلقة أعلى، بينما يتفوق YOLOX في توفير متغيرات خفيفة الوزن للغاية مناسبة للأجهزة ذات القيود الشديدة.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

ملاحظة: تم تمييز القيم ذات الأداء الأفضل في كل قطاع عمود ذي صلة بـ الخط العريض.

في حين يوفر YOLOX متغيرات نانوية (nano) وصغيرة (tiny) لا تستهلك أي مساحة قرص أو ذاكرة CUDA تقريباً، فإن PP-YOLOE+ يتوسع بشكل مذهل ليصل إلى الأجهزة من فئة الخوادم، مما يجعله خياراً قوياً للتطبيقات الصناعية الثقيلة داخل نظام Baidu البيئي.

تطبيقات العالم الحقيقي

غالباً ما يعتمد الاختيار بين هذه الأطر على متطلبات التكامل وأهداف الأجهزة.

أين يتفوق YOLOX

نظراً لطبيعته الخالية من المراسي وتوافر متغيرات الحافة القصوى، يحظى YOLOX بشعبية في الروبوتات ونشر المتحكمات الدقيقة. يسمح خط معالجة ما بعد الاستنتاج البسيط الخاص به بنقل أسهل إلى تنسيقات أجهزة NPU المخصصة مثل TensorRT و NCNN.

أين يتفوق PP-YOLOE+

بالنسبة للمؤسسات المدمجة بعمق في مراكز التصنيع الآسيوية التي تستخدم حزمة تكنولوجيا Baidu، يوفر PP-YOLOE+ مساراً مُحسَّناً مسبقاً للنشر. إنه يتألق في سيناريوهات فحص الجودة عالية الدقة التي تعمل على أرفف خوادم قوية حيث تسمح قيود الوقت الفعلي الصارمة بأوزان نموذج أثقل قليلاً.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين PP-YOLOE+ و YOLOX على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار PP-YOLOE+

يعتبر PP-YOLOE+ خياراً قوياً لـ:

  • تكامل نظام PaddlePaddle البيئي: المنظمات ذات البنية التحتية الحالية المبنية على إطار عمل Baidu's PaddlePaddle والأدوات المرتبطة به.
  • نشر حافة Paddle Lite: النشر على أجهزة تحتوي على نوى استدلال مُحسَّنة للغاية خصيصًا لمحرك Paddle Lite أو محرك استدلال Paddle.
  • الكشف عالي الدقة من جانب الخادم: السيناريوهات التي تعطي الأولوية لأقصى دقة للكشف على خوادم GPU قوية حيث لا يمثل الاعتماد على إطار العمل مصدر قلق.

متى تختار YOLOX

يُنصح بـ YOLOX من أجل:

  • أبحاث الاكتشاف الخالي من المراسي: البحث الأكاديمي الذي يستخدم بنية YOLOX النظيفة والخالية من المراسي كقاعدة لتجربة رؤوس اكتشاف جديدة أو دوال خسارة (loss functions).
  • أجهزة الحافة خفيفة الوزن للغاية: النشر على وحدات التحكم الدقيقة أو أجهزة الهاتف المحمول القديمة حيث يعد البصمة الصغيرة جداً لمتغير YOLOX-Nano (0.91M معامل) أمراً بالغ الأهمية.
  • دراسات تعيين التسميات SimOTA: المشاريع البحثية التي تبحث في استراتيجيات تعيين التسميات القائمة على النقل الأمثل وتأثيرها على تقارب التدريب.

متى تختار Ultralytics (YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطورين:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استدلالاً ثابتاً ومنخفض التأخير دون تعقيد المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئات تعتمد فقط على CPU: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث توفر سرعة استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

ميزة Ultralytics: دخول YOLO26

في حين يمثل PP-YOLOE+ و YOLOX معالم بحثية ممتازة، فإن مشهد النشر الحديث يتطلب تجربة أكثر تماسكاً وسهولة للمطورين مع كفاءة فائقة. وهنا يأتي Ultralytics YOLO26 ليعيد تعريف المعيار للذكاء الاصطناعي البصري الحديث بالكامل.

بالنسبة للفرق التي تتطلع إلى الانتقال من مستودعات الأبحاث المعزولة إلى الأنظمة الجاهزة للإنتاج، تقدم Ultralytics نظاماً بيئياً قوياً ومصاناً جيداً. لم يعد تدريب النموذج يتطلب تكوين بيئات معقدة؛ بل أصبح الأمر بسيطاً مثل الوصول إلى واجهة Python برمجية موحدة.

تشمل المزايا الرئيسية لـ Ultralytics YOLO26 ما يلي:

  • تصميم كامل من البداية إلى النهاية بدون NMS: على عكس كل من PP-YOLOE+ و YOLOX، اللذين يتطلبان خوارزمية كبت الحد الأقصى غير (NMS) لتصفية صناديق الإحاطة الزائدة، فإن YOLO26 هو نظام متكامل أصلياً. هذا يقضي على اختناقات زمن الاستجابة ويبسط منطق النشر بشكل كبير.
  • Up to 43% Faster CPU Inference: By strategically removing Distribution Focal Loss (DFL), YOLO26 achieves unparalleled inference speeds on CPU hardware, making it far superior for edge computing and low-power devices.
  • مُحسِّن MuSGD: مستوحى من Kimi K2 التابع لشركة Moonshot AI، يجلب هذا المُحسِّن الهجين استقرار تدريب النماذج اللغوية الكبيرة (LLM) إلى رؤية الحاسوب، مما يضمن تقارباً أسرع بكثير ويقلل من متطلبات الذاكرة أثناء مراحل التدريب.
  • ProgLoss + STAL: تقدم دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهي ميزة حاسمة لـ عمليات الطائرات بدون طيار والصور الجوية عالية التفاصيل.
  • تعدد الاستخدامات: بينما يركز PP-YOLOE+ و YOLOX فقط على الكشف، يتعامل YOLO26 بسلاسة مع تجزئة المثيلات، وتقدير الوضعية، وصناديق الإحاطة الموجهة (OBB) باستخدام نفس الصيغة البديهية تماماً.

اعرف المزيد عن YOLO26

تدريب انسيابي مع Ultralytics

كفاءة الذاكرة وسرعة تدريب نماذج Ultralytics لا تضاهى، حيث تتفوق تماماً على البدائل القائمة على الـ Transformer التي تتطلب حملاً زائداً هائلاً لذاكرة CUDA. يمكنك الاستفادة من قوة YOLO26 في بضعة أسطر من الكود فقط:

from ultralytics import YOLO

# Load the highly efficient, end-to-end YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with built-in auto-batching and MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

# Export seamlessly to ONNX or TensorRT
model.export(format="engine")
استكشف منصة Ultralytics

بالنسبة للفرق التي تبحث عن حل بدون كود، توفر منصة Ultralytics تدريباً سحابياً، وتعليقاً توضيحياً مدمجاً لمجموعات البيانات، ونشراً بنقرة واحدة لجميع نماذج YOLO الخاصة بك.

خاتمة

لقد كسب كل من PP-YOLOE+ و YOLOX مكانهما في تاريخ رؤية الحاسوب، حيث قدما دقة عالية وتصاميم خفيفة الوزن خالية من المراسي، على التوالي. ومع ذلك، بالنسبة للمؤسسات التي تبني مستقبل الذكاء الاصطناعي في الزراعة، والمدن الذكية، وتجارة التجزئة، فإن الصيانة المستمرة، وسهولة الاستخدام، والبنية الأصلية الخالية من NMS لـ Ultralytics YOLO26 تجعله الخيار بلا منازع.

إذا كنت تستكشف بنيات بديلة لمقاييس أداء محددة، فقد تجد أيضاً قيمة في مقارنة YOLO11 الأقدم أو الخيارات القائمة على الـ Transformer مثل RT-DETR عبر وثائق Ultralytics الشاملة. من خلال الانتقال إلى نظام Ultralytics البيئي الموحد، يوفر المطورون وقتاً وموارد لا تقدر بثمن مع تحقيق نتائج متطورة على أي نشر للحافة أو السحابة.

تعليقات