YOLOX مقابل PP-YOLOE+: مقارنة تقنية شاملة

عند تصميم خط أنابيب قوي لـ رؤية حاسوبية، يُعد اختيار نموذج اكتشاف الأجسام المناسب قراراً حاسماً. يتسم مجال كاشفات الأجسام في الوقت الفعلي بالتنافسية العالية، حيث تسعى العديد من البنيات الهندسية لتقديم التوازن الأمثل بين سرعة الاستدلال ودقة الاكتشاف. في هذه المقارنة التقنية، سنقيّم نموذجين بارزين: YOLOX و PP-YOLOE+. من خلال فحص تصميماتهما المعمارية، ومنهجيات التدريب، ومقاييس الأداء، نهدف إلى تزويد المطورين والباحثين بالرؤى اللازمة لاختيار الأداة المناسبة لبيئات النشر الخاصة بهم.

الابتكارات المعمارية والتصميم

تم تصميم كلا النموذجين لمعالجة نقاط ضعف محددة في إصدارات YOLO السابقة، إلا أنهما يتبعان نهجاً مختلفاً جذرياً لحل مقايضة السرعة والدقة.

YOLOX: سد الفجوة بين البحث والصناعة

تم تطوير YOLOX بواسطة Zheng Ge و Songtao Liu و Feng Wang و Zeming Li و Jian Sun في Megvii، وصدر في 18 يوليو 2021. وقد مثّل تحولاً كبيراً في عائلة YOLO من خلال تبني تصميم خالٍ من نقاط الارتكاز (anchor-free) بالكامل. يمكنك استكشاف البحث التأسيسي في ورقة Arxiv الرسمية الخاصة بهم والكود المصدري الأصلي في مستودع YOLOX على GitHub.

يدمج YOLOX رأساً مفككاً (decoupled head)، مما يفصل بين مهام التصنيف والانحدار، وهو ما يحسن سرعة التقارب بشكل كبير أثناء التدريب. بالإضافة إلى ذلك، قدم استراتيجيات متقدمة لتخصيص التصنيفات مثل SimOTA لتعيين العينات الإيجابية ديناميكياً. هذا يجعل النموذج عالي الكفاءة، خاصة في بيئات الذكاء الاصطناعي على الحافة حيث تكون الموارد الحسابية محدودة للغاية.

اعرف المزيد عن YOLOX

PP-YOLOE+: اكتشاف صناعي عالي الأداء

تم تقديم PP-YOLOE+ بواسطة مؤلفي PaddlePaddle في Baidu في 2 أبريل 2022، ويمثل تطوراً محسناً للغاية لسلسلة PP-YOLO. تم توضيح تفاصيله في منشور Arxiv الخاص بهم، وهو مدمج بعمق في نظام Baidu البيئي ويتطلب إطار العمل PaddlePaddle. يمكن العثور على تكوينات النموذج في مستودع PaddleDetection على GitHub.

يعتمد PP-YOLOE+ على بنية أساسية قوية من نوع CSPRepResNet ويستخدم رأساً كفؤاً متوافقاً مع المهام (ET-head) إلى جانب تعلم مواءمة المهام (TAL). تحقق هذه البنية متوسط دقة متوسط (mAP) متميزاً على مجموعة بيانات COCO، مما يجعله خياراً هائلاً لاكتشاف العيوب الصناعية والمعالجة الثقيلة من جانب الخادم حيث يتم إعطاء الأولوية للدقة على حساب تقليل التبعيات.

تعرف على المزيد حول PP-YOLOE+

معايير الأداء

يعد فهم كيفية أداء هذه النماذج عبر نطاقات مختلفة أمراً أساسياً للنشر. يوضح الجدول أدناه المقاييس الرئيسية، بما في ذلك mAP وسرعات الاستدلال عند التصدير إلى TensorRT.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
اعتبارات النشر

بينما يحقق PP-YOLOE+x أعلى دقة مطلقة، يوفر YOLOX متغيرات خفيفة الوزن للغاية (Nano و Tiny) مناسبة جداً للأنظمة الدقيقة منخفضة الطاقة وأجهزة الهاتف القديمة.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLOX و PP-YOLOE+ على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار YOLOX

يعد YOLOX خياراً قوياً لـ:

  • أبحاث الاكتشاف الخالي من المراسي: البحث الأكاديمي الذي يستخدم بنية YOLOX النظيفة والخالية من المراسي كقاعدة لتجربة رؤوس اكتشاف جديدة أو دوال خسارة (loss functions).
  • أجهزة الحافة خفيفة الوزن للغاية: النشر على وحدات التحكم الدقيقة أو أجهزة الهاتف المحمول القديمة حيث يعد البصمة الصغيرة جداً لمتغير YOLOX-Nano (0.91M معامل) أمراً بالغ الأهمية.
  • دراسات تعيين التسميات SimOTA: المشاريع البحثية التي تبحث في استراتيجيات تعيين التسميات القائمة على النقل الأمثل وتأثيرها على تقارب التدريب.

متى تختار PP-YOLOE+

يوصى باستخدام PP-YOLOE+ لـ:

  • تكامل نظام PaddlePaddle البيئي: المنظمات ذات البنية التحتية الحالية المبنية على إطار عمل Baidu's PaddlePaddle والأدوات المرتبطة به.
  • نشر حافة Paddle Lite: النشر على أجهزة تحتوي على نوى استدلال مُحسَّنة للغاية خصيصًا لمحرك Paddle Lite أو محرك استدلال Paddle.
  • الكشف عالي الدقة من جانب الخادم: السيناريوهات التي تعطي الأولوية لأقصى دقة للكشف على خوادم GPU قوية حيث لا يمثل الاعتماد على إطار العمل مصدر قلق.

متى تختار Ultralytics (YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطورين:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استدلالاً ثابتاً ومنخفض التأخير دون تعقيد المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئات تعتمد فقط على CPU: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث توفر سرعة استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

ميزة Ultralytics: تقديم YOLO26

بينما يوفر كل من YOLOX و PP-YOLOE+ مزايا متميزة، فإن التطور السريع للذكاء الاصطناعي يتطلب أدوات تجمع بين أحدث ما توصلت إليه الدقة وسهولة الاستخدام التي لا تضاهى. وهنا تتفوق نماذج Ultralytics، وتحديداً Ultralytics YOLO26 الذي تم إصداره مؤخراً، على مستودعات الأبحاث القديمة.

تم إصدار YOLO26 في يناير 2026، وهو يضع معياراً جديداً لـ اكتشاف الأجسام الحديث وما بعده، ويقدم تجربة مطور لا تضاهيها أطر العمل المنافسة.

لماذا يختار المطورون YOLO26

  1. تصميم شامل (End-to-End) بدون NMS: بناءً على المفاهيم التي تم ريادتها في YOLOv10، فإن YOLO26 شامل بشكل أصلي. ومن خلال إزالة معالجة ما بعد الكبت غير الأقصى (NMS) تماماً، فإنه يضمن استجابة متسقة للغاية ويبسط خطوط أنابيب التصدير بشكل كبير لبيئات الحافة.
  2. تحسين الجيل التالي: تم إحداث ثورة في استقرار التدريب بواسطة مُحسن MuSGD، وهو مزيج من SGD و Muon (مستوحى من منهجيات النماذج اللغوية الكبيرة مثل Kimi K2 لشركة Moonshot AI). هذا يضمن تقارباً أسرع. علاوة على ذلك، يستخدم YOLO26 تقنية ProgLoss + STAL لتحسين التعرف على الأجسام الصغيرة بشكل كبير، وهي ميزة حاسمة للتطبيقات التي تتضمن التصوير الجوي والروبوتات.
  3. Unmatched Hardware Efficiency: By removing Distribution Focal Loss (DFL), YOLO26 drastically lowers memory requirements. It boasts up to 43% faster CPU inference, making it the definitive choice for devices lacking dedicated GPU acceleration.
  4. تعدد استخدامات فائق: على عكس PP-YOLOE+ الذي يركز فقط على الاكتشاف، يوفر YOLO26 دعماً موحداً عبر مهام عديدة. وهو يتضمن فقدان تقسيم دلالي متخصص لـ تقسيم المثيلات، وتقدير احتمالية السجل المتبقي (RLE) لـ تقدير الوضعية الدقيق، وآليات فقدان الزاوية المتقدمة لـ صناديق التحديد الموجهة (OBB).

اعرف المزيد عن YOLO26

تكامل سلس مع النظام البيئي

تقضي Ultralytics على إحباط عمليات تثبيت إطار العمل المعقدة. باستخدام واجهة برمجة تطبيقات Python الموحدة أو منصة Ultralytics البديهية، يمكنك تدريب النماذج والتحقق منها وتصديرها ببضعة أسطر فقط من الكود.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train on a custom dataset with minimal CUDA memory overhead
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Effortlessly run inference
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX natively, fully benefiting from the NMS-free architecture
model.export(format="onnx")

بالنسبة للمستخدمين الذين يقيّمون بنيات قوية أخرى داخل نظام Ultralytics البيئي، يظل YOLO11 خياراً موثوقاً للغاية لعمليات النشر القديمة، بينما يوفر RT-DETR القائم على المحولات قدرات ممتازة لأولئك الذين يبحثون عن حلول قائمة على الانتباه.

ملخص

يعتمد الاختيار بين YOLOX و PP-YOLOE+ غالباً على قيود إطار العمل الأساسي لديك—سواء كنت تفضل المرونة القائمة على PyTorch أو التكامل العميق مع PaddlePaddle الخاص بـ Baidu. ومع ذلك، بالنسبة للمؤسسات التي تتطلع إلى تأمين بنيتها التحتية للذكاء الاصطناعي للمستقبل، يوفر Ultralytics YOLO26 بديلاً متفوقاً بشكل كبير. بفضل تصميمه الثوري الخالي من NMS، والبصمة الذاكرية خفيفة الوزن، وتعدد استخدامات المهام الشامل، يمكّن YOLO26 الفرق من بناء تطبيقات رؤية حاسوبية أسرع وأذكى وأكثر كفاءة بسهولة غير مسبوقة.

التعليقات