تخطي إلى المحتوى

YOLOX ضد PP-YOLOE+: نظرة متعمقة على الكشف عن الكائنات الخالية من المرساة

في مجال الكشف عن الكائنات في الوقت الفعلي الذي يشهد تطوراً سريعاً، ظهرت البنى الهندسية الخالية من المراسي كبديل قوي للطرق التقليدية القائمة على المراسي. يقارن هذا التحليل بين نموذجين بارزين خاليين من المراسي: YOLOX (من Megvii) و PP-YOLOE+ (منPaddlePaddle). نستكشف ابتكاراتهما الهندسية الفريدة ومعايير الأداء واعتبارات النشر لمساعدة المطورين على اختيار الأداة المناسبة لتطبيقات الرؤية الحاسوبية الخاصة بهم.

في حين أن كلا الإطارين يقدمان تحسينات كبيرة مقارنة YOLO السابقة YOLO ، فإن المطورين الذين يبحثون عن منصة موحدة للتدريب والنشر وإدارة دورة الحياة غالبًا ما يلجأون إلى Ultralytics . مع إصدار YOLO26، أصبح بإمكان المستخدمين الوصول إلى كشف شامل NMS CPU أسرع بكثير CPU ، وتكامل سلس مع سير عمل MLOps الحديث.

YOLOX: البساطة تلتقي بالأداء

يمثل YOLOX، الذي تم إصداره في عام 2021، عودة إلى البساطة المعمارية. من خلال فصل رأس الكشف وإزالة صناديق التثبيت، عالج مشكلات شائعة مثل عدم توازن العينات الإيجابية/السلبية، مع تحقيق نتائج متطورة في ذلك الوقت.

تفاصيل YOLOX:
Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, and Jian Sun
Megvii
18 يوليو 2021
Arxiv | GitHub | وثائق

تعرف على المزيد حول YOLOX

الميزات المعمارية الرئيسية

  • رأس منفصل: على عكس YOLO السابقة YOLO (مثل YOLOv3) حيث كان يتم إجراء التصنيف والتحديد في رأس موحد، فإن YOLOX يفصل بين هاتين المهمتين. هذا الفصل يقلل من التضارب بين الهدفين، مما يؤدي إلى تقارب أسرع ودقة أفضل.
  • تصميم بدون نقاط ربط: من خلال توقع مربعات الحدود مباشرةً دون نقاط ربط محددة مسبقًا، يبسط YOLOX عملية التصميم، مما يلغي الحاجة إلى ضبط نقاط الربط التجريبي (على سبيل المثال، تجميع K-means على تسميات مجموعة البيانات).
  • SimOTA: استراتيجية ديناميكية لتخصيص التسميات تسمى SimOTA (Simplified Optimal Transport Assignment) تقوم تلقائيًا بتخصيص كائنات الحقيقة الأرضية للتنبؤات الأكثر ملاءمة، مما يحسن استقرار التدريب.

PP-YOLOE+: مكرر للاستخدامات الصناعية

PP-YOLOE+، وهو تطورYOLO من PaddlePaddle التابع لشركة Baidu، مصمم خصيصًا للنشر على السحابة والحافة. ويركز بشكل كبير على سرعة الاستدلال على خلفيات أجهزة معينة مثل TensorRT OpenVINO.

تفاصيل PP-YOLOE+:
PaddlePaddle
Baidu
2 أبريل 2022
Arxiv | GitHub | Docs

تعرف على المزيد حول PP-YOLOE+

الميزات المعمارية الرئيسية

  • CSPRepResNet Backbone: يجمع هذا العمود الفقري بين كفاءة CSPNet وقدرة التعلم المتبقية لـ ResNet، ويتم تحسينه باستخدام تقنيات إعادة تحديد المعلمات لتعزيز سرعة الاستدلال دون التضحية بالدقة.
  • TAL (تحسين التعلم من خلال مواءمة المهام): يحل TAL محل SimOTA، ويقوم بمواءمة درجة التصنيف وجودة تحديد الموقع بشكل صريح، مما يضمن أن عمليات الكشف عالية الثقة تتمتع أيضًا بدرجة عالية من التقاطع مع الحقيقة الأساسية (IoU).
  • رأس فعال ومتوافق مع المهام (ET-Head): هيكل رأس مبسط يقلل من العبء الحسابي مع الحفاظ على مزايا التنبؤ المنفصل.

مقارنة مقاييس الأداء

يُقارن الجدول التالي بين YOLOX و PP-YOLOE+ على COCO . ويُبرز التوازن بين حجم النموذج (المعلمات) والتكلفة الحسابية (FLOPs) وسرعة الاستدلال عبر تكوينات الأجهزة المختلفة.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

تحليل النتائج

  • الدقة: يحقق PP-YOLOE+ عمومًا درجاتmAPval أعلى عبر أحجام النماذج القابلة للمقارنة (S، M، L، X)، مستفيدًا من استراتيجية Task Alignment Learning (TAL) الأحدث.
  • نماذج خفيفة الوزن: YOLOX-Nano خفيف الوزن للغاية (0.91M params)، مما يجعله خيارًا مثاليًا للأجهزة ذات الموارد المحدودة للغاية حيث كل كيلوبايت مهم.
  • كفاءة الحوسبة: عادةً ما تُظهر نماذج PP-YOLOE+ انخفاضًا في FLOPs لمستويات دقة مماثلة، مما يشير إلى تحسين أفضل لعمليات ضرب المصفوفات الشائعة في GPU .

Ultralytics : ما وراء المعايير المرجعية

في حين أن المعايير الأولية مهمة، فإن تجربة المطور ودعم النظام البيئي أمران بالغا الأهمية لنجاح تنفيذ المشروع. وهنا يأتي دور Ultralytics ، مثل YOLO11 و YOLO26 المتطورة، تتميز عن غيرها.

سهولة الاستخدام والنظام البيئي

تعملPython Ultralytics Python على توحيد سير العمل للتدريب والتحقق والنشر. يتطلب التبديل بين النماذج تغيير سلسلة واحدة فقط، في حين أن الانتقال من YOLOX (PyTorch) إلى PP-YOLOE+ (PaddlePaddle) يتطلب تعلم أطر عمل وبنيات لغوية لواجهة برمجة التطبيقات مختلفة تمامًا.

from ultralytics import YOLO

# Load a model: Switch easily between generations
model = YOLO("yolo26n.pt")

# Train on any supported dataset with one command
results = model.train(data="coco8.yaml", epochs=100)

يستفيد مستخدمو Ultralytics أيضًا من إدارة مجموعات البيانات المتكاملة وأدوات التعليق التلقائي والتصدير بنقرة واحدة إلى تنسيقات مثل TFLite و CoreML، مما يسهل المسار من النموذج الأولي إلى الإنتاج.

توازن الأداء مع YOLO26

للمطورين الباحثين عن التوازن المثالي، يقدم YOLO26 العديد من الابتكارات التي لا توجد في YOLOX أو PP-YOLOE+:

  • NMS من البداية إلى النهاية: من خلال التخلص من المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، تقلل YOLO26 من زمن الاستدلال وتعقيد النشر.
  • MuSGD Optimizer: مستوحى من تدريب LLM، يضمن هذا المحسن الهجين تقاربًا مستقرًا وأوقات تدريب أسرع.
  • كشف محسّن للأجسام الصغيرة: بفضل ProgLoss و STAL (Soft Task Alignment Learning)، يتفوق YOLO26 في السيناريوهات الصعبة مثل الصور الجوية أو مراقبة إنترنت الأشياء.
  • CPU : تتيح إزالة فقدان التركيز التوزيعي (DFL) CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعلها مثالية للأجهزة الطرفية التي لا تحتوي على مسرعات ذكاء اصطناعي مخصصة.

لماذا تختار Ultralytics؟

عادةً ما تتطلب Ultralytics GPU أقل أثناء التدريب مقارنة بالبنى القائمة على المحولات مثل RT-DETR. هذه الكفاءة تجعل الوصول إلى أحدث تقنيات الذكاء الاصطناعي متاحًا للجميع، مما يسمح بالتدريب على أجهزة من فئة المستهلكين.

حالات الاستخدام والتوصيات

متى تختار YOLOX

YOLOX هو خيار ممتاز لـ:

  • البحث الأكاديمي: تعمل بنيتها النظيفة والخالية من المراسي كأساس مباشر لتجربة رؤوس كشف جديدة أو وظائف فقدان.
  • أجهزة Legacy Edge: يعد طراز YOLOX-Nano صغيرًا للغاية، ومناسبًا للميكروكونترولرز أو الأجهزة المحمولة القديمة التي تعاني من قيود التخزين.

متى تختار PP-YOLOE+

يوصى باستخدام PP-YOLOE+ في الحالات التالية:

  • PaddlePaddle : البنية التحتية الحالية الخاصة بك مبنية على نظام Baidu البيئي.
  • دعم الأجهزة المحددة: أنت تقوم بالنشر على أجهزة تحتوي على نوى محسّنة للغاية خصيصًا لـ Paddle Lite أو محرك الاستدلال Paddle.

متى تختار Ultralytics YOLO26)

بالنسبة لغالبية مشاريع البحوث التجارية والتطبيقية، يعد YOLO26 الخيار الأفضل للأسباب التالية:

  • تعدد الاستخدامات: على عكس YOLOX، الذي يعتبر في المقام الأول أداة كشف، Ultralytics مهام تقسيم الحالات وتقدير الوضع ومربع الحدود الموجه (OBB) ضمن نفس المكتبة.
  • جاهزية الإنتاج: الدعم الأصلي للتصدير إلى ONNXو TensorRTو OpenVINO يضمن تشغيل نموذجك بكفاءة على أي جهاز مستهدف.
  • الدعم النشط: يضمن المجتمع الضخم والتحديثات المتكررة التوافق مع أحدث CUDA Python ومسرعات الأجهزة.

تطبيقات عملية في أرض الواقع

تحليلات البيع بالتجزئة

في متاجر البيع بالتجزئة، تراقب الكاميرات الرفوف للتأكد من توفر المخزون. يعتبر YOLO26 فعالاً بشكل خاص في هذا المجال بفضل دقته العالية في التعرف على الأجسام الصغيرة (ProgLoss) CPU المنخفض، مما يتيح لمتاجر البيع بالتجزئة معالجة تدفقات الفيديو محلياً على خوادم المتاجر دون الحاجة إلى وحدات معالجة رسومات باهظة الثمن.

فحص الطائرات بدون طيار ذاتية القيادة

لأغراض التفتيش الزراعي أو التفتيش على البنية التحتية، تتطلب الطائرات بدون طيار نماذج خفيفة الوزن. في حين أن YOLOX-Nano صغيرة الحجم، فإن YOLO26n توفر ميزات أفضل، حيث توفر دقة أعلى بكثير في الكشف عن أمراض المحاصيل أو الشقوق الهيكلية مع الحفاظ على معدلات الإطارات في الوقت الفعلي على وحدات التحكم في الطيران المدمجة.

إدارة حركة المرور في المدن الذكية

يجب أن تقوم أنظمة مراقبة حركة المرور بحساب عدد المركبات والمشاة بدقة. يمكن لـ PP-YOLOE+ أن يؤدي أداءً جيدًا في هذا المجال إذا تم نشره على صناديق حافة متخصصة ومُحسّنة لـ Paddle. ومع ذلك، يبسط YOLO26 هذه العملية بفضل تصميمه NMS مما يمنع "العد المزدوج" للمركبات في حركة المرور الكثيفة — وهي مشكلة شائعة في أجهزة الكشف التقليدية القائمة على المراسي والتي تتطلب ضبطًا معقدًا بعد المعالجة.

تعرف على المزيد حول YOLO26

الخلاصة

ساهم كل من YOLOX و PP-YOLOE+ بشكل كبير في تطوير الكشف عن الكائنات. أثبت YOLOX أن البساطة الخالية من المراسي يمكن أن تحقق نتائج من الدرجة الأولى، بينما دفع PP-YOLOE+ حدود سرعة الاستدلال على أجهزة معينة. ومع ذلك، بالنسبة للحل الشامل الذي يجمع بين الدقة المتطورة وسهولة الاستخدام وخيارات النشر المتنوعة، فإن Ultralytics يبرز كمعيار حديث. ميزاته المبتكرة مثل مُحسِّن MuSGD والبنية NMS تجعله الخيار الأمثل لعام 2026 وما بعده.

لمزيد من الاستكشاف للنماذج الفعالة، يرجى مراجعة الوثائق الخاصة بـ YOLOv8 أو YOLOv10.


تعليقات