تخطي إلى المحتوى

YOLOX مقابل PP-YOLOE+: مقارنة تقنية شاملة

عند تصميم خط أنابيب قوي للرؤية الحاسوبية ، يعد اختيار نموذج الكشف عن الكائنات المناسب قرارًا بالغ الأهمية. تتسم بيئة أجهزة الكشف عن الأجسام في الوقت الفعلي بالتنافسية الشديدة، حيث تسعى العديد من البنى إلى تحقيق التوازن المثالي بين سرعة الاستدلال ودقة الكشف. في هذه المقارنة الفنية، سنقوم بتقييم نموذجين بارزين: YOLOX و PP-YOLOE+. من خلال دراسة تصميماتهما المعمارية ومنهجيات التدريب ومقاييس الأداء، نهدف إلى تزويد المطورين والباحثين بالرؤى اللازمة لاختيار الأداة المناسبة لبيئات النشر الخاصة بهم.

الابتكارات المعمارية والتصميم

تم تصميم كلا النموذجين لمعالجة نقاط ضعف محددة في YOLO السابقة YOLO ، إلا أنهما يتبعان نهجين مختلفين تمامًا لحل مشكلة التوازن بين السرعة والدقة.

YOLOX: سد الفجوة بين البحث والصناعة

تم تطوير YOLOX بواسطة Zheng Ge و Songtao Liu و Feng Wang و Zeming Li و Jian Sun في Megvii، وتم إصداره في 18 يوليو 2021. وقد شكل هذا الإصدار تحولًا مهمًا في YOLO من خلال اعتماده الكامل لتصميم خالٍ من المراسي. يمكنك استكشاف الأبحاث الأساسية في ورقتهم البحثية الرسمية على Arxiv والكود المصدري الأصلي في مستودع YOLOX GitHub.

يدمج YOLOX رأسًا منفصلًا، يفصل بين مهام التصنيف والانحدار، مما يحسن بشكل كبير سرعة التقارب أثناء التدريب. بالإضافة إلى ذلك، أدخل استراتيجيات متقدمة لتعيين التسميات مثل SimOTA لتعيين العينات الإيجابية ديناميكيًا. وهذا يجعل النموذج عالي الكفاءة، خاصة في بيئات الذكاء الاصطناعي المتطورة حيث الموارد الحاسوبية محدودة للغاية.

تعرف على المزيد حول YOLOX

PP-YOLOE+: كشف صناعي عالي الأداء

تم تقديم PP-YOLOE+ من قبل PaddlePaddle في Baidu في 2 أبريل 2022، وهو يمثل تطورًا محسّنًا للغايةYOLO . كما هو موضح بالتفصيل في منشور Arxiv، فإن PP-YOLOE+ مدمج بعمق في نظام Baidu البيئي ويتطلب PaddlePaddle . يمكن العثور على تكوينات النموذج في مستودع PaddleDetection GitHub.

يعتمد PP-YOLOE+ على بنية أساسية قوية CSPRepResNet ويستخدم رأسًا فعالًا ومتوافقًا مع المهام (ET-head) إلى جانب تعلم مواءمة المهام (TAL). تحقق هذه البنية دقة متوسطة (mAP) متميزة في COCO مما يجعلها خيارًا رائعًا للكشف عن العيوب الصناعية والمعالجة الثقيلة من جانب الخادم حيث تُعطى الأولوية للدقة على التبعيات الدنيا.

تعرف على المزيد حول PP-YOLOE+

معايير الأداء

فهم أداء هذه النماذج على مستويات مختلفة أمر ضروري لنشرها. يوضح الجدول أدناه المقاييس الرئيسية، بما في ذلك mAP وسرعات الاستدلال عند التصدير إلى TensorRT.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

اعتبارات النشر

بينما يحقق PP-YOLOE+x أعلى دقة مطلقة، يوفر YOLOX متغيرات خفيفة للغاية (Nano و Tiny) مناسبة جدًا للميكروكونترولرات منخفضة الطاقة والأجهزة المحمولة القديمة.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLOX و PP-YOLOE+ على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار YOLOX

YOLOX هو خيار قوي لـ:

  • أبحاث الكشف بدون مرساة: أبحاث أكاديمية تستخدم بنية YOLOX النظيفة والخالية من المراسي كأساس لتجربة رؤوس كشف جديدة أو وظائف خسارة.
  • أجهزة طرفية فائقة الخفة: يتم نشرها على وحدات التحكم الدقيقة أو الأجهزة المحمولة القديمة حيث يكون الحجم الصغير للغاية (0.91 مليون معلمة) لنسخة YOLOX-Nano أمرًا بالغ الأهمية.
  • دراسات تخصيص علامات SimOTA: مشاريع بحثية تبحث في الاستراتيجيات المثلى لتخصيص العلامات على أساس النقل وتأثيرها على تقارب التدريب.

متى تختار PP-YOLOE+

يوصى باستخدام PP-YOLOE+ في الحالات التالية:

  • تكاملPaddlePaddle : المؤسسات التي تمتلك بنية تحتية قائمة مبنية على إطار عمل وأدوات PaddlePaddle من Baidu.
  • نشر Paddle Lite Edge: النشر على الأجهزة باستخدام نوى استدلال محسّنة للغاية خصيصًا لمحرك الاستدلال Paddle Lite أو Paddle.
  • الكشف عالي الدقة من جانب الخادم: سيناريوهات تعطي الأولوية لأقصى دقة في الكشف على GPU قوية حيث لا تشكل تبعية إطار العمل مشكلة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

Ultralytics : تقديم YOLO26

في حين أن كلا من YOLOX و PP-YOLOE+ يقدمان مزايا مميزة، فإن التطور السريع للذكاء الاصطناعي يتطلب أدوات تجمع بين الدقة المتطورة وسهولة الاستخدام التي لا مثيل لها. وهنا يأتي دور Ultralytics ، ولا سيما Ultralytics الذي تم إصداره مؤخرًا، تتفوق على مستودعات الأبحاث القديمة.

صدر YOLO26 في يناير 2026، ويضع معيارًا جديدًا لاكتشاف الكائنات الحديثة وما بعدها، ويوفر تجربة مطورين لا تضاهى من قبل الأطر المنافسة.

لماذا يختار المطورون YOLO26

  1. تصميم شامل NMS: بناءً على المفاهيم الرائدة في YOLOv10، فإن YOLO26 هو تصميم شامل أصلاً. من خلال إزالة معالجة ما بعد Non-Maximum Suppression (NMS) بالكامل، فإنه يضمن زمن انتقال متسق للغاية ويبسط بشكل كبير خطوط التصدير لبيئات الحافة.
  2. تحسين الجيل التالي: أحدثت أداة MuSGD Optimizer ثورة في استقرار التدريب، وهي مزيج من SGD Muon (مستوحاة من منهجيات LLM مثل Kimi K2 من Moonshot AI). وهذا يضمن تقاربًا أسرع. علاوة على ذلك، يستخدم YOLO26 ProgLoss + STAL لتحسين التعرف على الأجسام الصغيرة بشكل كبير، وهي ميزة مهمة للتطبيقات التي تتضمن الصور الجوية والروبوتات.
  3. كفاءة لا مثيل لها في الأجهزة: من خلال إزالة فقدان بؤرة التوزيع (DFL)، يقلل YOLO26 بشكل كبير من متطلبات الذاكرة. ويتميز بسرعة CPU أعلى بنسبة تصل إلى 43٪، مما يجعله الخيار الأمثل للأجهزة التي تفتقر إلى GPU .
  4. تنوع فائق: على عكس PP-YOLOE+ الذي يركز بشكل صارم على الكشف، يوفر YOLO26 دعمًا موحدًا عبر العديد من المهام. فهو يشتمل على خسارة تقسيم دلالي متخصصة لتقسيم المثال، وتقدير احتمالية السجل المتبقي (RLE) لتقدير الوضع بدقة، وآليات خسارة الزاوية المتقدمة لمربعات الحدود الموجهة (OBB).

تعرف على المزيد حول YOLO26

تكامل سلس مع النظام البيئي

Ultralytics الإحباط الناتج عن عمليات تثبيت الأطر المعقدة. باستخدام Python الموحدة أو Ultralytics البديهية، يمكنك تدريب النماذج والتحقق من صحتها وتصديرها باستخدام بضع أسطر من التعليمات البرمجية فقط.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train on a custom dataset with minimal CUDA memory overhead
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Effortlessly run inference
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX natively, fully benefiting from the NMS-free architecture
model.export(format="onnx")

بالنسبة للمستخدمين الذين يقيّمون بنى أخرى قوية ضمن Ultralytics YOLO11 خيارًا موثوقًا للغاية للنشرات القديمة، بينما يظل RT-DETR قدرات ممتازة لأولئك الذين يبحثون عن حلول قائمة على الانتباه.

ملخص

غالبًا ما يعتمد الاختيار بين YOLOX و PP-YOLOE+ على قيود إطار العمل الأساسي الخاص بك — سواء كنت تفضل المرونة PyTorch أو التكامل العميق مع PaddlePaddle من Baidu. ومع ذلك، بالنسبة للمؤسسات التي تسعى إلى تأمين مستقبل البنية التحتية للذكاء الاصطناعي لديها، يوفر Ultralytics بديلاً أفضل بكثير. بفضل تصميمه الثوري NMS وحجم الذاكرة الخفيف، وتعدد المهام الشامل، يمكّن YOLO26 الفرق من بناء تطبيقات رؤية حاسوبية أسرع وأكثر ذكاءً وكفاءةً بسهولة غير مسبوقة.


تعليقات