YOLOX مقابل PP-YOLOE+: مقارنة تقنية شاملة
عند تصميم خط أنابيب قوي للرؤية الحاسوبية ، يعد اختيار نموذج الكشف عن الكائنات المناسب قرارًا بالغ الأهمية. تتسم بيئة أجهزة الكشف عن الأجسام في الوقت الفعلي بالتنافسية الشديدة، حيث تسعى العديد من البنى إلى تحقيق التوازن المثالي بين سرعة الاستدلال ودقة الكشف. في هذه المقارنة الفنية، سنقوم بتقييم نموذجين بارزين: YOLOX و PP-YOLOE+. من خلال دراسة تصميماتهما المعمارية ومنهجيات التدريب ومقاييس الأداء، نهدف إلى تزويد المطورين والباحثين بالرؤى اللازمة لاختيار الأداة المناسبة لبيئات النشر الخاصة بهم.
الابتكارات والتصميم المعماري
تم تصميم كلا النموذجين لمعالجة نقاط ضعف محددة في تكرارات YOLO السابقة، ومع ذلك، فإنهما يتبعان منهجيات مختلفة جوهريًا لحل مفاضلة السرعة والدقة.
YOLOX: سد الفجوة بين البحث والصناعة
تم تطوير YOLOX بواسطة Zheng Ge و Songtao Liu و Feng Wang و Zeming Li و Jian Sun في Megvii، وتم إصداره في 18 يوليو 2021. وقد شكل هذا الإصدار تحولًا مهمًا في YOLO من خلال اعتماده الكامل لتصميم خالٍ من المراسي. يمكنك استكشاف الأبحاث الأساسية في ورقتهم البحثية الرسمية على Arxiv والكود المصدري الأصلي في مستودع YOLOX GitHub.
يدمج YOLOX رأسًا منفصلًا، يفصل بين مهام التصنيف والانحدار، مما يحسن بشكل كبير سرعة التقارب أثناء التدريب. بالإضافة إلى ذلك، أدخل استراتيجيات متقدمة لتعيين التسميات مثل SimOTA لتعيين العينات الإيجابية ديناميكيًا. وهذا يجعل النموذج عالي الكفاءة، خاصة في بيئات الذكاء الاصطناعي المتطورة حيث الموارد الحاسوبية محدودة للغاية.
PP-YOLOE+: كشف صناعي عالي الأداء
تم تقديم PP-YOLOE+ من قبل PaddlePaddle في Baidu في 2 أبريل 2022، وهو يمثل تطورًا محسّنًا للغايةYOLO . كما هو موضح بالتفصيل في منشور Arxiv، فإن PP-YOLOE+ مدمج بعمق في نظام Baidu البيئي ويتطلب PaddlePaddle . يمكن العثور على تكوينات النموذج في مستودع PaddleDetection GitHub.
يعتمد PP-YOLOE+ على بنية أساسية قوية CSPRepResNet ويستخدم رأسًا فعالًا ومتوافقًا مع المهام (ET-head) إلى جانب تعلم مواءمة المهام (TAL). تحقق هذه البنية دقة متوسطة (mAP) متميزة في COCO مما يجعلها خيارًا رائعًا للكشف عن العيوب الصناعية والمعالجة الثقيلة من جانب الخادم حيث تُعطى الأولوية للدقة على التبعيات الدنيا.
معايير الأداء
فهم أداء هذه النماذج على مستويات مختلفة أمر ضروري لنشرها. يوضح الجدول أدناه المقاييس الرئيسية، بما في ذلك mAP وسرعات الاستدلال عند التصدير إلى TensorRT.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
اعتبارات النشر
بينما يحقق PP-YOLOE+x أعلى دقة مطلقة، يوفر YOLOX متغيرات خفيفة للغاية (Nano و Tiny) مناسبة جدًا للميكروكونترولرات منخفضة الطاقة والأجهزة المحمولة القديمة.
حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLOX و PP-YOLOE+ على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
متى تختار YOLOX
YOLOX هو خيار قوي لـ:
- أبحاث الكشف الخالي من المراسي: أبحاث أكاديمية تستخدم بنية YOLOX النظيفة والخالية من المراسي كأساس لتجربة رؤوس كشف جديدة أو وظائف خسارة.
- أجهزة الحافة خفيفة الوزن للغاية: النشر على المتحكمات الدقيقة أو الأجهزة المحمولة القديمة حيث تعتبر البصمة الصغيرة للغاية لمتغير YOLOX-Nano (0.91 مليون معلمة) أمرًا بالغ الأهمية.
- دراسات تعيين التسميات SimOTA: مشاريع بحثية تستكشف استراتيجيات تعيين التسميات القائمة على النقل الأمثل وتأثيرها على تقارب التدريب.
متى تختار PP-YOLOE+
يوصى باستخدام PP-YOLOE+ في الحالات التالية:
- تكامل منظومة PaddlePaddle: المنظمات ذات البنية التحتية الحالية المبنية على إطار عمل وأدوات PaddlePaddle من Baidu.
- نشر Paddle Lite على الحوسبة الطرفية: النشر على أجهزة بنواة استدلال محسّنة للغاية خصيصًا لمحرك استدلال Paddle Lite أو Paddle.
- الكشف عالي الدقة من جانب الخادم: السيناريوهات التي تعطي الأولوية لأقصى دقة detect على خوادم GPU القوية حيث لا يمثل الاعتماد على الإطار مشكلة.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
- بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
- اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.
Ultralytics : تقديم YOLO26
في حين أن كلا من YOLOX و PP-YOLOE+ يقدمان مزايا مميزة، فإن التطور السريع للذكاء الاصطناعي يتطلب أدوات تجمع بين الدقة المتطورة وسهولة الاستخدام التي لا مثيل لها. وهنا يأتي دور Ultralytics ، ولا سيما Ultralytics الذي تم إصداره مؤخرًا، تتفوق على مستودعات الأبحاث القديمة.
صدر YOLO26 في يناير 2026، ويضع معيارًا جديدًا لاكتشاف الكائنات الحديثة وما بعدها، ويوفر تجربة مطورين لا تضاهى من قبل الأطر المنافسة.
لماذا يختار المطورون YOLO26
- تصميم شامل خالٍ من NMS: استنادًا إلى المفاهيم الرائدة في YOLOv10، يتميز YOLO26 بتصميم شامل أصيل. من خلال الإزالة الكاملة لمعالجة ما بعد التثبيط غير الأقصى (NMS)، فإنه يضمن زمن انتقال متسقًا للغاية ويبسط بشكل كبير مسارات التصدير لبيئات الحافة.
- تحسين الجيل التالي: يتم إحداث ثورة في استقرار التدريب بواسطة مُحسِّن MuSGD، وهو مزيج من SGD و Muon (مستوحى من منهجيات نماذج اللغة الكبيرة (LLM) مثل Kimi K2 من Moonshot AI). يضمن هذا تقاربًا أسرع. علاوة على ذلك، يستخدم YOLO26 تقنية ProgLoss + STAL لتحسين التعرف على الكائنات الصغيرة بشكل كبير، وهي ميزة حاسمة للتطبيقات التي تتضمن الصور الجوية والروبوتات.
- كفاءة عتادية لا مثيل لها: بإزالة Distribution Focal Loss (DFL)، يقلل YOLO26 بشكل كبير من متطلبات الذاكرة. ويتميز بـ استدلال أسرع بنسبة 43% على CPU، مما يجعله الخيار الأمثل للأجهزة التي تفتقر إلى تسريع GPU المخصص.
- تعدد استخدامات فائق: على عكس PP-YOLOE+ الذي يركز بشكل صارم على detect، يقدم YOLO26 دعمًا موحدًا عبر العديد من المهام. فهو يدمج خسارة تجزئة دلالية متخصصة لـ تجزئة الكائن، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لـ تقدير الوضع الدقيق، وآليات خسارة الزاوية المتقدمة لـ صناديق الإحاطة الموجهة (obb).
تكامل سلس مع النظام البيئي
Ultralytics الإحباط الناتج عن عمليات تثبيت الأطر المعقدة. باستخدام Python الموحدة أو Ultralytics البديهية، يمكنك تدريب النماذج والتحقق من صحتها وتصديرها باستخدام بضع أسطر من التعليمات البرمجية فقط.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")
# Train on a custom dataset with minimal CUDA memory overhead
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Effortlessly run inference
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX natively, fully benefiting from the NMS-free architecture
model.export(format="onnx")
بالنسبة للمستخدمين الذين يقيّمون بنى أخرى قوية ضمن Ultralytics YOLO11 خيارًا موثوقًا للغاية للنشرات القديمة، بينما يظل RT-DETR قدرات ممتازة لأولئك الذين يبحثون عن حلول قائمة على الانتباه.
ملخص
غالبًا ما يعتمد الاختيار بين YOLOX و PP-YOLOE+ على قيود الإطار الأساسي لديك—سواء كنت تفضل المرونة القائمة على PyTorch أو التكامل العميق مع PaddlePaddle من Baidu. ومع ذلك، بالنسبة للمؤسسات التي تتطلع إلى تأمين بنيتها التحتية للذكاء الاصطناعي في المستقبل، يوفر Ultralytics YOLO26 بديلاً متفوقًا للغاية. بفضل تصميمه الثوري الخالي من NMS، وبصمته الذاكرية الخفيفة، وتنوع مهامه الشامل، يمكّن YOLO26 الفرق من بناء تطبيقات رؤية حاسوبية أسرع وأكثر ذكاءً وكفاءة بسهولة غير مسبوقة.