Link to this sectionمقارنة بين PP-YOLOE+ و YOLOX#
لقد تشكل مشهد computer vision بشكل كبير من خلال التطور السريع لنماذج اكتشاف الكائنات. ومن بين المعالم البارزة في هذه الرحلة يأتي طرازا PP-YOLOE+ و YOLOX، وهما بنيتان دفعتا حدود الأداء والدقة في الوقت الفعلي. يعد فهم الفروق الدقيقة في بنيتهما، ومقايضات الأداء، وسيناريوهات النشر المثالية أمراً بالغ الأهمية للباحثين والمطورين الذين يبنون الجيل التالي من أنظمة التعرف البصري.
Link to this sectionسلالة النموذج وتفاصيله#
قبل الغوص في البنيات التقنية، من المفيد وضع سياق لأصول كلا النموذجين. تم تطوير كل منهما لمعالجة اختناقات محددة في object detection، متأثرين بشكل كبير بالمنظمات الداعمة لهما.
تفاصيل PP-YOLOE+:
- المؤلفون: مؤلفو PaddlePaddle
- المؤسسة: Baidu
- التاريخ: 2022-04-02
- Arxiv: https://arxiv.org/abs/2203.16250
- GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- Docs: PaddleDetection PP-YOLOE+ README
تفاصيل YOLOX:
- المؤلفون: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, و Jian Sun
- المنظمة: Megvii
- التاريخ: 2021-07-18
- Arxiv: https://arxiv.org/abs/2107.08430
- GitHub: https://github.com/Megvii-BaseDetection/YOLOX
- Docs: YOLOX Official Documentation
Link to this sectionالابتكارات المعمارية#
تكمن الاختلافات الجوهرية بين هذين الكاشفين في نهجهما تجاه استخراج الميزات والتنبؤ بـ BBox.
أحدث YOLOX ضجة في عام 2021 من خلال تكييف عائلة YOLO بنجاح مع تصميم anchor-free. ومن خلال إزالة anchor boxes، قلل YOLOX بشكل كبير من عدد معلمات التصميم والضبط الاستدلالي المطلوب لمجموعات البيانات المخصصة. علاوة على ذلك، قدم رأساً مفككاً (decoupled head)، والذي يفصل بين مهام التصنيف والتحديد المكاني في مسارات عصبية متميزة. أدى هذا الفصل إلى حل التعارض المتأصل بين تصنيف كائن ما وتحديد إحداثياته المكانية، مما أدى إلى تقارب أسرع أثناء التدريب.
تم تطوير PP-YOLOE+ بواسطة Baidu، وهو مُحسّن بشكل كبير لنظام PaddlePaddle. وهو يبني على سلفه، PP-YOLOv2، من خلال تقديم استراتيجية تعيين تسميات ديناميكية (TAL) وبنية أساسية (backbone) جديدة تسمى CSPRepResNet. تستفيد هذه البنية الأساسية من إعادة التقييم الهيكلي (structural re-parameterization)، مما يسمح للنموذج بالاستفادة من بنيات معقدة متعددة الفروع أثناء التدريب مع الاندماج بسلاسة في شبكة سريعة أحادية المسار للاستدلال.
تسمح إعادة التقييم الهيكلي للنموذج بالتدريب مع فروع متوازية متعددة (مما يحسن تدفق التدرج) ثم طي تلك الفروع رياضياً في طبقة تلافيفية واحدة للنشر، مما يعزز سرعات الاستدلال دون التضحية بالدقة.
Link to this sectionمقارنة الأداء والمقاييس#
عند مقارنة هذه النماذج وجهاً لوجه، يصبح من الواضح أنها تخدم نهايات مختلفة قليلاً من طيف الأداء. يحقق PP-YOLOE+ عموماً دقة مطلقة أعلى، بينما يتفوق YOLOX في توفير متغيرات خفيفة الوزن للغاية ومناسبة للأجهزة ذات القيود الشديدة.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
ملاحظة: تم تمييز أفضل قيم أداء في كل قطاع عمود ذي صلة بـ الخط العريض.
في حين يقدم YOLOX متغيرات نانو (nano) و tiny تستهلك بالكاد أي مساحة على القرص أو ذاكرة CUDA، فإن PP-YOLOE+ يتوسع بشكل جيد للغاية ليصل إلى أجهزة من فئة الخوادم، مما يجعله خياراً قوياً للتطبيقات الصناعية الثقيلة ضمن نظام Baidu البيئي.
Link to this sectionتطبيقات العالم الحقيقي#
غالباً ما يعتمد الاختيار بين هذه الأطر على متطلبات التكامل وأهداف الأجهزة.
Link to this sectionأين يتفوق YOLOX#
نظراً لطبيعته anchor-free وتوفر متغيرات الحافة المتطرفة، يعد YOLOX شائعاً في robotics ونشر وحدات التحكم الدقيقة. يسمح خط أنابيب المعالجة اللاحقة البسيط الخاص به بنقل أسهل إلى تنسيقات أجهزة NPU المخصصة مثل TensorRT و NCNN.
Link to this sectionحيث يتفوق PP-YOLOE+#
بالنسبة للمؤسسات المدمجة بعمق في مراكز التصنيع الآسيوية التي تستخدم حزمة تقنيات Baidu، يوفر PP-YOLOE+ مساراً مُحسّناً مسبقاً للنشر. إنه يتألق في سيناريوهات quality inspection عالية الدقة التي تعمل على أرفف خوادم قوية حيث تسمح قيود الوقت الفعلي الصارمة بأوزان نموذج أثقل قليلاً.
Link to this sectionحالات الاستخدام والتوصيات#
يعتمد الاختيار بين PP-YOLOE+ و YOLOX على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
Link to this sectionمتى تختار PP-YOLOE+#
يعد PP-YOLOE+ خياراً قوياً في الحالات التالية:
- التكامل مع نظام PaddlePaddle البيئي: للمؤسسات التي لديها بنية تحتية موجودة مبنية على إطار عمل Baidu's PaddlePaddle.
- النشر على أجهزة الحافة (Paddle Lite): عند النشر على أجهزة ذات أنوية استنتاج محسّنة خصيصاً لمحرك Paddle Lite أو محرك استنتاج Paddle.
- الكشف عالي الدقة من جانب الخادم: السيناريوهات التي تعطي الأولوية لأقصى دقة للكشف على خوادم GPU قوية حيث لا يمثل الاعتماد على إطار عمل معين مصدر قلق.
Link to this sectionمتى تختار YOLOX#
يوصى باستخدام YOLOX لـ:
- أبحاث الكشف بدون نقاط ارتكاز: البحث الأكاديمي الذي يستخدم بنية YOLOX النظيفة والخالية من نقاط الارتكاز كخط أساس لتجربة رؤوس كشف جديدة أو دوال خسارة مبتكرة.
- أجهزة الحافة خفيفة الوزن للغاية: النشر على وحدات التحكم الدقيقة أو أجهزة الجوال القديمة حيث يكون البصمة الصغيرة جداً لمتغير YOLOX-Nano (0.91 مليون معلمة) أمراً بالغ الأهمية.
- دراسات تخصيص التصنيفات SimOTA: المشاريع البحثية التي تبحث في استراتيجيات تخصيص التصنيفات القائمة على النقل الأمثل وتأثيرها على تقارب التدريب.
Link to this sectionمتى تختار Ultralytics (YOLO26)#
بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
- بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
Link to this sectionميزة Ultralytics: ظهور YOLO26#
بينما يمثل PP-YOLOE+ و YOLOX معالم بحثية ممتازة، فإن مشهد النشر الحديث يتطلب تجربة أكثر تماسكاً وصديقة للمطورين مع كفاءة فائقة. هذا هو المكان الذي يعيد فيه Ultralytics YOLO26 تعريف المعيار للذكاء الاصطناعي البصري الحديث بالكامل.
بالنسبة للفرق التي تتطلع إلى الانتقال من مستودعات الأبحاث المعزولة إلى أنظمة جاهزة للإنتاج، تقدم Ultralytics نظاماً بيئياً قوياً ومُصاناً جيداً. لم يعد تدريب النموذج يتطلب تكوين بيئات معقدة؛ فالأمر بسيط كبساطة الوصول إلى Python API موحد.
تشمل المزايا الرئيسية لـ Ultralytics YOLO26:
- تصميم كامل من البداية للنهاية بدون NMS: على عكس كل من PP-YOLOE+ و YOLOX، اللذين يتطلبان NMS لتصفية صناديق التحديد الزائدة، فإن YOLO26 مصمم أصلاً ليكون شاملاً من البداية للنهاية. وهذا يلغي اختناقات زمن الاستجابة ويبسط منطق النشر بشكل كبير.
- استدلال أسرع بنسبة تصل إلى 43% على CPU: من خلال إزالة Distribution Focal Loss (DFL) بشكل استراتيجي، يحقق YOLO26 سرعات استدلال لا مثيل لها على أجهزة CPU، مما يجعله متفوقاً جداً في edge computing والأجهزة منخفضة الطاقة.
- محسن MuSGD: مستوحى من Kimi K2 الخاص بـ Moonshot AI، يوفر هذا المُحسّن الهجين استقرار تدريب LLM لرؤية الكمبيوتر، مما يضمن تقارباً أسرع بكثير ويقلل من متطلبات الذاكرة أثناء مراحل التدريب.
- ProgLoss + STAL: تقدم وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهي ميزة بالغة الأهمية لعمليات drone operations والصور الجوية عالية التفاصيل.
- تعدد الاستخدامات: بينما يركز PP-YOLOE+ و YOLOX فقط على الاكتشاف، يتعامل YOLO26 بسلاسة مع instance segmentation، و pose estimation، و Oriented Bounding Boxes (OBB) باستخدام نفس الصيغة البديهية تماماً.
Link to this sectionتدريب مبسط مع Ultralytics#
كفاءة الذاكرة وسرعة التدريب لنماذج Ultralytics لا مثيل لهما، حيث تتفوق تماماً على البدائل القائمة على Transformer التي تتطلب عبئاً هائلاً على ذاكرة CUDA. يمكنك الاستفادة من قوة YOLO26 في بضعة أسطر فقط من التعليمات البرمجية:
from ultralytics import YOLO
# Load the highly efficient, end-to-end YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with built-in auto-batching and MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model's performance
metrics = model.val()
# Export seamlessly to ONNX or TensorRT
model.export(format="engine")بالنسبة للفرق التي تبحث عن حل بدون تعليمات برمجية (no-code)، توفر Ultralytics Platform تدريباً سحابياً، وتعليقات توضيحية متكاملة لمجموعات البيانات، ونشراً بنقرة واحدة لجميع نماذج YOLO الخاصة بك.
Link to this sectionالخلاصة#
لقد كسب كل من PP-YOLOE+ و YOLOX مكانهما في تاريخ رؤية الكمبيوتر، حيث يوفران دقة عالية وتصاميم خفيفة الوزن وخالية من anchor، على التوالي. ومع ذلك، بالنسبة للمؤسسات التي تبني مستقبل AI in agriculture، والمدن الذكية، وتجارة التجزئة، فإن الصيانة المستمرة، وسهولة الاستخدام، وبنية Ultralytics YOLO26 الأصلية الخالية من NMS تجعلها الخيار الذي لا جدال فيه.
إذا كنت تستكشف بنيات بديلة لمعايير محددة، فقد تجد أيضاً قيمة في مقارنة YOLO11 الأقدم أو الخيارات القائمة على Transformer مثل RT-DETR عبر وثائق Ultralytics الشاملة. من خلال الانتقال إلى نظام Ultralytics البيئي الموحد، يوفر المطورون وقتاً وموارد لا تقدر بثمن مع تحقيق نتائج متطورة على أي نشر على الحافة أو السحابة.