Link to this sectionمقارنة بين YOLOX و YOLOv6-3.0#
تحدد التطور في الرؤية الحاسوبية بشكل كبير من خلال التقدم السريع في سلسلة YOLO. غالباً ما يعتمد اختيار البنية المناسبة للنشر على الموازنة بين الإنتاجية الخام، وبساطة البنية، وكفاءة التدريب. ومن أبرز المحطات في هذه الرحلة تركيز YOLOX البحثي على التصميم الخالي من المربعات المرجعية (anchor-free) والإنتاجية الصناعية العالية المحسّنة في YOLOv6-3.0.
تستعرض هذه المقارنة التقنية الاختلافات المعمارية، ومقاييس الأداء، وحالات الاستخدام المثالية، مع تقديم قدرات الجيل التالي من Ultralytics YOLO26 للمطورين الباحثين عن حلول النشر القصوى على الحافة (edge) وفي السحابة.
Link to this sectionYOLOX: الجسر بين البحث والصناعة#
تم تطوير YOLOX بواسطة باحثين في Megvii، وقد قُدّم كتحول جذري نحو تبسيط بنية YOLO من خلال جعلها خالية تماماً من المربعات المرجعية (anchor-free).
- المؤلفون: Zheng Ge، Songtao Liu، Feng Wang، Zeming Li، Jian Sun
- المؤسسة: Megvii
- التاريخ: 2021-07-18
- Arxiv: 2107.08430
- GitHub: Megvii-BaseDetection/YOLOX
Link to this sectionأبرز ميزات البنية#
نجحت YOLOX في دمج تصميم خالٍ من المربعات المرجعية في عائلة YOLO. ومن خلال القضاء على المربعات المرجعية (anchor boxes) المحددة مسبقاً، يقلل النموذج بشكل كبير من عدد معاملات التصميم والضبط الاستدلالي المطلوب أثناء التدريب. وهذا يجعل YOLOX قابلاً للتكيف بدرجة كبيرة مع مجموعات بيانات مخصصة ومتنوعة دون الحاجة إلى إعادة حساب المربعات المرجعية يدوياً.
علاوة على ذلك، قدمت YOLOX بنية رأس (head) مفصولة. فمن خلال فصل مهام التصنيف والانحدار (regression) إلى فروع مختلفة، يحل النموذج الصراع الكامن بين تحديد ماهية الكائن ومكانه. وبالاقتران مع استراتيجية تعيين التسميات SimOTA، تحقق YOLOX تقارباً أسرع وتحسناً في متوسط الدقة (mAP).
غالباً ما يكون أداء الكاشفات الخالية من المربعات المرجعية مثل YOLOX أفضل في مجموعات البيانات المخصصة ذات نسب العرض إلى الارتفاع غير المعتادة للكائنات، لأنها لا تعتمد على مسبقات مربعات الإحاطة الثابتة التي قد لا تتوافق مع البيانات الجديدة.
Link to this sectionYOLOv6-3.0: الثقل الصناعي#
تم تطوير YOLOv6-3.0 بواسطة قسم الرؤية الحاسوبية (Vision AI) في Meituan، وهو مصمم بشكل أساسي لتحقيق أقصى قدر من الإنتاجية الصناعية، لا سيما على وحدات معالجة الرسومات NVIDIA باستخدام مسرعات الأجهزة مثل TensorRT.
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng، وآخرون.
- المنظمة: Meituan
- التاريخ: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
Link to this sectionالتحسين من أجل النشر#
يركز YOLOv6-3.0 على تعظيم استخدام GPU. وهو يقدم وحدة ربط ثنائي الاتجاه (BiC) في العنق لتعزيز دمج الميزات مع الحفاظ على سرعات استنتاج عالية. وفي حين أن مرحلة الاستنتاج خالية تماماً من المربعات المرجعية، يستخدم YOLOv6-3.0 استراتيجية مبتكرة للتدريب بمساعدة المربعات المرجعية (AAT) للاستفادة من استقرارها خلال مرحلة التدريب.
تم بناء العمود الفقري للنموذج باستخدام بنية EfficientRep الملائمة للأجهزة، والتي صُممت عمداً لتقليل تكاليف الوصول إلى الذاكرة وزيادة الكثافة الحسابية على المسرعات الحديثة. وهذا يجعل YOLOv6 مرشحاً قوياً بشكل استثنائي لتحليلات الفيديو من جانب الخادم.
Link to this sectionمقارنة الأداء#
عند مقارنة هذه النماذج، يجب على المطورين الموازنة بين الدقة الخام وسرعة الاستنتاج وعدد المعاملات. يبرز الجدول التالي أداء كلتا عائلتي النماذج عبر أحجام مختلفة.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
بينما يُظهر YOLOv6-3.0 دقة mAP فائقة وسرعات TensorRT ممتازة للإصدارات الأكبر، تظل YOLOX تنافسية للغاية بسبب بساطتها وأدائها القوي على الأجهزة القديمة.
Link to this sectionحالات الاستخدام والتوصيات#
يعتمد الاختيار بين YOLOX و YOLOv6 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
Link to this sectionمتى تختار YOLOX#
يعد YOLOX خياراً قوياً لـ:
- أبحاث الكشف بدون نقاط ارتكاز: البحث الأكاديمي الذي يستخدم بنية YOLOX النظيفة والخالية من نقاط الارتكاز كخط أساس لتجربة رؤوس كشف جديدة أو دوال خسارة مبتكرة.
- أجهزة الحافة خفيفة الوزن للغاية: النشر على وحدات التحكم الدقيقة أو أجهزة الجوال القديمة حيث يكون البصمة الصغيرة جداً لمتغير YOLOX-Nano (0.91 مليون معلمة) أمراً بالغ الأهمية.
- دراسات تخصيص التصنيفات SimOTA: المشاريع البحثية التي تبحث في استراتيجيات تخصيص التصنيفات القائمة على النقل الأمثل وتأثيرها على تقارب التدريب.
Link to this sectionمتى تختار YOLOv6#
يوصى بـ YOLOv6 لـ:
- النشر المدرك للأجهزة الصناعية: السيناريوهات التي يوفر فيها التصميم المدرك للأجهزة وإعادة تحديد المعلمات الفعال للنموذج أداءً محسناً على أجهزة مستهدفة محددة.
- الكشف السريع في مرحلة واحدة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الخام على GPU لمعالجة الفيديو الفوري في بيئات خاضعة للتحكم.
- تكامل نظام Meituan البيئي: الفرق التي تعمل بالفعل ضمن مكدس التكنولوجيا والبنية التحتية للنشر الخاصة بـ Meituan.
Link to this sectionمتى تختار Ultralytics (YOLO26)#
بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
- بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
Link to this sectionميزة Ultralytics#
في حين توفر كل من Megvii و Meituan مستودعات بحثية قوية، فإن نشر هذه النماذج في بيئة الإنتاج غالباً ما يتطلب جهداً هندسياً كبيراً. ويقضي نظام Ultralytics البيئي المدمج على هذه العقبات من خلال تقديم واجهة برمجة تطبيقات (API) موحدة وموثقة بشكل موسع.
من خلال الاستفادة من حزمة Ultralytics، يحصل المطورون على تجربة مستخدم لا تضاهى. ويشمل ذلك الزيادة التلقائية للبيانات، وإدارة فعالة جداً للذاكرة أثناء التدريب (مما يقلل بشكل كبير من متطلبات VRAM مقارنة بنماذج Transformer مثل RTDETR)، وخطوط تصدير سلسة لتنسيقات مثل ONNX و OpenVINO.
على عكس النماذج المتخصصة، تتسم بنى Ultralytics بتعدد الاستخدامات بطبيعتها، حيث تدعم اكتشاف الكائنات، وتجزئة المثيلات، وتقدير الوضعية، وتصنيف الصور، ومربعات الإحاطة الموجهة (OBB) بشكل جاهز.
Link to this sectionتقديم YOLO26: الحل الأمثل للحافة (Edge)#
بالنسبة للفرق التي تبدأ مشاريع رؤية حاسوبية جديدة، نوصي بشدة بالترقية إلى Ultralytics YOLO26 الذي تم إصداره حديثاً. وبالبناء على نجاحات YOLO11 و YOLOv8، يقدم YOLO26 ابتكارات تغير القواعد:
- End-to-End NMS-Free Design: First explored in YOLOv10, YOLO26 natively eliminates the need for Non-Maximum Suppression (NMS) post-processing. This guarantees deterministic, ultra-low latency inference critical for real-time robotics.
- محسن MuSGD: مستوحى من تقنيات تدريب النماذج اللغوية الكبيرة (LLM) مثل Kimi K2 من Moonshot AI، يستخدم YOLO26 محسن MuSGD (هجين من SGD و Muon) لتحقيق ديناميكيات تدريب مستقرة بشكل لا يصدق وتقارب أسرع.
- Up to 43% Faster CPU Inference: By removing Distribution Focal Loss (DFL) and streamlining the network head, YOLO26 is heavily optimized for edge devices relying on CPU execution, drastically outperforming YOLOv6 in edge scenarios.
- ProgLoss + STAL: These advanced loss formulations deliver remarkable improvements in small object detection, making YOLO26 ideal for aerial imagery and microscopic defect inspection.
Link to this sectionمثال على التدريب الموحد#
باستخدام واجهة برمجة تطبيقات Python الخاصة بـ Ultralytics، يتطلب تدريب أحدث النماذج بضعة أسطر فقط من التعليمات البرمجية. تنطبق نفس الواجهة النظيفة سواء كنت تختبر نموذج YOLO قديماً أو تنشر إطار عمل YOLO26 المتطور.
from ultralytics import YOLO
# Load the next-generation YOLO26 model (NMS-free, optimized for edge)
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset
# The ecosystem handles downloading, caching, and auto-batching natively
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model and print mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")
# Export the model for edge deployment
model.export(format="onnx")للحصول على تجربة أكثر سلاسة، يمكنك إدارة مجموعات البيانات الخاصة بك، وتتبع التجارب، وتدريب النماذج في السحابة باستخدام منصة Ultralytics التي لا تتطلب كتابة كود.
Link to this sectionتوصيات حالة الاستخدام#
عند اتخاذ قرار بشأن هذه البنى، ضع في اعتبارك قيود الأجهزة ومتطلبات مشروعك المحددة:
- اختر YOLOX إذا كنت تجري بحثاً أكاديمياً حول استراتيجيات تعيين التسميات أو تحتاج إلى أساس نقي وسهل الفهم وخالٍ من المربعات المرجعية لإجراء تعديلات معمارية مخصصة.
- اختر YOLOv6-3.0 إذا كنت تقوم بالنشر على خادم صناعي مزود بوحدات معالجة رسومات NVIDIA متطورة (مثل A100 أو T4) حيث يمكنك استخدام أحجام دفعات (batch sizes) كبيرة وتحسينات TensorRT لمعالجة مئات تدفقات الفيديو في وقت واحد.
- Choose YOLO26 for the vast majority of modern applications. If you are building Edge AI applications for IoT devices, drones, or mobile phones, YOLO26's native NMS-free design, CPU optimizations, and comprehensive ecosystem support make it the undisputed best choice for bridging the gap between training and production.