YOLOv6.0 مقابل YOLOX: تقييم أجهزة الكشف عن الأجسام الصناعية
لقد تأثر مجال الرؤية الحاسوبية بشكل كبير بالنماذج التي تهدف إلى سد الفجوة بين البحث الأكاديمي والتطبيق الصناعي. عند تقييم أطر عمل الكشف عن الأجسام المصممة خصيصًا للنشر عالي الأداء، غالبًا ما يظهر YOLOv6.YOLOv6 و YOLOX كمتنافسين بارزين. يقدم كلا النموذجين فلسفات معمارية متميزة لتعظيم الإنتاجية والدقة، لكنهما يختلفان بشكل كبير في خيارات التصميم وأهداف النشر الأساسية.
تتعمق هذه المقارنة التقنية الشاملة في البنى ومقاييس الأداء وحالات الاستخدام المثالية لـ YOLOv6. YOLOv6 و YOLOX، مع استكشاف كيفية استفادة نموذج Ultralytics من الجيل التالي من هذه الابتكارات وتجاوزها.
YOLOv6.0: الإنتاجية الصناعية
تم تطوير YOLOv6. YOLOv6 بواسطة قسم Vision AI في Meituan، ويتميز بكونه إطار عمل للكشف عن الكائنات في مرحلة واحدة ومُحسّن للتطبيقات الصناعية. ويولي أولوية كبيرة لتحقيق أقصى إنتاجية على GPU .
- المؤلفون: تشوي لي، لولو لي، ييفي جينغ، وآخرون.
- المؤسسة:Meituan
- التاريخ: 2023-01-13
- أرخايف:2301.05586
- GitHub:meituan/YOLOv6
البنية المعمارية والمنهجية
يقدم YOLOv6 وحدة تسلسل ثنائي الاتجاه (BiC) لتحسين دمج الميزات عبر مستويات مختلفة. ويستند هيكله الأساسي إلى تصميم EfficientRep، الذي تم تحسينه بشكل كبير ليتوافق مع GPU الملائمة للأجهزة، مما يجعله فعالاً بشكل خاص لبيئات المعالجة الخلفية التي تستفيد من NVIDIA TensorRT.
علاوة على ذلك، يستخدم YOLOv6. YOLOv6 استراتيجية التدريب بمساعدة المرجع (AAT). يتمتع هذا النهج المبتكر باستقرار التدريب القائم على المرجع مع الحفاظ على خط إنتاج استدلال خالٍ من المرجع، مما يجمع بشكل فعال بين أفضل ما في كلا النموذجين دون تكبد عقوبات التأخير أثناء النشر.
تخصص الأجهزة
بينما YOLOv6 على وحدات معالجة الرسومات المخصصة (GPU)، فإن بنيته المتخصصة للغاية قد تؤدي أحيانًا إلى زمن انتقال غير مثالي عند استخدامه على وحدات المعالجة المركزية (CPU) القياسية أو الأجهزة الطرفية منخفضة الطاقة.
YOLOX: سد الفجوة بين البحث والصناعة
قدمت Megvii YOLOX الذي يمثل تحولًا كبيرًا في YOLO من خلال اعتماده الكامل لتصميم خالٍ من المراسي مع استراتيجيات تدريب متقدمة مثل SimOTA.
- المؤلفون: تشنغ قه، سونغتاو ليو، فنغ وانغ، زيمينغ لي، وجيان صن
- المؤسسة:Megvii
- التاريخ: 2021-07-18
- Arxiv:2107.08430
- GitHub:Megvii-BaseDetection/YOLOX
البنية المعمارية والمنهجية
نجحت YOLOX في دمج آلية خالية من المراسي مع هيكل رأس منفصل. من خلال فصل مهام التصنيف والانحدار إلى مسارات متميزة، حسنت YOLOX بشكل كبير من سرعة التقارب وخففت من الأهداف المتضاربة التي غالبًا ما توجد في رؤوس الكشف المقترنة.
بالإضافة إلى ذلك، أدخلت YOLOX استراتيجيات قوية لتعزيز البيانات (مثل MixUp Mosaic) بشكل أصلي في خط أنابيب التدريب الخاص بها، مما أدى إلى تحسين قوتها بشكل كبير عند تدريبها من الصفر على معايير قياسية مثل COCO .
ميزة الرأس المنفصل
كان الفصل بين الرأس في YOLOX علامة فارقة مهمة، حيث ألهم الأجيال اللاحقة من نماذج الكشف من خلال إثبات أن فصل الميزات الخاصة بالمهام يؤدي إلى دقة إجمالية أعلى.
مقارنة الأداء والمقاييس
عند مقارنة هذه النماذج وجهاً لوجه، تصبح المفاضلات بين السرعة وعدد المعلمات والدقة واضحة. يوجد أدناه جدول أداء مفصل يسلط الضوء على النماذج الرئيسية من كلا العائلتين.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
بينما يقدم YOLOX نسخًا خفيفة الوزن بشكل لا يصدق مثل Nano، YOLOv6. YOLOv6 يتفوق في الأداء في النطاق العالي، حيث يوفر mAP فائقًا mAP الأكبر حجمًا TensorRT ممتازًا. ومع ذلك، يعتمد كلا النموذجين على مستودعات تدريب قديمة قد يكون من الصعب دمجها في التطبيقات الحديثة.
حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLOv6 YOLOX على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار YOLOv6
YOLOv6 خيار قوي لـ:
- النشر الصناعي المراعي للأجهزة: سيناريوهات يوفر فيها تصميم النموذج المراعي للأجهزة وإعادة تحديد المعلمات بكفاءة أداءً محسّنًا على أجهزة مستهدفة محددة.
- الكشف السريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الأولي على GPU الفيديو في الوقت الفعلي في البيئات الخاضعة للرقابة.
- تكامل نظام Meituan البيئي: فرق تعمل بالفعل ضمن مجموعة تقنيات Meituan وبنيتها التحتية للنشر.
متى تختار YOLOX
يوصى باستخدام YOLOX في الحالات التالية:
- أبحاث الكشف بدون مرساة: أبحاث أكاديمية تستخدم بنية YOLOX النظيفة والخالية من المراسي كأساس لتجربة رؤوس كشف جديدة أو وظائف خسارة.
- أجهزة طرفية فائقة الخفة: يتم نشرها على وحدات التحكم الدقيقة أو الأجهزة المحمولة القديمة حيث يكون الحجم الصغير للغاية (0.91 مليون معلمة) لنسخة YOLOX-Nano أمرًا بالغ الأهمية.
- دراسات تخصيص علامات SimOTA: مشاريع بحثية تبحث في الاستراتيجيات المثلى لتخصيص العلامات على أساس النقل وتأثيرها على تقارب التدريب.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
- كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.
Ultralytics : تقديم YOLO26
بينما دفعت YOLOv6 YOLOX حدود اكتشاف الكائنات خلال عصورهما، تتطلب الرؤية الحاسوبية الحديثة أكثر من مجرد تنبؤات الصندوق المحيط. يحتاج المطورون إلى أطر عمل موحدة وخطوط إنتاج سلسة وآليات تدريب فعالة. وهنا تبرز Ultralytics لا سيما مع طرح YOLO26.
صدر YOLO26 في يناير 2026، وهو يمثل تحولًا جذريًا. فهو يوفر أداءً لا مثيل له مع الحفاظ على نظام بيئي سهل الاستخدام للمطورين بشكل استثنائي.
ابتكارات YOLO26 الرئيسية
- تصميم شامل NMS: بناءً على المفاهيم الرائدة في YOLOv10، يلغي YOLO26 بشكل أساسي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يقلل بشكل كبير من تباين زمن الاستجابة ويبسط النشر على الحافة.
- مُحسّن MuSGD: يستعير YOLO26 ابتكارات من استقرار تدريب LLM، باستخدام مُحسّن MuSGD هجين (مستوحى من Kimi K2 من Moonshot AI). وهذا يتيح ديناميكيات تدريب مستقرة بشكل لا يصدق وتقارب أسرع مقارنة بالمُحسّنات القديمة.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : على عكس YOLOv6 الذي يواجه صعوبات علىGPU ، تم تحسين YOLO26 بشكل كبير للأجهزة الطرفية. من خلال تطبيق إزالة DFL (خسارة التركيز التوزيعي)، تم تبسيط رأس الإخراج، مما يجعله سريعًا للغاية على CPU المحمولة CPU .
- ProgLoss + STAL: تعمل وظائف الخسارة الفائقة على تحسين اكتشاف الأجسام الصغيرة بشكل كبير، وهو مجال كانت تعاني فيه البنى القديمة مثل YOLOX في كثير من الأحيان. وهذا يجعل YOLO26 مثاليًا للصور الجوية وأجهزة استشعار إنترنت الأشياء.
- تنوع لا مثيل له: في حين أن YOLOv6 YOLOX هما نموذجان للكشف فقط، فإن بنية YOLO26 الواحدة تدعم بشكل أساسي تقسيم المثيلات وتقدير الوضع وتصنيف الصور ومربعات الحدود الموجهة (OBB).
سهولة الاستخدام ودعم النظام البيئي
Ultralytics اختيار Ultralytics الوصول إلى نظام بيئي يتم صيانته جيدًا ويتم تطويره بنشاط. توفرPython Ultralytics Python تجربة "من الصفر إلى القمة"، حيث تتميز بمتطلبات ذاكرة منخفضة للغاية أثناء التدريب مقارنة بنماذج المحولات الضخمة، وتصدير سلس إلى تنسيقات مثل ONNXو OpenVINOو CoreML.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model (NMS-free design)
model = YOLO("yolo26n.pt")
# Train on a custom dataset with built-in hyperparameter tuning
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run efficient CPU or GPU inference
results = model("https://ultralytics.com/images/bus.jpg")
# Export to TensorRT for industrial deployment
model.export(format="engine")
الخلاصة والتوصيات
عند الاختيار بين YOLOv6 و YOLOX، ضع في اعتبارك قيود الأجهزة. إذا كنت تقوم ببناء أنظمة تحليل فيديو عالية الإنتاجية مدعومة NVIDIA القوية، فإن YOLOv6. YOLOv6 توفر TensorRT استثنائي. على العكس من ذلك، تظل YOLOX المفضلة تاريخياً للبيئات التي تستفيد من تصميم منفصل تماماً وخالٍ من المراسي.
ومع ذلك، بالنسبة للمطورين الذين يبحثون عن التوازن المثالي بين السرعة والدقة وسهولة الاستخدام، فإن الترقية إلى نموذج Ultralytics هي الطريق الواضح للمضي قدمًا. بفضل بنيته الشاملة NMS CPU السريعة، والدعم الشامل عبر Ultralytics فإنه يتفوق بسهولة على شبكات CNN الصناعية القديمة. بالنسبة للمستخدمين المهتمين بمتغيرات الإنتاج السابقة عالية الاستقرار، YOLO11 يظل مدعومًا بالكامل ويستخدم على نطاق واسع في تطبيقات المؤسسات.