YOLO11 YOLOX: تطور الكشف عن الأجسام عالي الأداء
شهد مجال الرؤية الحاسوبية تطورات سريعة خلال السنوات القليلة الماضية، حيث أصبحت نماذج الكشف عن الأجسام في الوقت الفعلي أكثر تطوراً. عند اختيار بنية لبيئة الإنتاج أو البحث الأكاديمي، غالباً ما يوازن المطورون بين المراحل المهمة القديمة والابتكارات الحديثة. تستكشف هذه المقارنة الشاملة الاختلافات بين Ultralytics YOLO11 و Megvii's YOLOX، وتقدم رؤى عميقة حول هندستها ومقاييس أدائها وسيناريوهات النشر المثالية.
نظرة عامة معمارية
يمثل كلا النموذجين قفزات كبيرة في مجال اكتشاف الكائنات، ولكنهما ينبعان من فلسفات تصميم مختلفة ويستهدفان تجارب مطورين مختلفة.
YOLO11: المحرك متعدد المهام متعدد الاستخدامات
صدر في سبتمبر 2024 بواسطة Glenn Jocher و Jing Qiu في Ultralytics، YOLO11 كإطار عمل موحد يوازن بين الدقة العالية والكفاءة القصوى.
- المؤلفون: غلين جوشر وجينغ تشيو
- المنظمة: Ultralytics
- التاريخ: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- الوثائق:https://docs.ultralytics.com/models/yolo11/
YOLO11 المربعات المحددة القياسية، حيث يدعم بشكل أساسي تقسيم الحالات وتصنيف الصور وتقدير الوضع وكشف المربعات المحددة الموجهة (OBB). تعمل بنيته المحسنة على تحسين استخراج الميزات لضمان الاحتفاظ بها بشكل أفضل عبر التسلسلات الهرمية المكانية المعقدة.
YOLOX: الرائد الخالي من الـ Anchor
طور باحثون في Megvii نظام YOLOX الذي حظي باهتمام كبير في عام 2021 بفضل قدرته على سد الفجوة بين الأبحاث والتطبيقات الصناعية من خلال نهج خالٍ تمامًا من المراسي.
- المؤلفون: تشنغ قه، سونغتاو ليو، فنغ وانغ، زيمينغ لي، وجيان صن
- المنظمة: Megvii
- التاريخ: 2021-07-18
- أرشيف:https://arxiv.org/abs/2107.08430
- GitHub:https://github.com/Megvii-BaseDetection/YOLOX
- الوثائق:https://yolox.readthedocs.io/en/latest/
قدمت YOLOX رأسًا منفصلًا ونموذجًا بدون مرساة، مما أدى إلى تقليل عدد معلمات التصميم بشكل كبير وتحسين الأداء في المعايير الأكاديمية في وقت إصدارها.
هل تعلم؟
أدى التصميم الخالي من المراسي الذي شاع بفضل YOLOX إلى إلهام العديد من البنى اللاحقة. Ultralytics هذه المفاهيم الخالية من المراسي وصقلها بشكل كبير في الإصدارات اللاحقة مثل YOLOv8 و YOLO11 دقة فائقة ومرونة في النشر.
الأداء والمقاييس
عند تقييم نماذج الكشف، يعد فحص توازن المعلمات والتكلفة الحسابية (FLOPs) ومتوسط الدقة (mAP) أمراً بالغ الأهمية لنشر النموذج في العالم الواقعي.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
كما هو موضح في الجدول، يتفوق YOLO11x بشكل ملحوظ على YOLOXx من حيث الدقة المطلقة (54.7 mAP مقابل 51.1 mAP)، بينما يتطلب حوالي نصف المعلمات (56.9 مليون مقابل 99.1 مليون). وتترجم هذه الكفاءة إلى متطلبات ذاكرة أقل أثناء التدريب والاستدلال، وهي ميزة كبيرة لبيئات الإنتاج.
النظام البيئي وتجربة المطور
ميزة Ultralytics
أحد الاختلافات الجوهرية بين YOLO11 YOLOX يكمن في سهولة الاستخدام. يعمل YOLOX بشكل أساسي كقاعدة بيانات بحثية، ويتطلب تكوين بيئة معقدة، وتجميع يدوي لمشغلات C++، وحجج سطر أوامر مفصلة لبدء تدريب مجموعة البيانات المخصصة.
في تناقض صارخ، YOLO11 دمج YOLO11 بالكامل فيPython مما يوفر سير عمل مبسطًا "من الصفر إلى القمة". توفر Ultralytics أدوات شاملة لتعليق البيانات وتتبع التجارب والتدريب القائم على السحابة، مما يزيل النماذج المكررة حتى يتمكن المهندسون من التركيز على أداء النموذج.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")
علاوة على ذلك، فإن تصدير Ultralytics إلى تنسيقات مثل TensorRTأو CoreML أو OpenVINO يتطلب أمرًا واحدًا فقط، في حين أن المستودعات القديمة غالبًا ما تتطلب أدوات معقدة من جهات خارجية أو عمليات جراحية يدوية على الرسوم البيانية.
حالات الاستخدام في العالم الحقيقي
متى تفكر في YOLOX
يظل YOLOX خيارًا صالحًا للعمليات النشر المتخصصة والقديمة حيث قام المطورون بالفعل ببناء خطوط أنابيب استدلال C++ مخصصة بشكل كبير حول tensor الرأسي المحددة المنفصلة. بالإضافة إلى ذلك، سيستمر الباحثون الذين يجرون دراسات مقارنة مع أحدث البنى الهندسية لعام 2021 في استخدام YOLOX كأساس مرجعي لمجموعة البيانات.
أين يتفوق YOLO11
في جميع سيناريوهات الإنتاج الحديثة تقريبًا، YOLO11 تجربة فائقة الجودة:
- المدن الذكية والتجزئة: بفضل نسبة السرعة إلى الدقة الاستثنائية التي تتمتع بها، YOLO11 المشاهد المزدحمة بسهولة، مما يدعم أنظمة التحليل الآلي للبيع بالتجزئة وإدارة حركة المرور دون الحاجة إلى GPU ضخمة GPU .
- الحوسبة الطرفية: بفضل كفاءة الذاكرة العالية وخيارات التصدير القوية، يعد YOLO11 لنشر الذكاء الاصطناعي الطرفي على أجهزة مثل Raspberry Pi أو منصات NVIDIA .
- خطوط الأنابيب المعقدة: إذا كان المشروع يتطلب الجمع بين اكتشاف الكائنات ونقاط المفتاح (مثل تحليلات الرياضة) أو التجزئة الدقيقة للمثيلات (مثل التصوير الطبي)، YOLO11 جميع المهام بشكل أصلي من خلال واجهة برمجة تطبيقات موحدة.
حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLO11 YOLOX على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار YOLO11
YOLO11 خيار قوي لـ:
- نشر حافة الإنتاج: التطبيقات التجارية على أجهزة مثل Raspberry Pi أو NVIDIA حيث الموثوقية والصيانة النشطة أمران بالغا الأهمية.
- تطبيقات الرؤية متعددة المهام: المشاريع التي تتطلب الكشف والتجزئة وتقدير الوضع و OBB ضمن إطار موحد واحد.
- النماذج الأولية السريعة والنشر: الفرق التي تحتاج إلى الانتقال بسرعة من جمع البيانات إلى الإنتاج باستخدام Python Ultralytics Python المبسطة.
متى تختار YOLOX
يوصى باستخدام YOLOX في الحالات التالية:
- أبحاث الكشف بدون مرساة: أبحاث أكاديمية تستخدم بنية YOLOX النظيفة والخالية من المراسي كأساس لتجربة رؤوس كشف جديدة أو وظائف خسارة.
- أجهزة طرفية فائقة الخفة: يتم نشرها على وحدات التحكم الدقيقة أو الأجهزة المحمولة القديمة حيث يكون الحجم الصغير للغاية (0.91 مليون معلمة) لنسخة YOLOX-Nano أمرًا بالغ الأهمية.
- دراسات تخصيص علامات SimOTA: مشاريع بحثية تبحث في الاستراتيجيات المثلى لتخصيص العلامات على أساس النقل وتأثيرها على تقارب التدريب.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
- كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.
نظرة إلى المستقبل: قوة YOLO26
في حين أن YOLO11 خيارًا استثنائيًا، إلا أن مجال الذكاء الاصطناعي يشهد تسارعًا مستمرًا. بالنسبة للفرق التي تسعى إلى تحقيق أقصى درجات الكفاءة والاستقرار، يعد YOLO26 (الذي تم إصداره في يناير 2026) هو الخيار الأمثل لمشاريع الرؤية الحاسوبية الجديدة.
يمثل YOLO26 قفزة هائلة إلى الأمام من خلال تطبيق تصميم NMS من البداية إلى النهاية. من خلال التخلص من المعالجة اللاحقة لـ Non-Maximum Suppression (NMS) ، فإنه يزيل تمامًا تقلب زمن الاستجابة، مما يبسط بشكل كبير منطق النشر — وهو مفهوم تم طرحه لأول مرة في YOLOv10.
علاوة على ذلك، يتميز YOLO26 بإزالة DFL (توزيع الخسارة البؤرية)، مما يؤدي إلى تحسين البنية لتحقيق CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعله البطل بلا منازع للأجهزة منخفضة الطاقة والأجهزة المتطورة. كما يتم تعزيز استقرار التدريب من خلال MuSGD Optimizer،وهو مزيج مستوحى من LLM من SGD Muon يعمل على تسريع التقارب. بالاقتران مع وظائف الخسارة المتقدمة مثل ProgLoss + STAL، يتفوق YOLO26 في اكتشاف الأجسام الصغيرة في البيئات الصعبة مثل صور الطائرات بدون طيار وأجهزة استشعار الحافة IoT.
مزيد من الاستكشاف
هل ترغب في توسيع معرفتك ببنى الكشف عن الأشياء؟ استكشف إمكانات المفردات المفتوحة لـ YOLO أو انغمس في RT-DETR الموثق في نظام Ultralytics .
في الختام، في حين قدمت YOLOX مفاهيم معمارية مهمة في عام 2021، فإن مجموعة الأدوات الشاملة وكفاءة الذاكرة والأداء المتطور لـ YOLO11— وخاصة البنية الثورية لـ YOLO26 — تجعل Ultralytics الخيار الواضح للباحثين ومطوري المؤسسات اليوم.