تخطي إلى المحتوى

YOLO11 YOLOX: تطور الكشف عن الأجسام عالي الأداء

شهد مجال الرؤية الحاسوبية تطورات سريعة خلال السنوات القليلة الماضية، حيث أصبحت نماذج الكشف عن الأجسام في الوقت الفعلي أكثر تطوراً. عند اختيار بنية لبيئة الإنتاج أو البحث الأكاديمي، غالباً ما يوازن المطورون بين المراحل المهمة القديمة والابتكارات الحديثة. تستكشف هذه المقارنة الشاملة الاختلافات بين Ultralytics YOLO11 و Megvii's YOLOX، وتقدم رؤى عميقة حول هندستها ومقاييس أدائها وسيناريوهات النشر المثالية.

نظرة عامة معمارية

يمثل كلا النموذجين قفزات كبيرة في اكتشاف الكائنات، لكنهما ينبعان من فلسفات تصميم مختلفة ويستهدفان تجارب مطورين متباينة.

YOLO11: المحرك متعدد المهام متعدد الاستخدامات

صدر في سبتمبر 2024 بواسطة Glenn Jocher و Jing Qiu في Ultralytics، YOLO11 كإطار عمل موحد يوازن بين الدقة العالية والكفاءة القصوى.

YOLO11 المربعات المحددة القياسية، حيث يدعم بشكل أساسي تقسيم الحالات وتصنيف الصور وتقدير الوضع وكشف المربعات المحددة الموجهة (OBB). تعمل بنيته المحسنة على تحسين استخراج الميزات لضمان الاحتفاظ بها بشكل أفضل عبر التسلسلات الهرمية المكانية المعقدة.

تعرف على المزيد حول YOLO11

YOLOX: الرائد الخالي من الـ Anchor

طور باحثون في Megvii نظام YOLOX الذي حظي باهتمام كبير في عام 2021 بفضل قدرته على سد الفجوة بين الأبحاث والتطبيقات الصناعية من خلال نهج خالٍ تمامًا من المراسي.

قدمت YOLOX رأسًا منفصلًا ونموذجًا بدون مرساة، مما أدى إلى تقليل عدد معلمات التصميم بشكل كبير وتحسين الأداء في المعايير الأكاديمية في وقت إصدارها.

تعرف على المزيد حول YOLOX

هل تعلم؟

أدى التصميم الخالي من المراسي الذي شاع بفضل YOLOX إلى إلهام العديد من البنى اللاحقة. Ultralytics هذه المفاهيم الخالية من المراسي وصقلها بشكل كبير في الإصدارات اللاحقة مثل YOLOv8 و YOLO11 دقة فائقة ومرونة في النشر.

الأداء والمقاييس

عند تقييم نماذج الكشف، يعد فحص توازن المعلمات والتكلفة الحسابية (FLOPs) ومتوسط الدقة (mAP) أمراً بالغ الأهمية لنشر النموذج في العالم الواقعي.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

كما يتضح من الجدول، يتفوق YOLO11x بشكل كبير على YOLOXx في الدقة المطلقة (54.7 mAP مقابل 51.1 mAP)، بينما يتطلب ما يقرب من نصف المعلمات (56.9 مليون مقابل 99.1 مليون). تترجم هذه الكفاءة إلى متطلبات ذاكرة أقل أثناء التدريب والاستدلال على حد سواء، مما يمثل ميزة هائلة لبيئات الإنتاج.

النظام البيئي وتجربة المطور

ميزة Ultralytics

أحد الاختلافات الجوهرية بين YOLO11 YOLOX يكمن في سهولة الاستخدام. يعمل YOLOX بشكل أساسي كقاعدة بيانات بحثية، ويتطلب تكوين بيئة معقدة، وتجميع يدوي لمشغلات C++، وحجج سطر أوامر مفصلة لبدء تدريب مجموعة البيانات المخصصة.

في تناقض صارخ، YOLO11 دمج YOLO11 بالكامل فيPython مما يوفر سير عمل مبسطًا "من الصفر إلى القمة". توفر Ultralytics أدوات شاملة لتعليق البيانات وتتبع التجارب والتدريب القائم على السحابة، مما يزيل النماذج المكررة حتى يتمكن المهندسون من التركيز على أداء النموذج.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")

علاوة على ذلك، فإن تصدير Ultralytics إلى تنسيقات مثل TensorRTأو CoreML أو OpenVINO يتطلب أمرًا واحدًا فقط، في حين أن المستودعات القديمة غالبًا ما تتطلب أدوات معقدة من جهات خارجية أو عمليات جراحية يدوية على الرسوم البيانية.

حالات الاستخدام في العالم الحقيقي

متى تفكر في YOLOX

يظل YOLOX خيارًا صالحًا للعمليات النشر المتخصصة والقديمة حيث قام المطورون بالفعل ببناء خطوط أنابيب استدلال C++ مخصصة بشكل كبير حول tensor الرأسي المحددة المنفصلة. بالإضافة إلى ذلك، سيستمر الباحثون الذين يجرون دراسات مقارنة مع أحدث البنى الهندسية لعام 2021 في استخدام YOLOX كأساس مرجعي لمجموعة البيانات.

أين يتفوق YOLO11

في جميع سيناريوهات الإنتاج الحديثة تقريبًا، YOLO11 تجربة فائقة الجودة:

  • المدن الذكية وتجارة التجزئة: نظرًا لنسبة السرعة إلى الدقة الاستثنائية، يتعامل YOLO11 مع المشاهد المزدحمة بسهولة، مما يدعم تحليلات التجزئة الآلية وأنظمة إدارة حركة المرور دون الحاجة إلى مجموعات GPU ضخمة.
  • الحوسبة الحافة: كفاءة الذاكرة العالية وخيارات التصدير القوية تجعل YOLO11 مثاليًا لعمليات نشر الذكاء الاصطناعي الحافة على أجهزة مثل Raspberry Pi أو منصات NVIDIA Jetson.
  • مسارات العمل المعقدة: إذا تطلب المشروع دمج اكتشاف الكائنات مع نقاط مفتاح الوضعية (مثل تحليلات الرياضة) أو تجزئة المثيلات الدقيقة (مثل التصوير الطبي)، فإن YOLO11 يتعامل مع جميع المهام بشكل أصلي من خلال واجهة برمجة تطبيقات موحدة.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLO11 و YOLOX على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار YOLO11

YOLO11 خيار قوي لـ:

متى تختار YOLOX

يوصى باستخدام YOLOX في الحالات التالية:

  • أبحاث الكشف الخالي من المراسي: أبحاث أكاديمية تستخدم بنية YOLOX النظيفة والخالية من المراسي كأساس لتجربة رؤوس كشف جديدة أو وظائف خسارة.
  • أجهزة الحافة خفيفة الوزن للغاية: النشر على المتحكمات الدقيقة أو الأجهزة المحمولة القديمة حيث تعتبر البصمة الصغيرة للغاية لمتغير YOLOX-Nano (0.91 مليون معلمة) أمرًا بالغ الأهمية.
  • دراسات تعيين التسميات SimOTA: مشاريع بحثية تستكشف استراتيجيات تعيين التسميات القائمة على النقل الأمثل وتأثيرها على تقارب التدريب.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
  • بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.

نظرة إلى المستقبل: قوة YOLO26

في حين أن YOLO11 خيارًا استثنائيًا، إلا أن مجال الذكاء الاصطناعي يشهد تسارعًا مستمرًا. بالنسبة للفرق التي تسعى إلى تحقيق أقصى درجات الكفاءة والاستقرار، يعد YOLO26 (الذي تم إصداره في يناير 2026) هو الخيار الأمثل لمشاريع الرؤية الحاسوبية الجديدة.

يمثل YOLO26 قفزة هائلة إلى الأمام من خلال تطبيق تصميم NMS من البداية إلى النهاية. من خلال التخلص من المعالجة اللاحقة لـ Non-Maximum Suppression (NMS) ، فإنه يزيل تمامًا تقلب زمن الاستجابة، مما يبسط بشكل كبير منطق النشر — وهو مفهوم تم طرحه لأول مرة في YOLOv10.

علاوة على ذلك، يتميز YOLO26 بإزالة DFL (توزيع الخسارة البؤرية)، مما يؤدي إلى تحسين البنية لتحقيق CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعله البطل بلا منازع للأجهزة منخفضة الطاقة والأجهزة المتطورة. كما يتم تعزيز استقرار التدريب من خلال MuSGD Optimizer،وهو مزيج مستوحى من LLM من SGD Muon يعمل على تسريع التقارب. بالاقتران مع وظائف الخسارة المتقدمة مثل ProgLoss + STAL، يتفوق YOLO26 في اكتشاف الأجسام الصغيرة في البيئات الصعبة مثل صور الطائرات بدون طيار وأجهزة استشعار الحافة IoT.

مزيد من الاستكشاف

هل ترغب في توسيع معرفتك ببنى الكشف عن الأشياء؟ استكشف إمكانات المفردات المفتوحة لـ YOLO أو انغمس في RT-DETR الموثق في نظام Ultralytics .

في الختام، في حين قدمت YOLOX مفاهيم معمارية مهمة في عام 2021، فإن مجموعة الأدوات الشاملة وكفاءة الذاكرة والأداء المتطور لـ YOLO11— وخاصة البنية الثورية لـ YOLO26 — تجعل Ultralytics الخيار الواضح للباحثين ومطوري المؤسسات اليوم.


تعليقات