Meet YOLO26: next-gen vision AI.

Link to this sectionمقارنة بين YOLOX و YOLO11#

لقد كان تطور رؤية الحاسوب مدفوعاً بشكل كبير بالسعي نحو أطر عمل للكشف عن الأجسام في الوقت الفعلي توازن بين الدقة العالية وسرعة الاستنتاج. ومن أبرز المعالم في هذه الرحلة YOLOX و Ultralytics YOLO11. وعلى الرغم من أن كلا النموذجين قد قدما مساهمات كبيرة في هذا المجال، إلا أن بنيتهما الأساسية وفلسفات التصميم والأنظمة البيئية للمطورين تختلف بشكل جوهري.

تستكشف هذه المقارنة التقنية الشاملة بنيتها، ومقاييس الأداء، ومنهجيات التدريب، وسيناريوهات النشر المثالية لمساعدتك في اتخاذ قرار مستنير لمشروعك القادم في مجال الذكاء الاصطناعي.

Link to this sectionنظرة عامة على YOLOX#

تم تقديم YOLOX من قبل الباحثين Zheng Ge و Songtao Liu و Feng Wang و Zeming Li و Jian Sun في Megvii في 18 يوليو 2021، ومثل تحولاً كبيراً في سلسلة YOLO. لقد نجح في سد الفجوة بين البحث الأكاديمي والتطبيق الصناعي من خلال تقديم تصميم خالٍ من الإطارات المرجعية (anchor-free).

لمزيد من الخلفية التقنية، يمكنك مراجعة ورقة بحث YOLOX Arxiv الأصلية.

Link to this sectionالميزات المعمارية الرئيسية#

ابتعد YOLOX عن الكشف التقليدي المعتمد على الإطارات المرجعية (anchor-based) من خلال اعتماد رأس مفكك وآلية خالية من الإطارات المرجعية. قلل هذا التصميم من عدد معلمات التصميم وحسن أداء النموذج في مختلف المقاييس المرجعية. بالإضافة إلى ذلك، قدم استراتيجيات متقدمة لتعيين التسميات مثل SimOTA لتسريع عملية التدريب وتحسين التقارب.

على الرغم من أن YOLOX يوفر دقة ممتازة لوقته، إلا أنه يركز بشكل أساسي على كشف الأجسام باستخدام الصناديق المحيطة ويفتقر إلى الدعم الأصلي لمهام الرؤية المعقدة الأخرى بشكل افتراضي.

اعرف المزيد عن YOLOX

تصميم خالٍ من الإطارات المرجعية

من خلال القضاء على صناديق الإطارات المرجعية المحددة مسبقاً، قلل YOLOX بشكل كبير من الضبط التجريبي المطلوب لمجموعات البيانات المختلفة، مما جعله أساساً قوياً للبحث في المنهجيات الخالية من الإطارات المرجعية.

Link to this sectionنظرة عامة على Ultralytics YOLO11#

تم إصداره في 27 سبتمبر 2024 بواسطة Glenn Jocher و Jing Qiu في Ultralytics، وهو نموذج متطور يعيد تعريف التنوع وسهولة الاستخدام في رؤية الحاسوب. وبناءً على سنوات من الأبحاث التأسيسية، فإنه يوفر حلاً محسناً للغاية وجاهزاً للإنتاج يتفوق في مجموعة كبيرة من المهام.

Link to this sectionميزة Ultralytics#

YOLO11 ليس مجرد كاشف للأجسام؛ بل هو إطار عمل موحد يدعم تجزئة المثيلات، وتصنيف الصور، وتقدير الوضعية، وكشف الصناديق المحيطة الموجهة (OBB). وهو يتميز ببنية عالية الكفاءة تعطي الأولوية للتوازن السلس بين السرعة، وعدد المعلمات، والدقة.

علاوة على ذلك، YOLO11 مدمج بالكامل في منصة Ultralytics، والتي توفر نظاماً بيئياً مبسطاً لتعليق البيانات، وتدريب النماذج، والنشر.

تعرف على المزيد حول YOLO11

Link to this sectionمقارنة الأداء والمقاييس#

عند مقارنة هذه النماذج، يصبح توازن الأداء واضحاً. يحقق YOLO11 متوسط دقة (mAP) أعلى مع عدد أقل بكثير من المعلمات وعمليات الفاصلة العائمة (FLOPs) في معظم فئات الحجم مقارنة بنظيراته من YOLOX.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

كما تم توضيحه، تتفوق نماذج YOLO11 باستمرار على YOLOX من حيث الدقة مع الحفاظ على بصمة معلمات أصغر. على سبيل المثال، يحقق YOLO11m دقة 51.5 mAP مع 20.1 مليون معلمة فقط، بينما يحقق YOLOXx دقة مماثلة تبلغ 51.1 mAP ولكنه يتطلب 99.1 مليون معلمة هائلة. تجعل كفاءة الذاكرة هذه أثناء التدريب والاستنتاج YOLO11 مناسباً جداً للنشر على أجهزة الحافة، مع تجنب متطلبات ذاكرة CUDA الثقيلة النموذجية للنماذج الأقدم أو القائمة على Transformer مثل RT-DETR.

التدريب الفعال

تتطلب نماذج Ultralytics ذاكرة GPU أقل بكثير أثناء التدريب مقارنة بـ YOLOX والبنى القائمة على Transformer، مما يسمح للباحثين بتدريب نماذج قوية على الأجهزة الاستهلاكية القياسية.

Link to this sectionالنظام البيئي وسهولة الاستخدام#

أحد أكثر الاختلافات وضوحاً بين إطاري العمل هو تجربة المطور.

غالباً ما يتطلب YOLOX استنساخ المستودعات، وإعداد بيئات معقدة، وتشغيل وسائط سطر أوامر مطولة لتدريب وتصدير النماذج إلى تنسيقات مثل ONNX أو TensorRT.

على النقيض تماماً، يوفر Ultralytics YOLO11 واجهة برمجة تطبيقات Python و CLI بسيطة للغاية. تتعامل مكتبة Ultralytics مع تعزيز البيانات، وضبط المعلمات التشعبية، والتصدير تلقائياً.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model effortlessly on custom data
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to TensorRT for optimized deployment
model.export(format="engine")

هذا النظام البيئي الذي تتم صيانته جيداً مدعوم بـ توثيق شامل وتكامل سلس مع أدوات مثل Weights & Biases لـ تتبع التجارب.

Link to this sectionحالات الاستخدام المثالية#

غالباً ما يعتمد الاختيار بين هذه النماذج على خصوصيات بيئة النشر.

Link to this sectionمتى تستخدم YOLOX#

  • الأنظمة القديمة: إذا كان لديك خط أنابيب راسخ مبني بشكل صريح حول إطار عمل MegEngine أو نماذج كشف الأجسام من أوائل عام 2021.
  • المراجع الأكاديمية: عند إجراء أبحاث تتطلب إجراء مقارنة مباشرة مع البنى الأساسية الخالية من الإطارات المرجعية من حقبة عام 2021.

Link to this sectionمتى تستخدم YOLO11#

  • نشر الإنتاج: للتطبيقات التجارية في تجزئة البيع بالتجزئة الذكية أو أنظمة إنذار الأمان، حيث يعد الكود القوي الذي تتم صيانته والدقة العالية أموراً لا تقبل المساومة.
  • خطوط أنابيب متعددة المهام: عندما يتطلب المشروع تتبع الأجسام، وتقدير وضعية الإنسان، وتجزئة المثيلات باستخدام إطار عمل واحد وموحد.
  • أجهزة الحافة محدودة الموارد: نظراً لقلة عدد المعلمات والإنتاجية العالية، يعد YOLO11 مثالياً للنشر على Raspberry Pi أو عقد الحافة المحمولة عبر CoreML و NCNN.

Link to this sectionنظرة مستقبلية: ميزة YOLO26#

على الرغم من أن YOLO11 يمثل قفزة هائلة مقارنة بـ YOLOX، إلا أن مجال رؤية الحاسوب يتقدم بسرعة. بالنسبة للمطورين الذين يبدأون مشاريع جديدة اليوم، فإن Ultralytics YOLO26 هو التوصية النهائية.

تم إصداره في يناير 2026، يأخذ YOLO26 البراعة المعمارية لـ YOLO11 ويقدم العديد من الميزات الرائدة:

  • تصميم شامل بدون NMS: يلغي YOLO26 المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، مما يؤدي إلى بث الاستنتاج بشكل أصلي من أجل خطوط أنابيب نشر أسرع وأبسط (مفهوم تم استكشافه لأول مرة في YOLOv10).
  • أسرع بنسبة تصل إلى 43% في استنتاج CPU: من خلال إزالة Distribution Focal Loss (DFL)، يعد YOLO26 أكثر كفاءة بشكل كبير على وحدات المعالجة المركزية (CPUs) وأجهزة الحافة منخفضة الطاقة.
  • محسن MuSGD: مستوحى من ابتكارات تدريب LLM من Moonshot AI، يضمن محسن MuSGD عمليات تدريب مستقرة للغاية وتقارباً سريعاً.
  • دوال خسارة متقدمة: باستخدام ProgLoss + STAL، يحقق YOLO26 تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لـ صور الطائرات بدون طيار والروبوتات المستقلة.

بالنسبة للغالبية العظمى من مهام رؤية الحاسوب الحديثة، فإن ترقية خط الأنابيب الخاص بك للاستفادة من YOLO26 سيوفر أفضل توازن مطلق بين السرعة، والدقة، وبساطة النشر.

التعليقات