Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX مقابل YOLOv8#

شهد مجال الرؤية الحاسوبية تطورات ملحوظة في اكتشاف الأجسام في الوقت الفعلي على مدى السنوات القليلة الماضية. ومع استمرار الباحثين والمهندسين في دفع حدود الدقة والسرعة، قد يصبح التنقل بين النماذج المتاحة أمراً صعباً. يقدم هذا الدليل الشامل مقارنة تقنية متعمقة بين بنيتين مؤثرتين للغاية هما: YOLOX و Ultralytics YOLOv8.

من خلال تحليل بنيتهما الفريدة، ومنهجيات التدريب، وقدرات النشر، يمكن للمطورين اتخاذ قرارات مستنيرة عند اختيار الإطار الأمثل لمشاريع الذكاء الاصطناعي الخاصة بهم.

Link to this sectionYOLOX: الجسر بين البحث والصناعة#

برز YOLOX كنموذج محوري نجح في سد الفجوة بين البحث الأكاديمي والتطبيق الصناعي. وقد قدم تحولاً نحو التصميم الخالي من المراسٍ (anchor-free)، مما قلل بشكل كبير من عدد معلمات التصميم والضبط التجريبي المطلوب لأجهزة الكشف القائمة على المراسٍ السابقة.

تفاصيل النموذج: المؤلف: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, and Jian Sun المؤسسة: Megvii التاريخ: 2021-07-18 Arxiv: YOLOX: Exceeding YOLO Series in 2021 GitHub: Megvii-BaseDetection/YOLOX الوثائق: YOLOX Documentation

Link to this sectionأبرز ميزات البنية#

يدمج YOLOX العديد من التعديلات الرئيسية التي تميزه عن سابقيه. وأبرزها الرأس المنفصل (decoupled head)، الذي يفصل بين مهام التصنيف وانحدار الصناديق المحيطة في مسارات متميزة. هذا الاختيار المعماري يحل التعارض المتأصل بين المحاذاة المكانية المطلوبة للانحدار وثبات الترجمة المطلوب للتصنيف، مما يؤدي إلى معدل تقارب أسرع أثناء التدريب.

علاوة على ذلك، يستخدم YOLOX استراتيجية تعيين الملصقات SimOTA. تصيغ طريقة التعيين الديناميكية هذه مطابقة الأجسام الموجودة في الحقيقة مع التوقعات كمشكلة نقل مثالية، مما يقلل بشكل فعال من وقت التدريب مع تعزيز متوسط دقة الدقة (mAP). يستخدم النموذج أيضاً تقنيات قوية لزيادة البيانات، بما في ذلك MixUp و Mosaic، على الرغم من أنه يقوم بإيقافها بشكل ملحوظ خلال الحقب النهائية لاستقرار الميزات المكتسبة.

تعرف على المزيد حول YOLOX

Link to this sectionYOLOv8: معيار النظام البيئي متعدد الاستخدامات#

بناءً على سنوات من البحث المستمر، يمثل Ultralytics YOLOv8 تطوراً كبيراً في نماذج الرؤية الحاسوبية المتطورة. لقد تم تصميمه من الألف إلى الياء ليكون ليس مجرد كاشف للأجسام، بل إطار عمل شامل ومتعدد المهام قادر على التعامل مع مجموعة واسعة من تحديات التعرف البصري من خلال API سهل الوصول إليه بشكل لا يصدق.

تفاصيل النموذج: المؤلف: Glenn Jocher, Ayush Chaurasia, and Jing Qiu المؤسسة: Ultralytics التاريخ: 2023-01-10 GitHub: ultralytics/ultralytics الوثائق: YOLOv8 Documentation

Link to this sectionالتطورات المعمارية#

يقدم YOLOv8 بنية انسيابية تستبدل وحدة C3 بوحدة C2f الأكثر كفاءة، مما يعزز تدفق التدرج واستخراج الميزات دون زيادة عدد المعلمات بشكل كبير. ومثل YOLOX، يستخدم YOLOv8 تصميماً خالياً من المراسٍ ورأساً منفصلاً؛ ومع ذلك، فهو يطور حساب الخسارة من خلال دمج Distribution Focal Loss (DFL) وخسارة CIoU، مما يؤدي إلى تنبؤات أكثر دقة بالصناديق المحيطة، خاصة للأجسام الصغيرة أو المتداخلة.

نظام Ultralytics البيئي

إحدى أكبر نقاط القوة في YOLOv8 هي تكامله العميق مع نظام Ultralytics البيئي. سواء كنت تستخدم Python API الموحد أو الواجهة المرئية لـ Ultralytics Platform، فإن الانتقال من التدريب إلى النشر سلس، مع دعم تنسيقات من ONNX إلى TensorRT محلياً.

بعيداً عن اكتشاف الأجسام القياسي، يدعم YOLOv8 محلياً تجزئة المثيلات، وتصنيف الصور، وتقدير الوضعية، والصناديق المحيطة الموجهة (OBB). هذه المرونة متعددة المهام تجعله خياراً جذاباً للغاية لبيئات الإنتاج المعقدة حيث يجب صيانة أنواع متعددة من النماذج.

تعرف على المزيد حول YOLOv8

Link to this sectionمقارنة الأداء والمقاييس#

عند مقارنة هذه النماذج، يجب على المطورين النظر في المقايضات بين الدقة، وزمن انتقال الاستدلال، والعبء الحسابي. يوضح الجدول أدناه المعايير لكلا عائلتي النماذج.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

يُظهر YOLOv8 باستمرار mAP متفوقاً عبر أحجام معلمات مماثلة مع الحفاظ على سرعات GPU ممتازة. علاوة على ذلك، تشتهر نماذج Ultralytics بمتطلبات الذاكرة المنخفضة أثناء التدريب. هذه ميزة حاسمة عند توسيع أحجام الدفعات على أجهزة المستهلك، خاصة عند مقارنتها بهياكل Transformer كثيفة الموارد مثل RT-DETR التي تستهلك ذاكرة CUDA أكبر بكثير.

Link to this sectionتجربة التطوير والنشر#

غالباً ما يتطلب العمل مع قواعد التعليمات البرمجية البحثية القديمة تكوين بيئات معقدة وكتابة تعليمات برمجية مخصصة للاستدلال. وعلى العكس من ذلك، يبسط Ultralytics API هذا الأمر في بضعة أسطر فقط من Python.

from ultralytics import YOLO

# Initialize the YOLOv8 small model
model = YOLO("yolov8s.pt")

# Train the model effortlessly on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's accuracy
metrics = model.val()

# Execute inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

تعد هذه الواجهة الموحدة سمة مميزة لنظام Ultralytics البيئي الذي يتم صيانته جيداً، مما يضمن أن يقضي المطورون وقتاً أقل في تصحيح مشكلات البيئة ووقتاً أطول في تكرار حلول الرؤية الحاسوبية الخاصة بهم.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOX و YOLOv8 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOX#

يعد YOLOX خياراً قوياً لـ:

  • أبحاث الكشف بدون نقاط ارتكاز: البحث الأكاديمي الذي يستخدم بنية YOLOX النظيفة والخالية من نقاط الارتكاز كخط أساس لتجربة رؤوس كشف جديدة أو دوال خسارة مبتكرة.
  • أجهزة الحافة خفيفة الوزن للغاية: النشر على وحدات التحكم الدقيقة أو أجهزة الجوال القديمة حيث يكون البصمة الصغيرة جداً لمتغير YOLOX-Nano (0.91 مليون معلمة) أمراً بالغ الأهمية.
  • دراسات تخصيص التصنيفات SimOTA: المشاريع البحثية التي تبحث في استراتيجيات تخصيص التصنيفات القائمة على النقل الأمثل وتأثيرها على تقارب التدريب.

Link to this sectionمتى تختار YOLOv8#

يوصى بـ YOLOv8 لـ:

  • النشر متعدد المهام المتنوع: المشاريع التي تتطلب نموذجاً ثابتاً لـ الكشف، والتجزئة، والتصنيف، وتقدير الوضعية داخل نظام Ultralytics البيئي.
  • أنظمة الإنتاج الراسخة: بيئات الإنتاج الحالية المبنية بالفعل على بنية YOLOv8 مع خطوط أنابيب نشر مستقرة ومختبرة جيداً.
  • دعم مجتمعي ونظام بيئي واسع: التطبيقات التي تستفيد من دروس YOLOv8 الواسعة، والتكاملات مع أطراف ثالثة، وموارد المجتمع النشطة.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionنظرة إلى المستقبل: بنية YOLO26#

في حين يوفر YOLOv8 توازناً استثنائياً وسهولة في الاستخدام، فإن حدود الذكاء الاصطناعي تستمر في التقدم بسرعة. تم إصدار YOLO26 في يناير 2026، ويمثل المعيار النهائي للنشر الحديث على الحافة والسحابة، حيث يأخذ المفاهيم التأسيسية للأجيال السابقة ويحسنها بلا هوادة.

يقدم YOLO26 تصميماً شاملاً بدون NMS، مما يلغي تماماً خطوة معالجة ما بعد الكبح غير الأقصى التجريبي. يضمن هذا الاختراق زمن انتقال مستقراً وحتمياً عبر أهداف نشر متنوعة. علاوة على ذلك، من خلال إزالة وحدة Distribution Focal Loss (DFL) عمداً، يحقق YOLO26 استدلالاً أسرع بنسبة تصل إلى 43% على CPU، مما يجعله الخيار الأفضل على الإطلاق للأنظمة المدمجة وتطبيقات الهاتف المحمول.

كما تم إحداث ثورة في استقرار التدريب في YOLO26 من خلال دمج مُحسِّن MuSGD الجديد—وهو مزيج من SGD و Muon يسرع التقارب. جنباً إلى جنب مع دوال الخسارة الجديدة ProgLoss + STAL، يقدم YOLO26 تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لرسم خرائط الطائرات بدون طيار وأنظمة إنذار الأمن.

Link to this sectionالخاتمة والتوصيات#

عند تقييم الأطر القديمة مقابل الحلول الحديثة، يكون المسار واضحاً. بينما كان YOLOX نقطة انطلاق أساسية في الانتقال إلى منهجيات خالية من المراسٍ، فإن افتقاره إلى نظام بيئي متكامل ومتعدد المهام يحد من فائدته في بيئات الإنتاج سريعة الخطى.

بالنسبة للمطورين الذين يعطون الأولوية لتجربة سلسة، ودعم المهام المتنوع، ودعم المجتمع القوي، يظل YOLOv8 خياراً قوياً للغاية. ومع ذلك، بالنسبة لأولئك الذين يتطلعون إلى زيادة أداء الحوسبة الطرفية، والقضاء على اختناقات NMS، وتحقيق أعلى دقة ممكنة مع أحدث ابتكارات التدريب، فإن YOLO26 هو النموذج الموصى به بشكل ساحق لأي مشروع جديد للرؤية الحاسوبية.

إذا كنت مهتماً باستكشاف نماذج أخرى ضمن مجموعة Ultralytics، فقد ترغب أيضاً في مراجعة خصائص الأداء لـ YOLO11 أو القراءة عن المفاهيم الرائدة الخالية من NMS التي تم اختبارها في الأصل في YOLOv10.

التعليقات