YOLO26 مقابل YOLOX: عصر جديد من اكتشاف الكائنات بدون مرسات
لقد اتسم تطور الرؤية الحاسوبية بقفزات معمارية كبيرة. في عام 2021، قدمت YOLOX نموذجاً مؤثراً جداً خالياً من المرساة (anchor-free) والذي جسّر الفجوة بين البحث الأكاديمي والتطبيقات الصناعية. بالانتقال إلى عام 2026، أعيد تعريف المشهد بواسطة Ultralytics YOLO، وتحديداً مع إصدار YOLO26. يستكشف هذا التقرير المقارن الشامل كيف تبني YOLO26 على الابتكارات التاريخية لتقديم أداء لا مثيل له، وتعدد استخدامات، وسهولة في التعامل.
نظرة عامة على النماذج
إن فهم أصول هذه النماذج وفلسفاتها الأساسية أمر ضروري لاتخاذ قرارات نشر مستنيرة.
تفاصيل YOLO26
- المؤلفون: Glenn Jocher و Jing Qiu
- المنظمة: Ultralytics
- التاريخ: 2026-01-14
- GitHub: مستودع Ultralytics على GitHub
- الوثائق: الوثائق الرسمية لـ YOLO26
تمثل YOLO26 قمة هندسة الذكاء الاصطناعي الحديثة، حيث تقدم تصميماً أصلياً وشاملاً (end-to-end) يزيل اختناقات المعالجة اللاحقة المعقدة. وهي محسّنة بشكل كبير لكل من عمليات النشر السحابية وعلى الحافة (edge)، وتتميز بنظام بيئي يدعم مهام متنوعة بسلاسة.
تفاصيل YOLOX
- المؤلفون: Zheng Ge، Songtao Liu، Feng Wang، Zeming Li، و Jian Sun
- المؤسسة: Megvii
- التاريخ: 2021-07-18
- Arxiv: التقرير التقني لـ YOLOX
- GitHub: مستودع YOLOX على GitHub
- التوثيق: توثيق YOLOX
كانت YOLOX خطوة كبيرة إلى الأمام، حيث قدمت رأساً مفصولاً (decoupled head) وبنية خالية من المرساة إلى جانب استراتيجية تعيين التسميات SimOTA. لقد وفرت توازناً ممتازاً بين السرعة والدقة في وقت إصدارها، مما جعلها خياراً شائعاً للعديد من الأنظمة القديمة.
الابتكارات المعمارية
تسلط الاختلافات بين YOLO26 و YOLOX الضوء على خمس سنوات من الابتكار المتواصل في تصميم التعلم العميق.
بينما ناصرت YOLOX النهج الخالي من المرساة، إلا أنها كانت لا تزال تعتمد بشكل كبير على تقنية قمع غير الأقصى (NMS) التقليدية لتصفية صناديق التحديد الزائدة. تقدم YOLO26 تصميماً شاملاً خالياً من NMS. هذا الاختراق، الذي تم إدخاله لأول مرة في YOLOv10، يلغي تماماً المعالجة اللاحقة بواسطة NMS، مما يؤدي إلى خطوط أنابيب نشر أسرع وأبسط مع تباين أقل بكثير في زمن الانتقال.
علاوة على ذلك، تتميز YOLO26 بإزالة DFL. من خلال إزالة دالة خسارة توزيع التركيز (Distribution Focal Loss)، يتم تبسيط عملية تصدير النموذج بشكل كبير، مما يضمن توافقاً استثنائياً مع أجهزة الحافة والأجهزة ذات الطاقة المنخفضة. عند دمجها مع تحسينات معمارية للنموذج، تحقق YOLO26 سرعة استدلال على CPU أسرع بنسبة تصل إلى 43% مقارنة بسابقاتها، مما يجعلها قوة دافعة للبيئات التي تفتقر إلى وحدات معالجة رسوميات (GPUs) مخصصة.
استقرار التدريب هو عامل تمييز حاسم آخر. تستخدم YOLO26 محسن MuSGD المبتكر، وهو مزيج من SGD و Muon مستوحى من ابتكارات تدريب النماذج اللغوية الكبيرة من Moonshot AI. يجلب هذا المحسن استقرار تدريب النماذج اللغوية الكبيرة إلى الرؤية الحاسوبية، مما يسهل التقارب الأسرع.
تستخدم YOLO26 ProgLoss + STAL، وهي دوال خسارة متخصصة تحقق تحسينات ملحوظة في التعرف على الكائنات الصغيرة. وهذا أمر بالغ الأهمية للمهام المعقدة مثل معالجة الصور الجوية وتحليل البيئات الكثيفة.
الأداء والمعايير
عند مقارنة هذه النماذج وجهاً لوجه على مجموعة بيانات COCO، يصبح تفوق YOLO26 في كل من الدقة والكفاءة واضحاً. تقدم نماذج Ultralytics باستمرار متطلبات ذاكرة أقل أثناء التدريب وسرعات استدلال أسرع.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ملي ثانية) | السرعة T4 TensorRT10 (ملي ثانية) | المعلمات (مليون) | FLOPs (مليار) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
ملاحظة: يحقق نموذج YOLO26x دقة 57.5 mAP مبهرة مع احتياجه لعدد أقل بكثير من المعلمات (55.7M) مقارنة بنموذج YOLOXx (99.1M)، مما يبرز كفاءة المعلمات المذهلة في بنية Ultralytics.
النظام البيئي وسهولة الاستخدام
إحدى المزايا الأكثر أهمية لاختيار YOLO26 هي النظام البيئي المدار جيداً الذي توفره Ultralytics. بينما تتطلب YOLOX التنقل في قواعد أكواد بحثية معقدة وإعدادات بيئة يدوية، تقدم Ultralytics تجربة مطور انسيابية وسريعة.
باستخدام Python API الموحدة، يمكن للمطورين التبديل بسهولة بين مهام مثل اكتشاف الكائنات، وتجزئة المثيلات، وتصنيف الصور، وتقدير الوضعية. في المقابل، تقتصر YOLOX بشكل صارم على اكتشاف صناديق التحديد.
مثال على التدريب
تدريب نموذج على مجموعة بيانات مخصصة باستخدام Ultralytics فعال بشكل ملحوظ. يقلل خط تدريب النماذج من استخدام ذاكرة CUDA، مما يسمح بأحجام دفعات (batch sizes) أكبر حتى على أجهزة المستهلك، وهو تناقض صارخ مع البنى القديمة أو نماذج المحولات (transformer) الثقيلة.
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model effortlessly with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
# Export the trained model to ONNX format for deployment
model.export(format="onnx")تعزز منصة Ultralytics هذا المسار العملي، حيث توفر تدريباً سحابياً، وتصنيفاً آلياً لمجموعات البيانات، وخيارات نشر بنقرة واحدة. إنها أداة لا غنى عنها للفرق التي تهدف إلى الانتقال من النماذج الأولية إلى الإنتاج بسرعة.
حالات الاستخدام المثالية والتطبيقات الواقعية
اختيار النموذج الصحيح يملي نجاح عملية النشر الواقعية الخاصة بك.
ذكاء الحافة و IoT
للتطبيقات التي تتطلب معالجة محلية على أجهزة محدودة، مثل أنظمة إنذار أمنية ذكية أو مستشعرات بيئية عن بعد، فإن YOLO26 هي الخيار النهائي. يعني هيكلها الخالي من NMS وتنفيذها على CPU الأسرع بنسبة 43% أنها تعمل بسلاسة على أجهزة مثل Raspberry Pi دون الحاجة إلى حلول تكميم (quantization) معقدة.
الروبوتات المستقلة
تتطلب الروبوتات دقة عالية وزمن انتقال منخفض. تسمح قدرات تقدير الوضعية في YOLO26، المدعومة بتقدير الاحتمالية اللوغاريتمية المتبقية (RLE)، للروبوتات بفهم حركية الإنسان في الوقت الفعلي. افتقار YOLOX لاكتشاف النقاط الرئيسية الأصلي يجعلها غير مناسبة لمهام التفاعل المتقدمة بين الإنسان والروبوت.
التفتيش عالي الارتفاع والجوي
عند فحص البنية التحتية عبر الطائرات بدون طيار، فإن اكتشاف العيوب الدقيقة أمر بالغ الأهمية. تحسن دوال ProgLoss و STAL في YOLO26 بشكل كبير من قدرة الاسترجاع على الكائنات الصغيرة. بالإضافة إلى ذلك، تدعم YOLO26 أصلاً صناديق التحديد الموجهة (OBB)، مع دالة خسارة زاوية متخصصة لحل مشاكل الحدود، مما يجعلها مثالية لصور الأقمار الصناعية والجوية حيث يتم تدوير الكائنات بشكل تعسفي.
عمليات النشر القديمة
قد تظل YOLOX قيد الاستخدام في البيئات القديمة حيث تم بناء خطوط أنابيب نشر C++ الحالية بشكل صريح حول مخرجات رأسها المفصول الخاص في عام 2021. ومع ذلك، بالنسبة لأي مشروع جديد، يوصى بشدة بالانتقال إلى نظام Ultralytics البيئي للاستفادة من مكاسب الأداء الحديثة والدعم المجتمعي المستمر.
استكشاف نماذج أخرى
بينما تمثل YOLO26 أحدث ما توصلت إليه التكنولوجيا، يقدم نظام Ultralytics البيئي مجموعة متنوعة من النماذج المصممة لاحتياجات محددة. للمطورين المهتمين بالبنى القائمة على المحولات (transformer)، يوفر RT-DETR نهجاً بديلاً للاكتشاف الشامل. بالإضافة إلى ذلك، تظل YOLO11 خياراً قوياً ومختبراً للغاية لبيئات الإنتاج التي تتطلب معايير تاريخية واسعة.
باختصار، يوضح الانتقال من YOLOX إلى YOLO26 التقدم السريع في هذا المجال. من خلال الجمع بين واجهة برمجة تطبيقات بديهية، ومجموعة ميزات متعددة الاستخدامات، وكفاءة لا مثيل لها، تقف YOLO26 كخيار أول للباحثين والمطورين في جميع أنحاء العالم.