YOLO11 مقابل YOLO26: تطور الذكاء الاصطناعي للرؤية في الوقت الفعلي
يتطور مجال رؤية الكمبيوتر بسرعة، وتواصل Ultralytics ريادة هذا التطور بنماذج اكتشاف الكائنات المتطورة. تستكشف هذه المقارنة التطور المعماري، ومقاييس الأداء، والتطبيقات العملية لـ YOLO11، الذي صدر في أواخر عام 2024، وYOLO26 الرائد، الذي صدر في يناير 2026. وبينما يمثل كلا النموذجين قمة الذكاء الاصطناعي للرؤية في أوقات إطلاقهما، يقدم YOLO26 تحولات معمارية مهمة تعيد تعريف الكفاءة والسرعة للنشر على الحافة.
نظرة عامة على النموذج
YOLO11
المؤلفون: Glenn Jocher و Jing Qiu
المنظمة:Ultralytics
التاريخ: 2024-09-27
GitHub:مستودع Ultralytics
الوثائق:وثائق YOLO11
يمثل YOLO11 تحسينًا كبيرًا في سلسلة YOLO، حيث يوفر تقليلًا بنسبة 22% في المعلمات مقارنةً بـ YOLOv8 مع تحسين دقة الكشف. وقد قدم تصميمًا معماريًا معززًا يوازن بين السرعة والدقة، مما يجعله خيارًا موثوقًا به لمجموعة متنوعة من مهام رؤية الكمبيوتر التي تتراوح من الكشف عن الكائنات إلى تجزئة الكائنات.
YOLO26
المؤلفون: Glenn Jocher و Jing Qiu
المنظمة:Ultralytics
التاريخ: 2026-01-14
GitHub:مستودع Ultralytics
الوثائق:وثائق YOLO26
يمثل YOLO26 نقلة نوعية بتصميمه الشامل والخالٍ من NMS بشكل أصلي، مما يلغي الحاجة إلى معالجة ما بعد قمع القيم القصوى غير الضرورية (Non-Maximum Suppression). هذا الابتكار، الذي كان رائدًا لأول مرة في YOLOv10، يبسط بشكل كبير مسارات النشر ويقلل من زمن الاستجابة. تم تحسين YOLO26 خصيصًا للحوسبة الطرفية، حيث يوفر ما يصل إلى 43% استدلال CPU أسرع ويتضمن تقنيات تدريب مبتكرة مثل مُحسِّن MuSGD—وهو هجين من SGD و Muon مستوحى من ابتكارات تدريب نماذج اللغة الكبيرة (LLM).
ميزة زمن الاستجابة الشامل
من خلال إزالة خطوة NMS، يوفر YOLO26 أوقات استدلال متسقة بغض النظر عن عدد الكائنات المكتشفة في المشهد. وهذا أمر بالغ الأهمية للتطبيقات في الوقت الفعلي مثل القيادة الذاتية، حيث يمكن أن تتسبب ارتفاعات المعالجة اللاحقة في تأخيرات خطيرة.
مقارنة الأداء
يوضح الجدول أدناه تحسينات أداء YOLO26 مقارنة بـ YOLO11. لاحظ المكاسب الكبيرة في سرعة CPU، مما يجعل YOLO26 قادرًا بشكل استثنائي على الأجهزة التي لا تحتوي على GPUs مخصصة، مثل Raspberry Pis أو الهواتف المحمولة.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
نظرة معمارية متعمقة
معمارية YOLO11
استند YOLO11 إلى مفهوم العمود الفقري CSPNet، حيث قام بتحسين طبقات استخراج الميزات لالتقاط تفاصيل أكثر دقة. وقد استخدم رأس كشف قياسي خالٍ من المراسي واعتمد على Distribution Focal Loss (DFL) لتحسين انحدار صناديق الإحاطة. ورغم فعاليته العالية، فإن الاعتماد على NMS كان يعني أن سرعة الاستدلال يمكن أن تتقلب بناءً على كثافة المشهد، وهو عنق زجاجة شائع في مراقبة المدن الذكية.
هندسة YOLO26 المعمارية
يقدم YOLO26 العديد من التغييرات الجذرية المصممة لتحقيق الكفاءة والاستقرار:
- شامل وخالٍ من NMS: يتنبأ النموذج بمجموعة ثابتة من صناديق الإحاطة مع مطابقة واحد لواحد أثناء التدريب، مما يلغي خطوة NMS الاستدلالية أثناء الاستدلال.
- إزالة DFL: تمت إزالة Distribution Focal Loss لتبسيط عملية التصدير إلى تنسيقات مثل ONNX و TensorRT، مما يعزز التوافق مع الأجهزة الطرفية منخفضة الطاقة.
- مُحسِّن MuSGD: مستوحى من Kimi K2 من Moonshot AI وتدريب نماذج اللغة الكبيرة (LLM)، يجمع هذا المُحسِّن الهجين بين SGD و Muon لضمان تقارب أسرع وتشغيل تدريب أكثر استقرارًا، مما يقلل من "ارتفاعات الخسارة" التي غالبًا ما تُرى في تدريب الرؤية واسع النطاق.
- ProgLoss + STAL: تستهدف دوال الخسارة الجديدة (Progressive Loss و Soft-Target Assignment Loss) بشكل خاص التعرف على الكائنات الصغيرة، مما يوفر دفعة هائلة لـ تحليل الصور الجوية ومستشعرات إنترنت الأشياء.
تنوع المهام
يدعم كلا النموذجين مجموعة واسعة من المهام ضمن نظام Ultralytics البيئي، مما يضمن قدرة المطورين على تبديل النماذج دون إعادة كتابة مسارات عملهم.
- الكشف: الكشف القياسي عن صناديق الإحاطة.
- التجزئة: أقنعة على مستوى البكسل. يضيف YOLO26 خسارة تجزئة دلالية محددة وبروتو متعدد المقاييس لتحسين جودة القناع.
- التصنيف: تصنيف الصورة بأكملها.
- تقدير الوضعية: الكشف عن النقاط الرئيسية. يستخدم YOLO26 تقدير الاحتمالية اللوغاريتمية المتبقية (RLE) للحصول على دقة أعلى في الوضعيات المعقدة، وهو مفيد لـ تحليلات الرياضة.
- OBB (صندوق الإحاطة الموجه): صناديق دوارة للكائنات الجوية أو المائلة. يتميز YOLO26 بخسارة زاوية متخصصة لحل مشكلات عدم استمرارية الحدود الشائعة في صور الأقمار الصناعية.
التدريب والاستخدام
إحدى السمات المميزة لـ نظام Ultralytics البيئي هي واجهة برمجة التطبيقات (API) الموحدة. سواء كنت تستخدم YOLO11 أو تقوم بالترقية إلى YOLO26، يظل الكود متطابقًا تقريبًا، مما يقلل من الديون التقنية.
مثال python
إليك كيفية تدريب نموذج YOLO26 الجديد باستخدام نفس الواجهة المألوفة المستخدمة لـ YOLO11. يوضح هذا المثال التدريب على مجموعة بيانات COCO8، وهي مجموعة بيانات صغيرة مكونة من 8 صور مثالية للاختبار.
from ultralytics import YOLO
# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model
# The MuSGD optimizer is handled automatically internally for YOLO26 models
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="cpu", # Use '0' for GPU
)
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
مثال CLI
واجهة سطر الأوامر مبسطة بنفس القدر، مما يسمح بالتجريب السريع وقياس أداء النموذج.
# Train YOLO26n on the COCO8 dataset
yolo train model=yolo26n.pt data=coco8.yaml epochs=100 imgsz=640
# Export to ONNX for simplified edge deployment
yolo export model=yolo26n.pt format=onnx
حالات الاستخدام المثالية
اختر YOLO11 إذا:
- لديك مسار إنتاج حالي مضبوط بدقة لـ YOLO11 ولا يمكنك تحمل وقت التحقق من صحة بنية جديدة.
- لدى أجهزة النشر الخاصة بك تحسينات محددة لهيكل طبقات YOLO11 لم يتم تحديثها لـ YOLO26 بعد.
اختر YOLO26 إذا:
- النشر على الحافة أمر بالغ الأهمية: إزالة NMS و DFL يجعل YOLO26 الخيار الأفضل لـ تطبيقات Android/iOS والأنظمة المدمجة حيث تكون دورات CPU ثمينة.
- الكشف عن الكائنات الصغيرة: تجعل وظائف ProgLoss و STAL النموذج أفضل بكثير لـ تحديد الآفات في الزراعة أو الكائنات البعيدة في لقطات الطائرات بدون طيار.
- استقرار التدريب: إذا كنت تقوم بالتدريب على مجموعات بيانات مخصصة ضخمة وواجهت مشكلات في التباعد، فإن مُحسِّن MuSGD في YOLO26 يوفر مسار تدريب أكثر استقرارًا.
- أبسط تصدير: تُصدّر البنية الشاملة (end-to-end) بشكل أنظف إلى تنسيقات مثل CoreML و TensorRT دون الحاجة إلى مكونات NMS الإضافية الخارجية المعقدة.
للمطورين المهتمين باستكشاف خيارات أخرى ضمن عائلة Ultralytics، فإن نماذج مثل YOLOv10 (النموذج الأولي لـ YOLO الشامل) أو YOLO-World (للكشف ذي المفردات المفتوحة) مدعومة بالكامل أيضًا.
الخلاصة
بينما يظل YOLO11 نموذجًا قويًا وذو قدرات عالية، يضع YOLO26 معيارًا جديدًا لما هو ممكن في رؤية الكمبيوتر في الوقت الفعلي. من خلال دمج ديناميكيات التدريب المستوحاة من نماذج اللغة الكبيرة (LLM) وتبسيط مسار الاستدلال عبر تصميم خالٍ من NMS، ابتكرت Ultralytics نموذجًا ليس أكثر دقة فحسب، بل أسهل بكثير في النشر في العالم الحقيقي.
يضمن نظام Ultralytics البيئي أن عملية الترقية سلسة. مع متطلبات ذاكرة أقل أثناء التدريب وسرعات CPU أسرع أثناء الاستدلال، يُعد YOLO26 نقطة البداية الموصى بها لجميع المشاريع الجديدة في عام 2026.