YOLO26 مقابل YOLO11: قفزة جيلية في مجال الذكاء الاصطناعي للرؤية
عند بناء أنظمة رؤية حاسوبية متطورة، يعد اختيار النموذج المناسب أمراً بالغ الأهمية لتحقيق التوازن بين الدقة والكمون وكفاءة الموارد. في عالم الذكاء الاصطناعي سريع التطور، Ultralytics تواصل تخطي حدود الممكن. تستكشف هذه المقارنة التقنية التفصيلية الانتقال من نموذج YOLO11 إلى النموذج الثوري الجديد YOLO26، مما يوفر لمهندسي وباحثي الذكاء الاصطناعي الرؤى اللازمة لاتخاذ قرارات هندسية مستنيرة.
سلسلة النماذج والبيانات الوصفية
تم تطوير كلا النموذجين بواسطة Ultralytics لكنهما يمثلان نماذج مختلفة في الجدول الزمني لاكتشاف الكائنات ونماذج الرؤية متعددة المهام.
تفاصيل YOLO26:
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2026-01-14
- GitHub:Ultralytics Repository
- المستندات:الوثائق الرسمية لـ YOLO26
YOLO11 :
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2024-09-27
- GitHub:Ultralytics Repository
- المستندات:الوثائقYOLO11
الهياكل الأخرى
في حين أن YOLO26 هو نموذجنا الأكثر تقدمًا في الوقت الفعلي، يمكن للمستخدمين الذين يتعاملون مع أجهزة متخصصة للغاية أو سعات ذاكرة ضخمة استكشاف البنى القائمة على المحولات مثل RT-DETR أو الرائد المبتكر NMSYOLOv10.
الاختلافات والابتكارات المعمارية
ينطوي الانتقال من YOLO11 YOLO26 على تغييرات جوهرية في كل من بنية النموذج ونظام التدريب الأساسي. في حين أن YOLO11 أساسًا قويًا لاكتشاف الكائنات والتعلم متعدد المهام، فإن YOLO26 قد أحدث تغييرًا جذريًا في خط أنابيب النشر للحوسبة الطرفية.
تصميم شامل خالٍ من NMS
أحد أهم التحسينات في YOLO26 هو بنيته الأصلية الشاملة. على عكس YOLO11، الذي يعتمد على المعالجة اللاحقة لـ Non-Maximum Suppression (NMS) لتصفية المربعات المتداخلة، فإن YOLO26 يلغي هذه الخطوة تمامًا. هذا المفهوم، الذي تم طرحه لأول مرة في YOLOv10، يقلل بشكل كبير من تقلب زمن الاستجابة ويبسط منطق النشر عبر أجهزة الحافة المتنوعة.
إزالة DFL لتحسين كفاءة الحافة
YOLO11 خسارة التركيز التوزيعي (DFL) لتحسين تقديرات مربع الحدود. ومع ذلك، تعتمد DFL على عمليات softmax معقدة غالبًا ما تكون غير مدعومة بشكل جيد من قبل مسرعات الحافة منخفضة الطاقة. نجح YOLO26 في إزالة DFL دون التضحية بالدقة. أدى تبسيط البنية هذا إلى تحسين التوافق بشكل كبير مع الأنظمة المدمجة وسمح لـ YOLO26 بتحقيق CPU أسرع بنسبة تصل إلى 43٪ مقارنة بسابقه.
مُحسّن MuSGD
يعد استقرار التدريب وسرعته أمرين بالغين الأهمية. يقدم YOLO26 مُحسِّن MuSGD، وهو مزيج من التدرج العشوائي (SGD) و Muon، مستوحى إلى حد كبير من ابتكارات تدريب LLM من Kimi K2 من Moonshot AI. يوفر هذا المُحسِّن استقرار تدريب نموذج اللغة للرؤية الحاسوبية، مما يضمن تقاربًا أسرع ويقلل من مساحة الذاكرة أثناء التدريب مقارنة بالبدائل الثقيلة للمحولات.
ProgLoss و STAL
بالنسبة للباحثين الذين يعملون مع الصور الجوية أو تطبيقات الطائرات بدون طيار، يمثل اكتشاف الميزات الصغيرة تحديًا تاريخيًا. يقدم YOLO26 ProgLoss مقترنًا بـ STAL (Scale-Targeted Attention Loss)، مما يوفر تحسينات ملحوظة في التعرف على الأجسام الصغيرة مقارنة بـ YOLO11.
مقارنة الأداء والمقاييس
عند مقارنة النماذج وجهاً لوجه، يُظهر YOLO26 تفوقاً واضحاً في الدقة وكفاءة الأجهزة الطرفية، مع الحفاظ على متطلبات الذاكرة المنخفضة للغاية التي تتميز بها Ultralytics .
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
ملاحظة: يُظهر نموذج YOLO26 nano (YOLO26n) تحسناً بنسبة 31٪ في CPU مقارنةً بنموذج YOLO11n (38.9 مللي ثانية مقابل 56.1 مللي ثانية)، مما يسلط الضوء على فلسفة التصميم التي تركز على الحافة أولاً.
تعدد الاستخدامات في مهام الرؤية الحاسوبية
يستفيد كلا النموذجين من Ultralytics الذي يتم صيانته بشكل جيد، مما يوفر سهولة استخدام لا مثيل لها من خلال Python موحدة. فهما ليسا مجرد أجهزة كشف للأجسام، بل هما أجهزة متعددة المهام. ومع ذلك، يتضمن YOLO26 العديد من التحسينات الخاصة بالمهام:
- تقسيم المثيلات: يستخدم YOLO26 خسارة تقسيم دلالية محسّنة ونماذج أولية متعددة المقاييس، مما ينتج عنه حدود أقنعة أكثر وضوحًا من YOLO11. تعرف على المزيد حول سير عمل التقسيم.
- تقدير الوضع: من خلال دمج تقدير الاحتمالية اللوغاريتمية المتبقية (RLE)، يحسن YOLO26 بشكل كبير دقة النقاط الرئيسية في الأوضاع البشرية المعقدة. اكتشف قدرات تقدير الوضع.
- مربعات الحدود الموجهة (OBB): تعمل وظيفة فقدان الزاوية المتخصصة على حل مشكلات انقطاع الحدود التاريخية، مما يجعل YOLO26 موثوقًا بشكل استثنائي في اكتشاف الأجسام المدورة في بث الأقمار الصناعية. اقرأ عن مهام OBB.
- تصنيف الصور: يتعامل كلا النموذجين مع التصنيف عالي السرعة بكفاءة، حيث يقدم YOLO26 تحسينات هامشية في دقة التصنيف الأعلى على ImageNet.
مثال على رمز التدريب والاستدلال
Ultralytics بتجربة المطورين التي توفرها. لا يتطلب تدريب نموذج SOTA أو تشغيل برنامج استدلال سوى بضع أسطر من التعليمات البرمجية، مما يقلل من النصوص النمطية ويزيد من الإنتاجية. علاوة على ذلك، يتطلب تدريب YOLO CUDA أقل بكثير من شبكات المحولات الكبيرة.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Utilize GPU for accelerated training
)
# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the clean, instant predictions
results[0].show()
حالات الاستخدام المثالية واستراتيجيات النشر
YOLO11 الاختيار بين YOLO26 و YOLO11 كليًا على قيود بيئة الإنتاج لديك.
متى يتم نشر YOLO26
YOLO26 هو الخيار الأمثل للمشاريع الحديثة والواعدة. وهو مصمم خصيصًا من أجل:
- الحوسبة الطرفية وإنترنت الأشياء: CPU المذهل وإزالة DFL يجعلها ملكة الأجهزة مثل Raspberry Pi و Coral NPUs والمعالجات المحمولة.
- تحليلات الطائرات بدون طيار والجوية: إن دمج ProgLoss + STAL يجعله قادرًا بشكل فريد على تتبع الأجسام الصغيرة سريعة الحركة عبر مساحات شاسعة.
- التطبيقات الحساسة للكمون: في مجال الروبوتات المستقلة أو مراقبة جودة التصنيع، يضمن التصميم NMS كمونًا حتميًا دون حدوث ارتفاعات غير متوقعة في المعالجة اللاحقة.
متى يجب الاحتفاظ بـ YOLO11
على الرغم من تفوق YOLO26، YOLO11 نموذجًا ذا قدرات مذهلة. يمكنك الاستمرار في استخدام YOLO11 :
- الأنظمة القديمة: ترتبط البنية التحتية الحالية لنشر C++ ارتباطًا وثيقًا بالمخرجات المحددة القائمة على المراسي NMS للبنى القديمة.
- المعايير الأكاديمية: أنت تنشر أبحاثًا وتحتاج إلى معيار 2024 معترف به على نطاق واسع لتقييم خوارزمياتك الجديدة.
قوة Ultralytics البيئي
بغض النظر عما إذا كنت تستخدم YOLO11 YOLO26، فإن استخدام Ultralytics يعني الاستفادة من نظام بيئي جيد الصيانة مع تحديثات متكررة ودعم مجتمعي واسع النطاق.
بالنسبة لفرق المؤسسات، توفر Ultralytics حلاً شاملاً لتعليق البيانات وتدريب النماذج والنشر السلس على السحابة. من تصدير الأوزان المدربة إلى CoreML أو TensorRT، إلى تكوين ضبط المعلمات الفائقة المتقدمة، تضمن الأدوات المتوفرة أن يكون دورة حياة الذكاء الاصطناعي لديك مبسطة قدر الإمكان.