تخطي إلى المحتوى

YOLOv10 YOLO26: عصر جديد من الكشف الشامل عن الكائنات

شهد تطور الكشف عن الأجسام في الوقت الفعلي تقدمًا سريعًا في السنوات الأخيرة، مع التركيز بشكل كبير على تحقيق التوازن بين السرعة والدقة وسهولة النشر. تستكشف هذه المقارنة معلمين هامين في هذه الرحلة: YOLOv10، وهو اختراق أكاديمي أدى إلى انتشار الكشف NMS و YOLO26، أحدث منتج قوي جاهز للإنتاج من Ultralytics يعمل على تحسين هذه المفاهيم لتطبيقات على مستوى المؤسسات.

نظرة عامة على النموذج

YOLOv10: الرائد الأكاديمي

أطلق باحثون من جامعة تسينغهوا في مايو 2024 YOLOv10 تحولًا جذريًا من خلال التخلص من الحاجة إلى تقنية Non-Maximum Suppression (NMS) أثناء الاستدلال. عالج هذا النهج "الشامل" مشكلة طويلة الأمد في خطوط الإنتاج، حيث كان زمن الاستجابة بعد المعالجة يتفاوت بشكل غير متوقع اعتمادًا على كثافة المشهد.

تعرف على المزيد حول YOLOv10

YOLO26: المعيار الصناعي

بناءً على الأسس التي أرساها أسلافه، YOLO26 (الذي تم إصداره في يناير 2026) هو الحل المتطور Ultralytics المصمم لإحداث تأثير حقيقي. وهو يعتمد التصميم الشامل NMS الذي ابتكره YOLOv10 يعززه بوظائف خسارة أبسط، ومُحسّن جديد، وتحسينات هائلة في السرعة على الأجهزة المتطورة.

تعرف على المزيد حول YOLO26

مقارنة فنية

يهدف كلا النموذجين إلى حل مشكلات الكمون الناتجة عن NMS لكنهما يتخذان مسارات مختلفة نحو التحسين. YOLOv10 بشكل كبير على البحث المعماري والمهام المزدوجة للتدريب، بينما يعطي YOLO26 الأولوية لبساطة النشر CPU واستقرار التدريب.

الهندسة المعمارية والتصميم

YOLOv10 قدمت مهام مزدوجة متسقة للتدريب NMS. تقرن هذه الطريقة رأس واحد إلى عدة (للإشراف الغني أثناء التدريب) مع رأس واحد إلى واحد (للاستدلال)، مما يضمن أن يتعلم النموذج إخراج أفضل صندوق واحد لكل كائن. كما استخدمت تصميم نموذج شامل قائم على الكفاءة والدقة، بما في ذلك رؤوس تصنيف خفيفة الوزن وتقليل الدقة المكانية المنفصلة.

يحسن YOLO26 هذا الأمر من خلال إزالة Distribution Focal Loss (DFL) بالكامل. في حين ساعد DFL في تحسين دقة الصندوق في الإصدارات السابقة، إلا أن إزالته يبسط الرسم البياني للتصدير بشكل كبير، مما يجعل نماذج YOLO26 أسهل في التشغيل على الأجهزة الطرفية المقيدة والميكروكونترولرات منخفضة الطاقة. علاوة على ذلك، يدمج YOLO26 محسن MuSGD، وهو مزيج من SGD ومحسن Muon (مستوحى من تدريب LLM)، والذي يوفر استقرار التدريب على دفعات كبيرة لمهام الرؤية الحاسوبية لأول مرة.

مقاييس الأداء

يوضح الجدول التالي الاختلافات في الأداء. يُظهر YOLO26 سرعة فائقة على وحدات المعالجة المركزية (CPU) ودقة أعلى في جميع نطاقات النماذج، لا سيما في المتغيرات الأكبر حجماً.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

اختراق في مجال CPU

تم تحسين YOLO26 خصيصًا للبيئات التي لا تحتوي على وحدات معالجة رسومات مخصصة. وهو يحقق CPU أسرع CPU تصل إلى 43٪ مقارنة بالأجيال السابقة، مما يجعله عاملًا مغيرًا لقواعد اللعبة بالنسبة لـ Raspberry Pi وعمليات النشر على الأجهزة المحمولة.

حالات الاستخدام والتطبيقات الواقعية

متى تختار YOLOv10

YOLOv10 خيارًا ممتازًا للباحثين وسيناريوهات الكشف المحددة فقط.

  • البحث الأكاديمي: تعد استراتيجية المهام المزدوجة موضوعًا مثيرًا للاهتمام يستحق المزيد من الدراسة في تصميم وظيفة الخسارة.
  • خطوط الأنابيب القديمة NMS: إذا كان المشروع قد تم بناؤه بالفعل حولONNX YOLOv10 ONNX فإنه يستمر في توفير كشف موثوق به وذو زمن انتقال منخفض.

لماذا YOLO26 هو الخيار الأفضل للإنتاج

بالنسبة لمعظم المطورين، يوفر YOLO26 حلاً أكثر قوة وتنوعاً.

  • الحوسبة الطرفية وإنترنت الأشياء: بفضل وظائف الخسارة المبسطة وإزالة DFL، يعد YOLO26 مثاليًا للنشر على الأجهزة الطرفية التي تعاني من نقص في الذاكرة والقدرة الحاسوبية.
  • كشف الأجسام الصغيرة: بفضل ProgLoss + STAL (Soft-Target Anchor Loss)، يتفوق YOLO26 في كشف الأجسام الصغيرة، وهو مطلب أساسي للتصوير الجوي والتفتيش بواسطة الطائرات بدون طيار.
  • تعدد المهام المعقدة: على عكس YOLOv10 الذي هو في الأساس نموذج للكشف، يدعم YOLO26 بشكل أساسي مهام تقسيم المثيلات وتقدير الوضع ومربع الحدود الموجه (OBB) ضمن نفس الإطار.

ميزة Ultralytics

يوفر اختيار Ultralytics مثل YOLO26 مزايا تتجاوز بكثير المقاييس الأولية. يضمن النظام البيئي المتكامل دعم مشروعك من جمع البيانات إلى النشر النهائي.

تجربة مستخدم مبسطة

سهولة الاستخدام التي توفرها واجهة برمجةPython Ultralytics Python لا مثيل لها. في حين أن المستودعات الأخرى قد تتطلب نصوص برمجية معقدة للإعداد، يمكن تحميل Ultralytics وتدريبها ونشرها باستخدام الحد الأدنى من التعليمات البرمجية.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, optimizer="MuSGD")

# Run inference without NMS post-processing
results = model("https://ultralytics.com/images/bus.jpg")

دعم شامل للنظام البيئي

YOLO26 مدمج بالكامل في Ultralytics مما يتيح إدارة سلسة لمجموعات البيانات والتدريب عن بُعد والتصدير بنقرة واحدة إلى تنسيقات مثل TensorRT و CoreML و OpenVINO. يضمن هذا النظام البيئي الذي يتم صيانته جيدًا حصولك على تحديثات متكررة ومنتدى مجتمع نشط ووثائق شاملة لحل أي مشكلات.

كفاءة التدريب والذاكرة

تشتهر Ultralytics بكفاءتها في التدريب. يتيح استخدام YOLO26 لمحسّن MuSGD تدريبًا مستقرًا مع متطلبات ذاكرة أقل مقارنة بالنماذج القائمة على المحولات مثل RT-DETR. وهذا يعني أنه يمكنك تدريب نماذج عالية الدقة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين دون نفاد ذاكرة VRAM، مما يتيح الوصول إلى قدرات الذكاء الاصطناعي المتطورة للجميع.

الخلاصة

تمثل كلتا البنيتين إنجازات مهمة في مجال الرؤية الحاسوبية. YOLOv10 يستحق التقدير لتعميمه نهج NMS وإثباته أن الكشف الشامل قابل للتطبيق في التطبيقات في الوقت الفعلي.

ومع ذلك، فإن YOLO26 يأخذ هذا المفهوم ويحسنه ليلائم الاحتياجات العملية لعام 2026. بفضل CPU الفائقة، والدعم المتخصص للأجسام الصغيرة عبر ProgLoss، ودعم Ultralytics البيئي، فإن YOLO26 هو الخيار الموصى به للمطورين الذين يسعون إلى بناء حلول ذكاء اصطناعي قابلة للتطوير ومستقبلية. سواء كنت تعمل في مجال تحليلات البيع بالتجزئة الذكية أو الروبوتات المستقلة أو التصنيع عالي السرعة، فإن YOLO26 يوفر التوازن في الأداء المطلوب لتحقيق النجاح.

نماذج أخرى للاستكشاف

  • YOLO11: السلف القوي لـ YOLO26، ولا يزال يستخدم على نطاق واسع في الإنتاج.
  • RT-DETR: بديل قائم على المحولات يوفر دقة عالية للسيناريوهات التي تتوفر فيها GPU بكثرة.
  • YOLO: مناسب بشكل مثالي لمهام الكشف عن المفردات المفتوحة حيث يتم تحديد الفئات من خلال مطالبات نصية.

تعليقات