تخطي إلى المحتوى

YOLO26 مقابل YOLOv5: قفزة جيلية في مجال اكتشاف الأجسام

تم تحديد تطور الرؤية الحاسوبية من خلال السعي الدؤوب لتحقيق السرعة والدقة وسهولة الوصول. يعد اختيار البنية المناسبة أمراً بالغ الأهمية لنجاح أي مشروع في مجال الذكاء الاصطناعي. في هذا الدليل الشامل، نقارن بين إصدارين هامين من Ultralytics: الإصدار الرائد YOLOv5 و YOLO26 الرائد. في حين أن كلاهما قد أثر بشكل كبير على مشهد الكشف عن الكائنات في الوقت الفعلي، فإن التقنيات الأساسية لكل منهما تعكس تحولًا هائلاً في الطريقة التي تعالج بها الشبكات العصبية البيانات المرئية.

نظرة عامة على النموذج

قبل الخوض في التفاصيل المعمارية الدقيقة، دعونا نحدد التفاصيل الأساسية لكلا النموذجين.

تفاصيل YOLO26:

تعرف على المزيد حول YOLO26

YOLOv5 :

  • المؤلفون: جلين جوشر
  • المنظمة: Ultralytics
  • التاريخ: 2020-06-26
  • GitHub: yolov5
  • المستندات: YOLOv5

تعرف على المزيد حول YOLOv5

استكشاف خيارات أخرى

بينما يركز هذا الدليل على YOLO26 و YOLOv5، قد يكون المطورون الذين يقومون بترحيل الأنظمة القديمة مهتمين أيضًا بمقارنة YOLO11 أو البنية الرائدة NMS لـ YOLOv10. كلاهما يوفران نقطة انطلاق ممتازة لبيئات نشر محددة.

الابتكارات المعمارية

الفجوة الزمنية التي تبلغ ست سنوات بين YOLOv5 YOLO26 تمثل قفزة هائلة في أبحاث التعلم العميق. YOLOv5 تعميم استخدام PyTorch في نماذج الرؤية، حيث قدم آلية كشف عالية التحسين وقائمة على المراسي أصبحت معيارًا صناعيًا. ومع ذلك، فقد اعتمد بشكل كبير على تقنية Non-Maximum Suppression (NMS) أثناء المعالجة اللاحقة، مما قد يؤدي إلى حدوث اختناقات في زمن الاستجابة على الأجهزة ذات الموارد المحدودة.

يعيد YOLO26 تصور خط أنابيب الاستدلال بالكامل من خلال تصميم شامل NMS. من خلال التخلص من الحاجة إلى NMS يوفر YOLO26 منطق نشر أسرع وأبسط بكثير، وهو مفهوم تم طرحه لأول مرة في YOLOv10 تم تحسينه هنا. علاوة على ذلك، يتميز YOLO26 بإزالة DFL (خسارة بؤرية التوزيع)، مما يبسط رأس الإخراج بشكل كبير. وهذا يجعل تصدير النموذج إلى تنسيقات مثل ONNX و TensorRT بسلاسة لا تصدق، مما يضمن توافقًا ممتازًا مع الأجهزة المتطورة والأجهزة منخفضة الطاقة.

أثناء التدريب، يستخدم YOLO26 مُحسّن MuSGD المتطور، وهو مزيج من SGD Muon مستوحى من Kimi K2 من Moonshot AI. وهذا يجلب ابتكارات تدريب LLM إلى مجال الرؤية الحاسوبية، مما يضمن تدريبًا عالي الاستقرار وتقاربًا أسرع بكثير مقارنة AdamW SGD AdamW التقليدية المستخدمة في YOLOv5.

الأداء والمقاييس

عند تقييم النماذج، فإن التوازن بين متوسط الدقة (mAP) وسرعة الاستدلال يحدد قابلية التطبيق في العالم الواقعي. تم تحسين YOLO26 بشكل أساسي لكل من وحدات معالجة الرسومات (GPU) المتطورة ووحدات معالجة البيانات (CPU) المتطورة.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

تكشف المعايير عن تحسن مذهل. على سبيل المثال، YOLO26n يحقق معدل mAP متوسط ( mAP 40.9 مقارنة بـ YOLOv5n28.0، مع تقديم CPU أسرع بنسبة تصل إلى 43٪ في CPU. وهذا يجعل YOLO26 متفوقة بشكل كبير في عمليات النشر المدمجة مثل Raspberry Pi أو الأجهزة المحمولة. في حين أن YOLOv5 بميزة طفيفة فيGPU TensorRT GPU على نطاق Nano، فإن المقايضة في الدقة ترجح كفة YOLO26 بشكل كبير.

نظام التدريب وسهولة الاستخدام

يستفيد كلا النموذجين بشكل كبير من Ultralytics الذي يتم صيانته جيدًا. فهما يوفران تجربة "من الصفر إلى القمة" بفضل Python مبسطة ووثائق شاملة ودعم مجتمعي نشط. ومع ذلك، يرتقي YOLO26 بكفاءة التدريب إلى مستوى جديد.

تتطلب Ultralytics باستمرار CUDA أقل بكثير أثناء التدريب مقارنة بالبدائل التي تعتمد بشكل كبير على المحولات. ويضاعف YOLO26 من ذلك بوظائف الخسارة ProgLoss + STAL. وتؤدي هذه التطورات إلى تحسينات ملحوظة في التعرف على الأجسام الصغيرة دون زيادة حجم الذاكرة.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model with the MuSGD optimizer (default for YOLO26)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)

# Run fast, NMS-free inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

يتيح هذا البرنامج النصي البسيط للمطورين تكرار مجموعات البيانات المخصصة بسرعة، والانتقال بسلاسة من استيعاب البيانات إلى نموذج جاهز للإنتاج.

نشر سهل

باستخدام Ultralytics ، يمكنك تصدير نماذج YOLO26 المدربة تلقائيًا إلى تنسيقات مثل CoreML أو TensorFlow دون كتابة سطر واحد من كود التحويل.

تعدد الاستخدامات وحالات الاستخدام المثالية

متى تستخدم YOLOv5

YOLOv5 أداة موثوقة للأنظمة القديمة. إذا كان لديك خط إنتاج صناعي قائم مرتبط بشكل كبير بالمخرجات القائمة على المراسي، أو إذا كنت تقوم بتشغيل الاستدلال على أجهزة NVIDIA قديمة مع TensorRT ناضجة ومجمدة، YOLOv5 حلاً مستقرًا وموثقًا بشكل جيد.

متى تستخدم YOLO26

YOLO26 هو الخيار الأمثل لمشاريع الرؤية الحاسوبية الحديثة. تتفوق تعدد استخداماته على سابقه بكثير. بينما يركز YOLOv5 على الكشف (مع إضافات لاحقة للتجزئة)، يوفر YOLO26 دعمًا عميقًا وأصليًا لتجزئة المثيلات وتقدير الوضع وتصنيف الصور ومربعات الحدود الموجهة (OBB).

يقدم YOLO26 تحسينات خاصة بالمهام، مثل خسارة التجزئة الدلالية المتخصصة، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لنقاط مفتاحية فائقة الدقة، وخسارة الزاوية المتقدمة لـ OBB لحل مشكلات الحدود الصعبة.

  • Edge IoT و Robotics: البنية NMS و 43٪ أسرع CPU تجعل YOLO26 مثالية للملاحة الروبوتية في الوقت الحقيقي وكاميرات المنزل الذكي.
  • الصور الجوية: تعمل تحسينات ProgLoss + STAL على زيادة موثوقية اكتشاف الأجسام الصغيرة من الطائرات بدون طيار، مثل المركبات في مواقف السيارات أو المحاصيل في الحقول الزراعية.
  • تحليلات الفيديو في الوقت الفعلي: سواء كان ذلك لتتبع الرياضيين في البث الرياضي أو مراقبة تدفقات حركة المرور، يضمن توازن أداء YOLO26 استرجاعًا عاليًا دون فقدان الإطارات.

في النهاية، يضمن Ultralytics بتوفير نظام بيئي سهل الوصول وعالي الأداء أن يكون الانتقال من YOLOv5 YOLO26 سلسًا، مما يفتح الباب أمام إمكانات متطورة للباحثين والمطورين على حد سواء.


تعليقات