Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 مقابل YOLOv5: قفزة جيلية في اكتشاف الكائنات#

تميز تطور الرؤية الحاسوبية بالسعي الحثيث نحو السرعة والدقة وسهولة الوصول. يُعد اختيار البنية الصحيحة أمراً حاسماً لنجاح أي مشروع ذكاء اصطناعي. في هذا الدليل الشامل، نقارن بين إصدارين عظيمين من Ultralytics: YOLOv5 الرائد وYOLO26 المبتكر. وبينما أثر كلاهما بشكل كبير على مشهد اكتشاف الكائنات في الوقت الفعلي، تعكس تقنياتهما الأساسية تحولاً جذرياً في كيفية معالجة الشبكات العصبية للبيانات المرئية.

Link to this sectionنظرة عامة على النموذج#

قبل الغوص في الفروق المعمارية الدقيقة، دعونا نضع التفاصيل الأساسية لكلا النموذجين.

تفاصيل YOLO26:

تعرف على المزيد حول YOLO26

تفاصيل YOLOv5:

اعرف المزيد عن YOLOv5

استكشاف خيارات أخرى

بينما يركز هذا الدليل على YOLO26 وYOLOv5، قد يهتم المطورون الذين يقومون بترحيل الأنظمة القديمة أيضاً بمقارنة YOLO11 أو بنية YOLOv10 الرائدة التي لا تعتمد على NMS. كلاهما يوفر خطوات ممتازة لبيئات نشر محددة.

Link to this sectionالابتكارات المعمارية#

تمثل الفجوة التي تبلغ ست سنوات بين YOLOv5 وYOLO26 قفزة هائلة في أبحاث التعلم العميق. لقد ساهم YOLOv5 في تعميم الاستخدام الواسع لـ PyTorch لنماذج الرؤية، مقدماً آلية اكتشاف محسنة للغاية تعتمد على المرساة والتي أصبحت المعيار الصناعي. ومع ذلك، فقد اعتمد بشكل كبير على Non-Maximum Suppression (NMS) أثناء المعالجة اللاحقة، مما قد يؤدي إلى اختناقات في زمن الانتقال على الأجهزة ذات الموارد المحدودة.

يعيد YOLO26 تصور خط أنابيب الاستنتاج بالكامل من خلال تصميم نهائي خالي من NMS. من خلال القضاء على الحاجة إلى المعالجة اللاحقة بواسطة NMS، يوفر YOLO26 منطق نشر أسرع وأبسط بكثير، وهو مفهوم تم ريادته لأول مرة في YOLOv10 ولكنه أُتقن هنا. علاوة على ذلك، يتميز YOLO26 بـ إزالة DFL (دالة خسارة التوزيع البؤرية)، والتي تبسط رأس الإخراج بشكل جذري. هذا يجعل تصدير النموذج إلى تنسيقات مثل ONNX وTensorRT سلسًا للغاية، مما يضمن توافقاً ممتازاً مع الأجهزة الطرفية والأجهزة منخفضة الطاقة.

أثناء التدريب، يستخدم YOLO26 مُحسِّن MuSGD المتطور، وهو هجين من SGD وMuon مستوحى من Moonshot AI's Kimi K2. يجلب هذا ابتكارات تدريب النماذج اللغوية الكبيرة (LLM) إلى مجال الرؤية الحاسوبية، مما يضمن تدريباً مستقراً للغاية وتقارباً أسرع بكثير مقارنة بمُحسِّنات SGD أو AdamW التقليدية المستخدمة في YOLOv5.

Link to this sectionالأداء والمقاييس#

عند تقييم النماذج، فإن التوازن بين mean Average Precision (mAP) وسرعة الاستنتاج يحدد الجدوى في العالم الحقيقي. تم تحسين YOLO26 محلياً لكل من وحدات معالجة الرسومات المتطورة ومعالجات وحدة المعالجة المركزية الطرفية.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

تكشف المقاييس عن تحسن مذهل. على سبيل المثال، يحقق YOLO26n دقة mAP تبلغ 40.9 مقارنة بـ 28.0 لـ YOLOv5n، بينما يوفر في الوقت نفسه سرعة استنتاج أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية. وهذا يجعل YOLO26 متفوقاً بشكل كبير لعمليات النشر المضمنة مثل Raspberry Pi أو الأجهزة المحمولة. وبينما يتفوق YOLOv5 قليلاً في سرعة TensorRT GPU على مقياس Nano، فإن المقايضة في الدقة تميل بشدة لصالح YOLO26.

Link to this sectionنظام التدريب وسهولة الاستخدام#

يستفيد كلا النموذجين بشكل كبير من نظام Ultralytics المُصان جيداً. إنهما يقدمان تجربة "من الصفر إلى الاحتراف" مع واجهة برمجة تطبيقات Python مبسطة، وتوثيق شامل، ودعم مجتمعي نشط. ومع ذلك، يأخذ YOLO26 كفاءة التدريب إلى مستوى جديد.

تتطلب نماذج Ultralytics باستمرار ذاكرة CUDA أقل بكثير أثناء التدريب مقارنة بالبدائل المعتمدة على الـ Transformer. يعزز YOLO26 هذا بفضل دوال الخسارة ProgLoss + STAL. تحقق هذه التطورات تحسينات ملحوظة في التعرف على الكائنات الصغيرة دون زيادة العبء على الذاكرة.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model with the MuSGD optimizer (default for YOLO26)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)

# Run fast, NMS-free inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

يسمح هذا البرنامج النصي البسيط للمطورين بالتكرار بسرعة على مجموعات بيانات مخصصة، والانتقال بسلاسة من استيعاب البيانات إلى نموذج جاهز للإنتاج.

جعل النشر أمراً سهلاً

باستخدام منصة Ultralytics، يمكنك تصدير نماذج YOLO26 المدربة الخاصة بك تلقائياً إلى تنسيقات مثل CoreML أو TensorFlow Lite دون كتابة سطر واحد من كود التحويل.

Link to this sectionتعدد الاستخدامات وحالات الاستخدام المثالية#

Link to this sectionمتى تستخدم YOLOv5#

يظل YOLOv5 خياراً موثوقاً للأنظمة القديمة. إذا كان لديك خط أنابيب صناعي حالي مرتبط بشكل كبير بمخرجات تعتمد على المرساة، أو إذا كنت تجري استنتاجاً على أجهزة NVIDIA Jetson قديمة ذات مكدسات TensorRT ناضجة ومجمدة، فإن YOLOv5 يوفر حلاً مستقراً وموثقاً للغاية.

Link to this sectionمتى تستخدم YOLO26#

YOLO26 هو الخيار النهائي لمشاريع الرؤية الحاسوبية الحديثة. تعدد استخداماته يفوق بكثير سابقه. بينما يركز YOLOv5 بشكل أساسي على الاكتشاف (مع إضافات التجزئة لاحقاً)، يوفر YOLO26 دعماً عميقاً وأصلياً لـ تجزئة المثيلات، وتقدير الوضعية، وتصنيف الصور، وصناديق التحديد الموجهة (OBB).

يقدم YOLO26 تحسينات خاصة بالمهمة، مثل خسارة التجزئة الدلالية المتخصصة، وتقدير احتمالية السجل المتبقي (RLE) لنقاط الوضعية الدقيقة للغاية، وخسارة الزاوية المتقدمة لـ OBB لحل مشاكل الحدود الصعبة.

  • Edge IoT والروبوتات: تجعل البنية الخالية من NMS وسرعة الاستنتاج الأسرع بنسبة 43% على وحدة المعالجة المركزية YOLO26 مثالياً للملاحة الروبوتية في الوقت الفعلي وكاميرات المنازل الذكية.
  • التصوير الجوي: تجعل تحسينات ProgLoss + STAL اكتشاف الكائنات الصغيرة من الطائرات بدون طيار—مثل المركبات في مواقف السيارات أو المحاصيل في الحقول الزراعية—أكثر موثوقية بشكل جوهري.
  • تحليلات الفيديو في الوقت الفعلي: سواء كنت تتعقب رياضيين في بث مباشر أو تراقب تدفقات المرور، يضمن توازن أداء YOLO26 استدعاءً عالياً دون إسقاط الإطارات.

في النهاية، يضمن التزام Ultralytics بنظام بيئي يسهل الوصول إليه وعالي الأداء أن يكون الانتقال من YOLOv5 إلى YOLO26 سلساً، مما يفتح قدرات متطورة للباحثين والمطورين على حد سواء.

المساهمون

التعليقات