تخطي إلى المحتوى

YOLO26 مقابل YOLOv8: التطورات في الجيل التالي من كشف الأجسام

تم تحديد تطور الرؤية الحاسوبية من خلال السعي لتحقيق أداء في الوقت الفعلي دون التضحية بالدقة. مع استكشاف المطورين والباحثين لمجال التعلم الآلي الحديث، أصبح اختيار بنية النموذج المناسب أمرًا بالغ الأهمية. تستكشف هذه المقارنة التقنية الشاملة القفزة الجيلية من Ultralytics YOLOv8، وهي بنية شائعة للغاية أعادت تعريف المعيار في عام 2023، إلى أحدث Ultralytics ، التي تم إصدارها في يناير 2026.

بالتعمق في هندستها المعمارية ومقاييس الأداء ومنهجيات التدريب، نسلط الضوء على سبب توفير الترقية إلى أحدث الابتكارات مزايا واضحة لـ اكتشاف الكائنات، والتجزئة، وما بعدها.

خلفية النموذج والبيانات الوصفية

فهم أصول هذه البنى يوفر سياقًا لإنجازاتها الرائدة. تم تطوير كلا النموذجين بواسطة Ultralytics، وهي شركة مشهورة بجعل أحدث تقنيات الذكاء الاصطناعي متاحة وسهلة الاستخدام.

تفاصيل YOLO26:
المؤلفون: Glenn Jocher و Jing Qiu
المنظمة: Ultralytics
التاريخ: 2026-01-14
GitHub: https://github.com/ultralytics/ultralytics
الوثائق: https://docs.ultralytics.com/models/yolo26/

تعرف على المزيد حول YOLO26

تفاصيل YOLOv8:
المؤلفون: غلين جوشر، أيوش تشاوراسيا، وجينغ كيو
المنظمة: Ultralytics
التاريخ: 2023-01-10
جيت هاب: https://github.com/ultralytics/ultralytics
الوثائق: https://docs.ultralytics.com/models/yolov8/

تعرف على المزيد حول YOLOv8

الابتكارات المعمارية

يؤدي الانتقال من YOLOv8 YOLO26 إلى تغييرات جذرية في الطريقة التي تعالج بها الشبكات العصبية البيانات المرئية وتحسب الخسارة.

YOLO26: قمة الكفاءة في الحافة

تم تصميم YOLO26 من الألف إلى الياء للقضاء على معوقات النشر وتحقيق أقصى سرعة استدلال على الأجهزة المحدودة.

  • تصميم شامل خالٍ من NMS: استنادًا إلى المفاهيم التي تم ابتكارها لأول مرة في YOLOv10، يستخدم YOLO26 بشكل أصيل بنية شاملة. من خلال إلغاء الحاجة تمامًا إلى معالجة ما بعد التثبيط غير الأقصى (NMS)، يتم القضاء فعليًا على تباين زمن الانتقال. وهذا يبسط منطق النشر للتطبيقات التي تتطلب ضمانات صارمة في الوقت الفعلي.
  • إزالة DFL: تبسط إزالة Distribution Focal Loss (DFL) رأس الإخراج بشكل كبير. يتيح هذا الاختيار المعماري توافقاً أفضل بكثير مع الأجهزة الطرفية منخفضة الطاقة وعمليات تصدير أبسط إلى تنسيقات مثل ONNX و CoreML.
  • مُحسِّن MuSGD: مستوحى من استقرار التدريب الذي شوهد في نماذج اللغة الكبيرة (LLMs) مثل Kimi K2 من Moonshot AI، يستخدم YOLO26 مُحسِّن MuSGD — وهو مزيج هجين من الانحدار التدرجي العشوائي و Muon. وهذا يجلب ابتكارات التدريب على نطاق نماذج LLM إلى الرؤية الحاسوبية، مما ينتج عنه تقارب أسرع ودورات تدريب مستقرة للغاية.
  • ProgLoss + STAL: لمواجهة مشكلة التعرف على الأجسام الصغيرة جدًا والمعروفة بصعوبتها، يطبق YOLO26 دوال الخسارة التقدمية (ProgLoss) جنبًا إلى جنب مع دوال خسارة المراسّي المتسامحة مع الحجم (STAL). وهذا يوفر تحسينات حاسمة لـ detect الأجسام الصغيرة، مما يجعله مثاليًا لتطبيقات الطائرات بدون طيار.

تحسينات خاصة بالمهام

يقدم YOLO26 أيضًا تحسينات موجهة عبر مجالات رؤية الكمبيوتر المتعددة. ويستخدم خسارة التجزئة الدلالية ونموذج متعدد المقاييس لتحسين تجزئة الحالات، وتقدير احتمالية السجل المتبقي (RLE) لتقدير الوضع بدقة عالية، وخوارزميات خسارة الزاوية المتخصصة لحل مشكلات الحدود في الصناديق المحددة الاتجاه (OBB).

YOLOv8: آلة العمل عالية التنوع

عند طرحه في عام 2023، YOLOv8 معيارًا جديدًا من خلال الانتقال الكامل إلى تصميم خالٍ من المراسي، والذي تم تعميمه بشكل أفضل عبر نسب عرض إلى ارتفاع متنوعة لمجموعات البيانات.

  • وحدة C2f: لقد حلت محل وحدة C3 الأقدم بكتلة C2f، مما يسمح بتدفق تدرج أفضل عبر العمود الفقري للشبكة.
  • الرأس المفصول (Decoupled Head): يتميز YOLOv8 برأس مفصول حيث يتم حساب التصنيف وانحدار الصناديق المحيطة بشكل مستقل، مما يعزز بشكل كبير متوسط الدقة المتوسطة (mAP).
  • تعدد استخدامات المهام: كان أحد النماذج الأولى التي قدمت واجهة برمجة تطبيقات موحدة حقًا لـ تصنيف الصور، وdetect، وsegmentation، ومهام الوضعيات جاهزة للاستخدام.

مقاييس الأداء ومتطلبات الموارد

عند تقييم نماذج الإنتاج، فإن التوازن بين الدقة وسرعة الاستدلال وحجم النموذج أمر بالغ الأهمية. يظهر YOLO26 ميزة جيلية واضحة عبر جميع المتغيرات الحجمية.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

ملاحظة: القيم المظللة توضح التوازن في الأداء ومكاسب الكفاءة التي تحققها بنية YOLO26 مقارنة بسابقتها.

تحليل

يحقق YOLO26 إنجازًا رائعًا CPU أسرع بنسبة تصل إلى 43٪ في CPU مقارنة بنماذج YOLOv8 المماثلة. على سبيل المثال، YOLO26n يحقق 38.9 مللي ثانية على وحدة CPU باستخدام ONNX، مقارنة بـ YOLOv8n80.4 مللي ثانية، كل ذلك مع زيادة الـ mAP من 37.3 إلى 40.9. هذه القفزة الهائلة في كفاءة الـ CPU هي نتيجة مباشرة لإزالة DFL والتصميم الخالي من NMS، مما يجعل YOLO26 قوة هائلة للبيئات التي تفتقر إلى وحدات GPU مخصصة.

علاوة على ذلك، تتميز نماذج YOLO26 بعدد أقل من المعلمات وعمليات FLOPs بالنسبة لمستويات الحجم الخاصة بها، مما يعادل انخفاضًا كبيرًا في استخدام GPU أثناء الاستدلال والتدريب مقارنةً بالبنى القديمة القائمة على المحولات.

ميزة النظام البيئي لـ Ultralytics

من الاعتبارات الرئيسية عند اختيار نموذج ذكاء اصطناعي هي البنية التحتية المحيطة. يستفيد كل من YOLO26 و YOLOv8 بشكل كبير من منصة Ultralytics الموحدة، مما يوفر تجربة تطوير لا مثيل لها.

  1. سهولة الاستخدام: تضمن فلسفة "من الصفر إلى الاحتراف" أن يتمكن المطورون من تحميل وتدريب وتصدير النماذج بأقل قدر من التعليمات البرمجية. تظل واجهة برمجة تطبيقات Python متسقة عبر أجيال النماذج.
  2. كفاءة التدريب: تتطلب نماذج Ultralytics YOLO ذاكرة CUDA أقل بشكل استثنائي أثناء عمليات التدريب مقارنة بنماذج المحولات (مثل RT-DETR). هذا يسمح باستخدام أحجام دفعات أكبر على الأجهزة الاستهلاكية، مما يضفي طابعًا ديمقراطيًا على أبحاث الذكاء الاصطناعي.
  3. نظام بيئي جيد الصيانة: مدعومًا بتحديثات مستمرة، وخطوط أنابيب CI/CD صارمة، وتكاملات عميقة مع أدوات مثل Weights & Biases وTensorRT، فإن مستودع Ultralytics قوي وجاهز للإنتاج.
  4. تعدد استخدامات لا مثيل له: نماذج Ultralytics ليست أحادية الغرض؛ فاستيراد واحد يتعامل مع مجموعات بيانات متنوعة، مما يعزز سير العمل للأنظمة المعقدة التي تتطلب التتبع والتصنيف وsegmentation المتزامن.

تحسينات مبسطة

نظرًا لأن واجهة برمجة تطبيقات Ultralytics موحدة للغاية، فإن ترقية نظام إنتاجي من YOLOv8 إلى YOLO26 هي حرفيًا بنفس بساطة تغيير السلسلة "yolov8n.pt" إلى "yolo26n.pt" في النص الخاص بك.

تطبيقات عملية في أرض الواقع

يتوقف الاختيار بين هذه النماذج غالبًا على قيود النشر الخاصة بك، على الرغم من أن YOLO26 موصى به عالميًا للمشاريع الجديدة.

الحوسبة الطرفية وشبكات إنترنت الأشياء

بالنسبة للبيئات الطرفية — مثل نشرات Raspberry Pi أو أجهزة الاستشعار المحلية في المصانع — فإنYOLO26 هو البطل بلا منازع. بفضل CPU المُحسّنة أصلاً وهيكلها NMS يمكن للكاميرات الذكية معالجة مقاطع الفيديو ذات معدل الإطارات العالي لإدارة مواقف السيارات دون فقدان الإطارات بسبب اختناقات ما بعد المعالجة.

الصور الملتقطة من ارتفاعات عالية ومن الجو

في مراقبة الزراعة أو فحص البنية التحتية باستخدام الطائرات بدون طيار، يعد اكتشاف الأجسام الصغيرة أمرًا بالغ الأهمية. يتيح تطبيق ProgLoss + STAL في YOLO26 detect الآفات detect أو الكسور الدقيقة في خطوط الأنابيب التي YOLOv8 تفوت البنى القديمة مثل YOLOv8 مما يوفر استدعاء ودقة فائقتين في مجموعات البيانات مثل VisDrone.

GPU القديمة

YOLOv8 يظل ذا صلة بالأنظمة المرتبطة بشدة بمخرجات انحدار الصناديق المحيطة الخاصة به أو عمليات النشر المؤسسية التي تلتزم بدورات تحقق ممتدة ولا يمكنها ترحيل البنى بسهولة.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLO26 و YOLOv8 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار YOLO26

YOLO26 هو خيار قوي لـ:

  • نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
  • بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.

متى تختار YOLOv8

YOLOv8 في الحالات التالية:

  • نشر متعدد المهام ومتعدد الاستخدامات: المشاريع التي تتطلب نموذجًا مثبتًا لـ الكشف، والتجزئة، والتصنيف، وتقدير الوضعيات ضمن بيئة Ultralytics.
  • أنظمة إنتاج راسخة: بيئات الإنتاج الحالية المبنية بالفعل على بنية YOLOv8 مع مسارات نشر مستقرة ومختبرة جيدًا.
  • دعم واسع للمجتمع والنظام البيئي: التطبيقات التي تستفيد من البرامج التعليمية الشاملة لـ YOLOv8، وعمليات التكامل مع الجهات الخارجية، وموارد المجتمع النشطة.

مثال برمجي: الشروع في العمل

الاستفادة من قوة أحدث Ultralytics أمر في غاية البساطة. يوضح Python التالي تدريب نموذج YOLO26 على مجموعة بيانات مخصصة، مع ملاحظة أن مُحسّن MuSGD يحقق تقاربًا سريعًا تلقائيًا.

from ultralytics import YOLO

# Load the highly efficient YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train on the standard COCO8 dataset
# The ecosystem handles hyperparameter tuning and augmentations natively
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Automatically utilizes CUDA if available
)

# Run end-to-end, NMS-free inference on a source image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Visualize the resulting detections
predictions[0].show()

نماذج أخرى يجب أخذها في الاعتبار

بينما يمثل YOLO26 أحدث ما توصلت إليه التكنولوجيا في الوقت الحالي، يمكن للمطورين الذين يعملون على إنشاء تطبيقات متنوعة استكشاف ما يلي أيضًا:

  • YOLO11: السلف المباشر لـ YOLO26، يقدم تحسينًا استثنائيًا على YOLOv8 ولا يزال يستخدم بكثافة في أنظمة الإنتاج المتطورة.
  • RT-DETR: محول الكشف في الوقت الفعلي (Real-Time DEtection TRansformer) من بايدو. إنه خيار ممتاز للباحثين الذين يستكشفون آلية الانتباه في مهام الرؤية، على الرغم من أنه يتطلب ذاكرة CUDA أكبر بكثير للتدريب مقارنة بنماذج Ultralytics YOLO القياسية.

للحصول على مجموعة شاملة من التدريب على السحابة وتصنيف مجموعات البيانات والنشر الفوري، استكشف Ultralytics اليوم.


تعليقات