تخطي إلى المحتوى

YOLO26 مقابل YOLOv8: التطورات في الجيل التالي من كشف الأجسام

تم تحديد تطور الرؤية الحاسوبية من خلال السعي لتحقيق أداء في الوقت الفعلي دون التضحية بالدقة. مع استكشاف المطورين والباحثين لمجال التعلم الآلي الحديث، أصبح اختيار بنية النموذج المناسب أمرًا بالغ الأهمية. تستكشف هذه المقارنة التقنية الشاملة القفزة الجيلية من Ultralytics YOLOv8، وهي بنية شائعة للغاية أعادت تعريف المعيار في عام 2023، إلى أحدث Ultralytics ، التي تم إصدارها في يناير 2026.

من خلال التعمق في هياكلها ومقاييس أدائها ومنهجيات تدريبها، نسلط الضوء على الأسباب التي تجعل الترقية إلى أحدث الابتكارات توفر مزايا واضحة في مجال اكتشاف الكائنات وتقسيمها وغير ذلك.

خلفية النموذج والبيانات الوصفية

فهم أصول هذه البنى يوفر سياقًا لإنجازاتها الرائدة. تم تطوير كلا النموذجين بواسطة Ultralytics، وهي شركة مشهورة بجعل أحدث تقنيات الذكاء الاصطناعي متاحة وسهلة الاستخدام.

YOLO26 التفاصيل:
المؤلفون: Glenn Jocher و Jing Qiu
المنظمة: Ultralytics
التاريخ: 2026-01-14
GitHub: ultralytics
المستندات: ultralytics

تعرف على المزيد حول YOLO26

YOLOv8 :
المؤلفون: Glenn Jocher و Ayush Chaurasia و Jing Qiu
المنظمة: Ultralytics
التاريخ: 2023-01-10
GitHub: ultralytics
المستندات: yolov8

تعرف على المزيد حول YOLOv8

الابتكارات المعمارية

يؤدي الانتقال من YOLOv8 YOLO26 إلى تغييرات جذرية في الطريقة التي تعالج بها الشبكات العصبية البيانات المرئية وتحسب الخسارة.

YOLO26: قمة الكفاءة في الحافة

تم تصميم YOLO26 من الألف إلى الياء للقضاء على معوقات النشر وتحقيق أقصى سرعة استدلال على الأجهزة المحدودة.

  • تصميم شامل NMS: بناءً على المفاهيم التي تم طرحها لأول مرة في YOLOv10، يستخدم YOLO26 بنية شاملة بشكل أساسي. من خلال التخلص تمامًا من الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، يتم القضاء على تباين زمن الاستجابة بشكل فعلي. وهذا يبسط منطق النشر للتطبيقات التي تتطلب ضمانات صارمة في الوقت الفعلي.
  • إزالة DFL: تؤدي إزالة فقدان بؤرة التوزيع (DFL) إلى تبسيط رأس الإخراج بشكل كبير. يتيح هذا الاختيار المعماري توافقًا أفضل بشكل ملحوظ مع الأجهزة الطرفية منخفضة الطاقة وتصديرًا أبسط إلى تنسيقات مثل ONNX و CoreML.
  • محسّن MuSGD: مستوحى من استقرار التدريب الذي يشهده نماذج اللغة الكبيرة (LLMs) مثل Kimi K2 من Moonshot AI، يستخدم YOLO26 محسّن MuSGD، وهو مزيج من Stochastic Gradient Descent و Muon. وهذا يجلب ابتكارات التدريب على نطاق LLM إلى الرؤية الحاسوبية، مما ينتج عنه تقارب أسرع وتشغيل تدريب عالي الاستقرار.
  • ProgLoss + STAL: لمواجهة المشكلة الصعبة المتمثلة في التعرف على الأجسام الصغيرة، يستخدم YOLO26 تقنية Progressive Loss (ProgLoss) مع تقنية Scale-Tolerant Anchor Loss (STAL). وهذا يوفر تحسينات مهمة في اكتشاف الأجسام الصغيرة، مما يجعله مثاليًا لتطبيقات الطائرات بدون طيار.

تحسينات خاصة بالمهام

يقدم YOLO26 أيضًا تحسينات موجهة عبر مجالات رؤية الكمبيوتر المتعددة. ويستخدم خسارة التجزئة الدلالية ونموذج متعدد المقاييس لتحسين تجزئة الحالات، وتقدير احتمالية السجل المتبقي (RLE) لتقدير الوضع بدقة عالية، وخوارزميات خسارة الزاوية المتخصصة لحل مشكلات الحدود في الصناديق المحددة الاتجاه (OBB).

YOLOv8: آلة العمل عالية التنوع

عند طرحه في عام 2023، YOLOv8 معيارًا جديدًا من خلال الانتقال الكامل إلى تصميم خالٍ من المراسي، والذي تم تعميمه بشكل أفضل عبر نسب عرض إلى ارتفاع متنوعة لمجموعات البيانات.

  • وحدة C2f: حلت محل الوحدة C3 القديمة بكتلة C2f، مما سمح بتحسين تدفق التدرج عبر العمود الفقري للشبكة.
  • رأس منفصل: YOLOv8 برأس منفصل حيث يتم حساب التصنيف وانحدار مربع الحدود بشكل مستقل، مما يعزز بشكل كبير متوسط الدقة (mAP).
  • تنوع المهام: كان هذا النموذج من أوائل النماذج التي قدمت واجهة برمجة تطبيقات موحدة بالفعل لتصنيف الصور واكتشافها وتقسيمها ومهام وضعها بشكل جاهز للاستخدام.

مقاييس الأداء ومتطلبات الموارد

عند تقييم نماذج الإنتاج، فإن التوازن بين الدقة وسرعة الاستدلال وحجم النموذج أمر بالغ الأهمية. يظهر YOLO26 ميزة جيلية واضحة عبر جميع المتغيرات الحجمية.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

ملاحظة: القيم المظللة توضح التوازن في الأداء ومكاسب الكفاءة التي تحققها بنية YOLO26 مقارنة بسابقتها.

تحليل

يحقق YOLO26 إنجازًا رائعًا CPU أسرع بنسبة تصل إلى 43٪ في CPU مقارنة YOLOv8 المماثلة. على سبيل المثال، YOLO26n يحقق 38.9 مللي ثانية على وحدة CPU ONNX، مقارنة بـ YOLOv8n80.4 مللي ثانية، مع زيادة mAP 37.3 إلى 40.9. هذا القفز الهائل في CPU هو نتيجة مباشرة لإزالة DFL والتصميم NMS، مما يجعل YOLO26 قوة مطلقة للبيئات التي تفتقر إلى وحدات معالجة رسومات مخصصة.

علاوة على ذلك، تتميز نماذج YOLO26 بعدد أقل من المعلمات وعمليات FLOPs بالنسبة لمستويات الحجم الخاصة بها، مما يعادل انخفاضًا كبيرًا في استخدام GPU أثناء الاستدلال والتدريب مقارنةً بالبنى القديمة القائمة على المحولات.

ميزة النظام البيئي لـ Ultralytics

أحد الاعتبارات الرئيسية عند اختيار نموذج الذكاء الاصطناعي هو البنية التحتية المحيطة. YOLOv8 كل من YOLO26 و YOLOv8 بشكل كبير من Ultralytics الموحدة، التي توفر تجربة مطورين لا مثيل لها.

  1. سهولة الاستخدام: تضمن فلسفة "من الصفر إلى البطل" للمطورين إمكانية تحميل النماذج وتدريبها وتصديرها بأقل قدر ممكن من التعليمات البرمجية. تظل Python متسقة عبر أجيال النماذج.
  2. كفاءة التدريب: تتطلبYOLO Ultralytics YOLO CUDA أقل بشكل استثنائي أثناء عمليات التدريب مقارنة بنماذج المحولات (مثل RT-DETR). وهذا يسمح باستخدام أحجام دفعات أكبر على الأجهزة الاستهلاكية، مما يساهم في تعميم أبحاث الذكاء الاصطناعي.
  3. نظام بيئي جيد الصيانة: مدعوم بتحديثات مستمرة، وخطوط إنتاج CI/CD صارمة، وتكامل عميق مع أدوات مثل Weights & Biases و TensorRT، فإن Ultralytics قوي وجاهز للإنتاج.
  4. تنوع لا مثيل له: Ultralytics ليست محدودة الوظائف؛ حيث يمكن استيراد مجموعة بيانات متنوعة في عملية استيراد واحدة، مما يعزز سير العمل للأنظمة المعقدة التي تتطلب التتبع والتصنيف والتجزئة في وقت واحد.

تحسينات مبسطة

نظرًا لأن Ultralytics موحدة للغاية، فإن ترقية نظام الإنتاج من YOLOv8 YOLO26 أمر بسيط للغاية، حيث لا يتطلب سوى تغيير السلسلة "yolov8n.pt" إلى "yolo26n.pt" في النص الخاص بك.

تطبيقات عملية في أرض الواقع

غالبًا ما يعتمد الاختيار بين هذه النماذج على قيود النشر الخاصة بك، على الرغم من أن YOLO26 موصى به عالميًا للمشاريع الجديدة.

الحوسبة الطرفية وشبكات إنترنت الأشياء

بالنسبة للبيئات الطرفية — مثل نشرات Raspberry Pi أو أجهزة الاستشعار المحلية في المصانع — فإنYOLO26 هو البطل بلا منازع. بفضل CPU المُحسّنة أصلاً وهيكلها NMS يمكن للكاميرات الذكية معالجة مقاطع الفيديو ذات معدل الإطارات العالي لإدارة مواقف السيارات دون فقدان الإطارات بسبب اختناقات ما بعد المعالجة.

الصور الملتقطة من ارتفاعات عالية ومن الجو

في مراقبة الزراعة أو فحص البنية التحتية باستخدام الطائرات بدون طيار، يعد اكتشاف الأجسام الصغيرة أمرًا بالغ الأهمية. يتيح تطبيق ProgLoss + STAL في YOLO26 detect الآفات detect أو الكسور الدقيقة في خطوط الأنابيب التي YOLOv8 تفوت البنى القديمة مثل YOLOv8 مما يوفر استدعاء ودقة فائقتين في مجموعات البيانات مثل VisDrone.

GPU القديمة

YOLOv8 لا يزال مناسبًا للأنظمة المرتبطة بشكل وثيق بنتائج انحدار الصندوق المحدد الخاص بها أو عمليات النشر المؤسسية التي تخضع لدورات تحقق ممتدة ولا يمكنها تغيير البنى بسهولة.

حالات الاستخدام والتوصيات

YOLOv8 الاختيار بين YOLO26 و YOLOv8 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار YOLO26

YOLO26 هو خيار قوي لـ:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

متى تختار YOLOv8

YOLOv8 في الحالات التالية:

  • نشر متعدد المهام متعدد الاستخدامات: المشاريع التي تتطلب نموذجًا مثبتًا للكشف والتجزئة والتصنيف وتقدير الوضع داخل نظام Ultralytics .
  • أنظمة الإنتاج الراسخة: بيئات الإنتاج الحالية المبنية بالفعل على YOLOv8 مع خطوط إنتاج مستقرة ومختبرة جيدًا.
  • دعم واسع من المجتمع والنظام البيئي: تطبيقات تستفيد من البرامج التعليمية الشاملة YOLOv8OLOv8، وعمليات الدمج مع أطراف ثالثة، وموارد المجتمع النشطة.

مثال على الكود: البدء

الاستفادة من قوة أحدث Ultralytics أمر في غاية البساطة. يوضح Python التالي تدريب نموذج YOLO26 على مجموعة بيانات مخصصة، مع ملاحظة أن مُحسّن MuSGD يحقق تقاربًا سريعًا تلقائيًا.

from ultralytics import YOLO

# Load the highly efficient YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train on the standard COCO8 dataset
# The ecosystem handles hyperparameter tuning and augmentations natively
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Automatically utilizes CUDA if available
)

# Run end-to-end, NMS-free inference on a source image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Visualize the resulting detections
predictions[0].show()

نماذج أخرى يجب أخذها في الاعتبار

بينما يمثل YOLO26 أحدث ما توصلت إليه التكنولوجيا في الوقت الحالي، يمكن للمطورين الذين يعملون على إنشاء تطبيقات متنوعة استكشاف ما يلي أيضًا:

  • YOLO11: السلف المباشر لـ YOLO26، يقدم تحسينات استثنائية مقارنة بـ YOLOv8 يزال يستخدم بكثرة في أنظمة الإنتاج المتطورة.
  • RT-DETR: محول الكشف في الوقت الحقيقي من Baidu. إنه خيار ممتاز للباحثين الذين يستكشفون آلية الانتباه في مهام الرؤية، على الرغم من أنه يتطلب CUDA أكبر بكثير للتدريب مقارنةYOLO Ultralytics YOLO القياسية.

للحصول على مجموعة شاملة من التدريب على السحابة وتصنيف مجموعات البيانات والنشر الفوري، استكشف Ultralytics اليوم.


تعليقات