YOLO26 مقابل YOLOv8: التطورات في الجيل القادم من اكتشاف الكائنات

تم تحديد تطور رؤية الحاسوب من خلال السعي لتحقيق أداء في الوقت الفعلي دون التضحية بالدقة. بينما يتنقل المطورون والباحثون في مشهد التعلم الآلي الحديث، يعد اختيار بنية النموذج المناسبة أمراً بالغ الأهمية. يستكشف هذا المقارنة التقنية الشاملة القفزة الجيلية من Ultralytics YOLOv8، وهي بنية شائعة جداً أعادت تعريف المعايير في عام 2023، إلى Ultralytics YOLO26 المتطورة، التي تم إصدارها في يناير 2026.

من خلال التعمق في بنيتها ومقاييس الأداء ومنهجيات التدريب، نسلط الضوء على سبب توفير الترقية إلى أحدث الابتكارات لمزايا مميزة في اكتشاف الكائنات والتجزئة وما هو أبعد من ذلك.

خلفية النموذج والبيانات الوصفية

إن فهم أصول هذه البنيات يوفر سياقاً لاختراقاتها. تم تطوير كلا النموذجين بواسطة Ultralytics، وهي شركة مشهورة بجعل الذكاء الاصطناعي المتطور في متناول الجميع وسهل النشر.

تفاصيل YOLO26:\nالمؤلفون: Glenn Jocher و Jing Qiu\nالمؤسسة: Ultralytics\nالتاريخ: 2026-01-14\nGitHub: https://github.com/ultralytics/ultralytics\nالمستندات: https://docs.ultralytics.com/models/yolo26/

اعرف المزيد عن YOLO26

تفاصيل YOLOv8:\nالمؤلفون: Glenn Jocher و Ayush Chaurasia و Jing Qiu\nالمؤسسة: Ultralytics\nالتاريخ: 2023-01-10\nGitHub: https://github.com/ultralytics/ultralytics\nالمستندات: https://docs.ultralytics.com/models/yolov8/

اعرف المزيد عن YOLOv8

الابتكارات المعمارية

يُدخل الانتقال من YOLOv8 إلى YOLO26 تحولات كبيرة في كيفية معالجة الشبكات العصبية للبيانات المرئية وحساب الخسارة.

YOLO26: قمة كفاءة الحافة

تم تصميم YOLO26 من الألف إلى الياء للقضاء على اختناقات النشر وتعظيم سرعة الاستنتاج على الأجهزة ذات الموارد المحدودة.

  • تصميم من طرف إلى طرف بدون NMS: بناءً على المفاهيم التي تم ريادتها لأول مرة في YOLOv10، يستخدم YOLO26 بنية من طرف إلى طرف محلياً. من خلال القضاء تماماً على الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، يتم القضاء فعلياً على تباين زمن الاستجابة. هذا يبسط منطق النشر للتطبيقات التي تتطلب ضمانات صارمة في الوقت الفعلي.
  • إزالة DFL: تعمل إزالة Distribution Focal Loss (DFL) على تبسيط رأس الإخراج بشكل كبير. يتيح هذا الاختيار المعماري توافقاً أفضل بكثير مع أجهزة الحافة منخفضة الطاقة وتصديرات أبسط إلى تنسيقات مثل ONNX و CoreML.
  • مُحسِّن MuSGD: مستوحى من استقرار التدريب الذي شوهد في النماذج اللغوية الكبيرة (LLMs) مثل Kimi K2 من Moonshot AI، يستخدم YOLO26 مُحسِّن MuSGD—وهو مزيج من Stochastic Gradient Descent و Muon. هذا يجلب ابتكارات التدريب على نطاق LLM إلى رؤية الحاسوب، مما يؤدي إلى تقارب أسرع وتشغيل تدريب مستقر للغاية.
  • ProgLoss + STAL: لمكافحة المشكلة الصعبة المعروفة المتمثلة في التعرف على الأجسام الصغيرة، يطبق YOLO26 خسارة تدريجية (ProgLoss) مدمجة مع خسارة الارتكاز المتسامحة مع النطاق (STAL). يوفر هذا تحسينات حاسمة لـ اكتشاف الأشياء الصغيرة، مما يجعله مثالياً لتطبيقات الطائرات بدون طيار.
التحسينات الخاصة بالمهمة

يقدم YOLO26 أيضاً ترقيات مستهدفة عبر مجالات رؤية الحاسوب المتعددة. فهو يستخدم خسارة التجزئة الدلالية و proto متعدد النطاقات من أجل تجزئة المثيل بشكل أفضل، وتقدير الاحتمالية المتبقية (RLE) لـ تقدير الوضع بدقة عالية، وخوارزميات خسارة الزاوية المتخصصة لحل مشكلات الحدود في صناديق التقييد الموجهة (OBB).

YOLOv8: حصان العمل متعدد الاستخدامات للغاية

عند إصداره في عام 2023، وضع YOLOv8 معياراً جديداً من خلال الانتقال الكامل إلى تصميم خالٍ من الارتكاز، والذي تعمم بشكل أفضل عبر نسب أبعاد مجموعة البيانات المختلفة.

  • وحدة C2f: استبدلت وحدة C3 القديمة بكتلة C2f، مما يسمح بتدفق أفضل للتدرج عبر العمود الفقري للشبكة.
  • رأس مفكك: يتميز YOLOv8 برأس مفكك حيث يتم حساب التصنيف وانحدار صندوق التقييد بشكل مستقل، مما يعزز بشكل كبير متوسط الدقة (mAP).
  • تعدد مهام المهام: كان أحد النماذج الأولى التي توفر واجهة برمجة تطبيقات موحدة حقاً لـ تصنيف الصور والاكتشاف والتجزئة ومهام الوضع خارج الصندوق.

مقاييس الأداء ومتطلبات الموارد

عند تقييم النماذج للإنتاج، فإن التوازن بين الدقة وسرعة الاستنتاج وحجم النموذج أمر بالغ الأهمية. يظهر YOLO26 ميزة جيلية واضحة عبر جميع متغيرات الحجم.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

ملاحظة: القيم المظللة توضح توازن الأداء ومكاسب الكفاءة لبنية YOLO26 مقارنة بسابقتها.

التحليل

يحقق YOLO26 استنتاجاً أسرع لوحدة المعالجة المركزية بنسبة تصل إلى 43% مقارنة بنماذج YOLOv8 المماثلة. على سبيل المثال، يحقق YOLO26n 38.9 مللي ثانية على وحدة معالجة مركزية تستخدم ONNX، مقارنة بـ 80.4 مللي ثانية لـ YOLOv8n، كل ذلك مع زيادة mAP من 37.3 إلى 40.9. هذه القفزة الهائلة في كفاءة وحدة المعالجة المركزية هي نتيجة مباشرة لإزالة DFL والتصميم الخالي من NMS، مما يجعل YOLO26 قوة مطلقة للبيئات التي تفتقر إلى وحدات معالجة الرسومات المخصصة.

علاوة على ذلك، تتميز نماذج YOLO26 بأعداد معلمات و FLOPs أقل لفئات حجمها، مما يعادل تقليلاً جذرياً لاستخدام ذاكرة وحدة معالجة الرسومات أثناء الاستنتاج والتدريب مقارنة بالبنيات القائمة على Transformer القديمة.

ميزة نظام Ultralytics البيئي

من الاعتبارات الرئيسية عند اختيار نموذج ذكاء اصطناعي هي البنية التحتية المحيطة. يستفيد كل من YOLO26 و YOLOv8 بشكل كبير من منصة Ultralytics الموحدة، مما يوفر تجربة مطور لا مثيل لها.

  1. سهولة الاستخدام: تضمن فلسفة "من الصفر إلى الاحتراف" أن المطورين يمكنهم تحميل وتدريب وتصدير النماذج بأقل قدر من التعليمات البرمجية. تظل واجهة برمجة تطبيقات Python متسقة عبر أجيال النماذج.
  2. كفاءة التدريب: تتطلب نماذج Ultralytics YOLO ذاكرة CUDA أقل بشكل استثنائي أثناء عمليات التدريب مقارنة بنماذج Transformer (مثل RT-DETR). يسمح هذا باستخدام أحجام دفعات أكبر على أجهزة المستهلك، مما يضفي طابعاً ديمقراطياً على أبحاث الذكاء الاصطناعي.
  3. نظام بيئي مُصان جيداً: مدعوماً بالتحديثات المستمرة وخطوط أنابيب CI/CD الصارمة والتكامل العميق مع أدوات مثل Weights & Biases و TensorRT، فإن مستودع Ultralytics قوي وجاهز للإنتاج.
  4. تنوع لا مثيل له: نماذج Ultralytics ليست ذات غرض واحد؛ استيراد واحد يعالج مجموعات بيانات متنوعة، مما يعزز سير العمل للأنظمة المعقدة التي تتطلب التتبع والتصنيف والتجزئة في وقت واحد.
ترقيات مبسطة

نظراً لأن واجهة برمجة تطبيقات Ultralytics موحدة للغاية، فإن ترقية نظام الإنتاج من YOLOv8 إلى YOLO26 بسيطة حرفياً مثل تغيير السلسلة "yolov8n.pt" إلى "yolo26n.pt" في البرنامج النصي الخاص بك.

تطبيقات العالم الحقيقي

غالباً ما يعتمد الاختيار بين هذه النماذج على قيود النشر الخاصة بك، على الرغم من أن YOLO26 موصى به عالمياً للمشاريع الجديدة.

حوسبة الحافة وشبكات IoT

بالنسبة لبيئات الحافة - مثل عمليات نشر Raspberry Pi أو أجهزة استشعار أرضية المصنع الموضعية - فإن YOLO26 هو البطل بلا منازع. تعني سرعة وحدة المعالجة المركزية المحسّنة محلياً وهيكل NMS-free أن الكاميرات الذكية يمكنها معالجة فيديو عالي معدل الإطارات لـ إدارة مواقف السيارات دون إسقاط إطارات بسبب اختناقات المعالجة اللاحقة.

الصور عالية الارتفاع والجوية

في المراقبة الزراعية أو فحص البنية التحتية عبر الطائرات بدون طيار، يعد اكتشاف الأشياء الصغيرة أمراً بالغ الأهمية. يسمح تنفيذ ProgLoss + STAL في YOLO26 باكتشاف الآفات الصغيرة أو الكسور الدقيقة في خطوط الأنابيب التي قد تفوتها البنيات القديمة مثل YOLOv8 باستمرار، مما يوفر استدعاء ودقة متفوقين على مجموعات البيانات مثل VisDrone.

أنظمة وحدة معالجة الرسومات القديمة

يظل YOLOv8 ذا صلة بالأنظمة المقترنة بشدة بمخرجات انحدار صندوق التقييد الخاصة به أو عمليات نشر المؤسسات التي تكون مقفلة في دورات التحقق الموسعة ولا يمكنها ترحيل البنيات بسهولة.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLO26 و YOLOv8 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار YOLO26

يعتبر YOLO26 خياراً قوياً لـ:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استدلالاً ثابتاً ومنخفض التأخير دون تعقيد المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئات تعتمد فقط على CPU: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث توفر سرعة استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

متى تختار YOLOv8

يوصى بـ YOLOv8 لما يلي:

  • نشر متعدد المهام متعدد الاستخدامات: المشاريع التي تتطلب نموذجاً ثابتاً لـ الاكتشاف و التجزئة و التصنيف و تقدير الوضع داخل نظام Ultralytics البيئي.
  • أنظمة الإنتاج القائمة: بيئات الإنتاج الحالية التي تم بناؤها بالفعل على بنية YOLOv8 مع خطوط أنابيب نشر مستقرة ومختبرة جيداً.
  • دعم المجتمع والنظام البيئي الواسع: التطبيقات التي تستفيد من دروس YOLOv8 الشاملة وعمليات تكامل الطرف الثالث وموارد المجتمع النشطة.

مثال على الكود: البدء

الاستفادة من قوة أحدث نماذج Ultralytics أمر مباشر للغاية. يوضح كود Python التالي تدريب نموذج YOLO26 على مجموعة بيانات مخصصة، مع مراقبة مُحسِّن MuSGD الذي يدفع التقارب السريع تلقائياً.

from ultralytics import YOLO

# Load the highly efficient YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train on the standard COCO8 dataset
# The ecosystem handles hyperparameter tuning and augmentations natively
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Automatically utilizes CUDA if available
)

# Run end-to-end, NMS-free inference on a source image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Visualize the resulting detections
predictions[0].show()

نماذج أخرى للنظر فيها

بينما يمثل YOLO26 أحدث ما توصلت إليه التكنولوجيا، قد يستكشف المطورون الذين يبنون تطبيقات متنوعة أيضاً:

  • YOLO11: السلف المباشر لـ YOLO26، حيث يقدم تحسيناً استثنائياً على YOLOv8 ولا يزال يُستخدم بكثافة في أنظمة الإنتاج المتطورة.
  • RT-DETR: محول الكشف في الوقت الفعلي من Baidu. إنه خيار ممتاز للباحثين الذين يستكشفون آلية الانتباه في مهام الرؤية، على الرغم من أنه يتطلب ذاكرة CUDA أكثر بكثير للتدريب مقارنة بنماذج Ultralytics YOLO القياسية.

للحصول على مجموعة شاملة من التدريب السحابي وتوسيم مجموعات البيانات والنشر الفوري، استكشف منصة Ultralytics اليوم.

التعليقات