YOLOv8 مقابل YOLO26: تطور الكشف عن الكائنات في الوقت الفعلي من Ultralytics

شهد مجال الرؤية الحاسوبية تطورات ملحوظة على مدار السنوات القليلة الماضية. ومن بين أكثر البنيات شيوعاً للتطبيقات في الوقت الفعلي هي النماذج التي طورتها Ultralytics. يقدم هذا الدليل الشامل مقارنة تقنية مفصلة بين Ultralytics YOLOv8 الرائد وأحدث ما توصلت إليه التقنية Ultralytics YOLO26. سنقوم بتحليل بنيتها، ومقاييس الأداء، وحالات الاستخدام المثالية لمساعدتك في اختيار النموذج المناسب لنشرك.

نظرة عامة على النماذج

يمثل كل من YOLOv8 و YOLO26 معالم هامة في عائلة نماذج YOLO. وهما يتشاركان في فلسفة Ultralytics الأساسية: تقديم نماذج سريعة ودقيقة وسهلة الاستخدام بشكل لا يصدق عبر بيئة Python و API موحدة.

YOLOv8: المعيار المتعدد الاستخدامات

تم إصدار YOLOv8 في أوائل عام 2023، وقدم تحديثاً كبيراً لإطار عمل YOLO، حيث جلب تصميماً خالياً من المراسي (anchor-free) ودعماً قوياً لمهام رؤية حاسوبية متعددة.

أصبح YOLOv8 بسرعة المعيار الصناعي نظراً لتوازنه الممتاز في الأداء وتكامله العميق مع نظام Ultralytics البيئي. وهو يدعم أصلياً اكتشاف الكائنات، وتجزئة الحالات، وتقدير الوضعية، وتصنيف الصور. ومع ذلك، فإنه يعتمد على تقنية Non-Maximum Suppression (NMS) القياسية للمعالجة اللاحقة، والتي يمكن أن تسبب اختناقات في زمن الاستجابة في بيئات الحافة ذات القيود العالية.

اعرف المزيد عن YOLOv8

YOLO26: القوة الحوسبية من الجيل التالي للحافة

تم إصدار YOLO26 في يناير 2026، وهو يأخذ الأساس الذي بناه أسلافه ويحسنه بشكل جذري لسيناريوهات النشر الحديثة، لا سيما في الذكاء الاصطناعي للحافة والأجهزة منخفضة الطاقة.

يقدم YOLO26 العديد من التحسينات التقنية التي تغير النموذج. والأهم من ذلك، أنه يتميز بـ تصميم طرف-إلى-طرف خالٍ من NMS. تم ابتكاره في البداية بواسطة YOLOv10، وتلغي هذه البنية الحاجة إلى معالجة NMS اللاحقة، مما يبسط خطوط أنابيب التصدير بشكل كبير ويقلل من تباين زمن الاستجابة. علاوة على ذلك، فإن إزالة Distribution Focal Loss (DFL) تبسط رأس الاكتشاف، مما يجعله صديقاً للغاية للنشر على أجهزة الذكاء الاصطناعي للحافة.

اعرف المزيد عن YOLO26

نماذج Ultralytics أخرى

على الرغم من أن YOLOv8 و YOLO26 قويان للغاية، قد ترغب أيضاً في التفكير في YOLO11، الذي يسد الفجوة بين هذين الجيلين ببنيات محسنة، أو YOLOv5 لعمليات التكامل القديمة المحددة للغاية.

ابتكارات البنية والتدريب

يجلب YOLO26 العديد من التطورات الجوهرية التي تحسن بشكل كبير من خط الأساس الخاص بـ YOLOv8.

تدريب محسن باستخدام MuSGD

كفاءة التدريب هي سمة مميزة لنماذج Ultralytics، والتي عادة ما تفتخر بمتطلبات ذاكرة أقل بكثير مقارنة بالبنيات الضخمة القائمة على المحولات (Transformer) مثل RT-DETR. يعزز YOLO26 هذا بشكل أكبر من خلال تقديم محسن MuSGD. مستوحى من تقنيات تدريب نماذج اللغات الكبيرة (LLM) (تحديداً Kimi K2 من Moonshot AI)، يضمن هذا المزيج من Stochastic Gradient Descent (SGD) و Muon تقارباً أسرع وديناميكيات تدريب مستقرة للغاية عبر مجموعات البيانات المعقدة.

دوال خسارة متقدمة

بالنسبة للمهام التي تتطلب دقة عالية، مثل تصوير الطائرات بدون طيار أو مستشعرات إنترنت الأشياء (IoT)، يقدم YOLO26 تقنية ProgLoss + STAL. توفر دوال الخسارة المحسنة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة. بالإضافة إلى ذلك، يجلب YOLO26 تحسينات خاصة بالمهام عبر جميع المجالات: نموذج أولي متعدد المقاييس لإنشاء قناع فائق في التجزئة، و Residual Log-Likelihood Estimation (RLE) لتقدير أكثر دقة للوضعية، وخسارة زاوية متخصصة لحل مشكلات الحدود في اكتشاف مربع الإحاطة الموجه (OBB).

تحليل الأداء والمقارنة

يسلط الجدول التالي الضوء على فروق الأداء بين النموذجين باستخدام مجموعة بيانات COCO. القيم الأفضل أداءً في كل فئة حجم مميزة بـ الخط العريض.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
YOLOv8n64037.380.41.473.28.7
YOLO26n64040.938.91.72.45.4
YOLOv8s64044.9128.42.6611.228.6
YOLO26s64048.687.22.59.520.7
YOLOv8m64050.2234.75.8625.978.9
YOLO26m64053.1220.04.720.468.2
YOLOv8l64052.9375.29.0643.7165.2
YOLO26l64055.0286.26.224.886.4
YOLOv8x64053.9479.114.3768.2257.8
YOLO26x64057.5525.811.855.7193.9

تحليل المقاييس

تكشف البيانات عن قفزة جيلية. يتفوق YOLO26 بشكل كبير على YOLOv8 عبر جميع المقاييس. يحقق نموذج YOLO26 Nano (YOLO26n) دقة مذهلة قدرها 40.9 mAP، وهي أعلى بكثير من 37.3 الخاصة بـ YOLOv8n، مع استخدام عدد أقل من المعلمات و FLOPs.

أحد أكثر التحسينات لفتاً للنظر هو سرعة الاستدلال على وحدة المعالجة المركزية (CPU). وبسبب بنيته المحسنة وإزالة DFL، يقدم YOLO26 استدلالاً على وحدة المعالجة المركزية أسرع بنسبة تصل إلى 43% عبر ONNX. هذا يجعل YOLO26 لا يضاهى لأجهزة Raspberry Pi وأجهزة الحافة الأخرى ذات الموارد المحدودة. وفي حين أن سرعات وحدة معالجة الرسوميات (GPU) باستخدام TensorRT تنافسية في كلا النموذجين، فإن كفاءة المعلمات الإجمالية لـ YOLO26 تترجم إلى بصمات ذاكرة أقل أثناء كل من التدريب والاستدلال.

سهولة الاستخدام والنظام البيئي

يستفيد كلا النموذجين بشكل كبير من نظام Ultralytics البيئي الذي يحظى بصيانة جيدة. يشيد المطورون بسهولة الاستخدام التي يوفرها API الموحد، والذي يسمح بالتبديل بين YOLOv8 و YOLO26 ببساطة عن طريق تغيير سلسلة اسم النموذج.

سواء كنت تقوم بـ ضبط المعلمات الفائقة، أو إجراء تتبع التجارب، أو استكشاف مجموعات بيانات جديدة، توفر وثائق Ultralytics موارد واسعة النطاق. علاوة على ذلك، توفر منصة Ultralytics طريقة مبسطة لتصنيف هذه النماذج وتدريبها ونشرها بسلاسة في السحابة أو محلياً.

مثال برمجي

البدء في التدريب والاستدلال بسيط للغاية. فيما يلي مثال كامل وقابل للتشغيل باستخدام Ultralytics Python API:

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 50 epochs
# The MuSGD optimizer is automatically leveraged for YOLO26
train_results = model.train(
    data="coco8.yaml",
    epochs=50,
    imgsz=640,
    device="cpu",  # Use '0' for GPU training
)

# Run inference on a sample image
# The NMS-free design provides clean, rapid predictions
results = model("https://ultralytics.com/images/bus.jpg")

# Display the predictions
results[0].show()

# Export seamlessly to ONNX for CPU deployment
export_path = model.export(format="onnx")
بساطة النشر

تصدير YOLO26 إلى تنسيقات مثل CoreML أو OpenVINO أكثر سلاسة بشكل ملحوظ من النماذج القديمة بسبب بنيته الخالية من NMS، التي تزيل العمليات المخصصة المعقدة من الرسم البياني المصدر.

حالات الاستخدام المثالية

اختيار النموذج المناسب يحدد نجاح مشروعك.

متى تختار YOLO26:

  • حوسبة الحافة والروبوتات: سرعة وحدة المعالجة المركزية (CPU) الأسرع بنسبة 43% وعدم وجود NMS تجعله الخيار الأفضل على الإطلاق للأنظمة المدمجة، والأجهزة المحمولة، والروبوتات المستقلة.
  • التصوير الجوي والأقمار الصناعية: يمنح تنفيذ ProgLoss + STAL لـ YOLO26 ميزة واضحة في اكتشاف الكائنات الصغيرة في المناظر الطبيعية المعقدة عالية الدقة.
  • المشاريع الجديدة: كأحدث إصدار مستقر، YOLO26 هو النموذج الموصى به لأي خط أنابيب تعلم آلي جديد، حيث يوفر تنوعاً متفوقاً عبر جميع المهام.

متى تحتفظ بـ YOLOv8:

  • البنية التحتية القديمة: إذا كان خط أنابيب الإنتاج الحالي الخاص بك مرتبطاً بشدة بموترات الإخراج المحددة وآليات المراسي لـ YOLOv8، فقد يتطلب الترحيل تكيفاً بسيطاً.
  • خطوط الأساس الأكاديمية: يظل YOLOv8 خط أساس مستقر ومستشهد به للغاية لأبحاث الرؤية الحاسوبية الأكاديمية التي تقارن البنيات القديمة.

في الختام، بينما وضع YOLOv8 معياراً مذهلاً لمهام الرؤية في الوقت الفعلي، فإن YOLO26 يعيد تعريف ما هو ممكن. من خلال مزج مكاسب الكفاءة الهائلة على وحدات المعالجة المركزية مع محسنات تدريب مبتكرة مستوحاة من نماذج اللغات الكبيرة (LLM)، يضمن YOLO26 أن المطورين يمكنهم نشر ذكاء اصطناعي عالي الدقة في أي بيئة أجهزة تقريباً.

التعليقات