تخطي إلى المحتوى

YOLOv9 مقابل YOLO26: تحليل مقارن للهندسة المعمارية والأداء

يتطور مشهد اكتشاف الأجسام في الوقت الفعلي باستمرار، حيث يجلب كل تكرار جديد تحسينات كبيرة في الدقة والسرعة والكفاءة. تقدم هذه المقالة مقارنة تقنية متعمقة بين YOLOv9، وهو نموذج قوي تم إصداره في أوائل عام 2024، و YOLO26، أحدث نموذج متطور من Ultralytics مصمم للجيل القادم من تطبيقات الذكاء الاصطناعي الحافي.

نظرة عامة على النموذج

يمثل كلا النموذجين معالم مهمة في رؤية الكمبيوتر، ومع ذلك، فإنهما يتعاملان مع مشكلة الاكتشاف من فلسفات معمارية مختلفة قليلاً.

YOLOv9: معلومات التدرج القابلة للبرمجة

تم إصداره في فبراير 2024 من قبل باحثين من Academia Sinica، تايوان، وقدم YOLOv9 مفاهيم جديدة لمعالجة فقدان المعلومات في الشبكات العصبية العميقة.

  • المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
  • المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
  • التاريخ: 21 فبراير 2024
  • الابتكار الرئيسي: معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
  • التركيز: تحسين استخدام المعلمات وتدفق التدرج أثناء التدريب لزيادة الاحتفاظ بالمعلومات في الطبقات العميقة إلى أقصى حد.

تعرف على المزيد حول YOLOv9

YOLO26: التطور الأصيل للحافة

تم إطلاقه في يناير 2026 بواسطة Ultralytics، ويمثل YOLO26 نقلة نوعية نحو الكفاءة الشاملة والنشر المبسّط، خاصة لأجهزة CPU والأجهزة الطرفية.

  • المؤلفون: Glenn Jocher و Jing Qiu
  • المؤسسة:Ultralytics
  • التاريخ: 14 يناير 2026
  • الابتكار الرئيسي: هندسة معمارية شاملة خالية من NMS، ومُحسّن MuSGD، وإزالة Distribution Focal Loss (DFL).
  • التركيز: تقليل زمن استجابة الاستدلال على الأجهزة غير المعتمدة على GPU، وتبسيط عمليات التصدير، وتثبيت ديناميكيات التدريب باستخدام تقنيات مستوحاة من نماذج اللغة الكبيرة (LLMs).

تعرف على المزيد حول YOLO26

الاختلافات المعمارية

يكمن الاختلاف الجوهري بين هذين النموذجين في تصميم الرأس وصياغة الخسارة، مما يؤثر بشكل مباشر على سرعة نشرهما واستقرار تدريبهما.

هندسة YOLOv9 المعمارية

يستخدم YOLOv9 شبكة تجميع الطبقات الفعالة المعممة (GELAN). تتيح هذه البنية المعمارية دمجًا مرنًا لمختلف الكتل الحسابية (مثل CSPNet أو ELAN) دون التضحية بالسرعة. يوفر إدخال معلومات التدرج القابلة للبرمجة (PGI) إطار عمل إشرافيًا مساعدًا. تضمن PGI عدم فقدان معلومات الميزات الحاسمة أثناء انتشارها عبر الطبقات العميقة، وهي مشكلة شائعة في النماذج خفيفة الوزن. بينما تعتبر هذه البنية فعالة للغاية من حيث الدقة، إلا أنها تعتمد على آليات تقليدية قائمة على المراسي وخطوات معالجة لاحقة مثل Non-Maximum Suppression (NMS).

هندسة YOLO26 المعمارية

يعتمد YOLO26 تصميمًا شاملاً أصيلًا خاليًا من NMS. من خلال التنبؤ بالكائنات مباشرة دون الحاجة إلى معالجة لاحقة معقدة، يقلل YOLO26 بشكل كبير من زمن الاستجابة، خاصة على الأجهزة الطرفية حيث يمكن أن يكون NMS عنق الزجاجة الحسابي.

تشمل التحولات المعمارية الرئيسية في YOLO26 ما يلي:

  • إزالة DFL: تمت إزالة Distribution Focal Loss لتبسيط رسم بياني النموذج، مما يجعل تنسيقات التصدير مثل ONNX و TensorRT أنظف وأسرع على الرقائق منخفضة الطاقة.
  • ProgLoss + STAL: تعمل دوال الخسارة الجديدة على تحسين التعرف على الكائنات الصغيرة، وهو متطلب حاسم للمهام مثل تحليل الصور الجوية والروبوتات.
  • مُحسّن MuSGD: مزيج هجين من SGD و Muon (مستوحى من تدريب LLM)، يوفر تقاربًا أسرع وتقليلًا في ارتفاعات استهلاك الذاكرة أثناء التدريب.

أهمية التخلص من NMS

تتنبأ كاشفات الكائنات التقليدية بالعديد من مربعات الإحاطة لنفس الكائن وتستخدم Non-Maximum Suppression (NMS) لتصفيتها. غالبًا ما تكون هذه الخطوة متسلسلة وبطيئة على وحدات CPU. يلغي تصميم YOLO26 الشامل هذه الخطوة تمامًا، مما يؤدي إلى استدلال أسرع بنسبة تصل إلى 43% على CPU.

مقارنة الأداء

عند تقييم هذه النماذج، ينظر الباحثون عادةً إلى متوسط الدقة المتوسطة (mAP) على مجموعة بيانات COCO إلى جانب سرعة الاستدلال.

مقاييس الأداء المعيارية

يسلط الجدول التالي الضوء على المفاضلات في الأداء. بينما يوفر YOLOv9 دقة قوية، يحقق YOLO26 نسب سرعة إلى دقة متفوقة، خاصة على أجهزة CPU.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

تحليل

  • السرعة: يُظهر YOLO26 ميزة واضحة في سرعة الاستدلال. على سبيل المثال، يعتبر YOLO26n أسرع بكثير من سابقاته، مما يجعله مثاليًا لمعالجة الفيديو بمعدلات إطارات عالية (FPS).
  • الدقة: يتفوق YOLO26 على نماذج YOLOv9 المكافئة في mAP، خاصة في المتغيرات النانوية (n) والصغيرة (s)، وهي الأكثر استخدامًا في الإنتاج.
  • الحساب: يتطلب YOLO26 باستمرار عددًا أقل من FLOPs (عمليات النقطة العائمة) لتحقيق دقة أعلى، مما يشير إلى تصميم معماري أكثر كفاءة.

التدريب وسهولة الاستخدام

بالنسبة للمطورين، تعد سهولة التدريب والنشر بنفس أهمية المقاييس الخام.

النظام الإيكولوجي والدعم

تستفيد نماذج Ultralytics، بما في ذلك YOLO26، من نظام بيئي قوي ومُصان جيدًا. الـ ultralytics حزمة python توفر واجهة برمجة تطبيقات موحدة لـ تدريب, التحقق، و النشر.

YOLOv9، على الرغم من قوته، هو في الأساس مستودع بحثي. يتطلب دمجه في مسارات الإنتاج غالبًا المزيد من التكوين اليدوي مقارنة بتجربة "pip install and go" لإطار عمل Ultralytics.

كفاءة التدريب

يساعد مُحسّن MuSGD الخاص بـ YOLO26 على استقرار التدريب، مما يقلل الحاجة إلى ضبط مكثف للمعلمات الفائقة. علاوة على ذلك، تُعرف نماذج Ultralytics باستهلاكها الأقل للذاكرة أثناء التدريب مقارنة بالبدائل القائمة على المحولات (transformer-based)، مما يسمح للمستخدمين بتدريب أحجام دفعات أكبر على وحدات GPU المخصصة للمستهلكين.

فيما يلي مثال على مدى سهولة تدريب نموذج YOLO26 باستخدام واجهة برمجة تطبيقات Ultralytics:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

حالات الاستخدام المثالية

يعتمد الاختيار بين هذه النماذج على قيودك المحددة.

متى تختار YOLOv9

  • البحث والدراسة الأكاديمية: إذا كان عملك يتضمن دراسة تدفق التدرج (gradient flow) أو إعادة إنتاج معايير محددة من ورقة YOLOv9 البحثية.
  • مسارات العمل القديمة المحددة: إذا كان لديك مسار عمل (pipeline) حالي مُعد خصيصًا لهندسة GELAN ولا يمكنك تبديل هياكل النموذج بسهولة.

متى تختار YOLO26

ما وراء الاكتشاف

على عكس مستودع YOLOv9 القياسي، يأتي YOLO26 بتحسينات خاصة بالمهام جاهزة للاستخدام. يتضمن ذلك خسارة التجزئة الدلالية (Semantic segmentation loss) لتحسين دقة القناع وتقدير الاحتمالية اللوغاريتمية المتبقية (Residual Log-Likelihood Estimation (RLE)) للحصول على نقاط مفتاحية أكثر دقة في تقدير الوضعيات.

الخلاصة

بينما قدم YOLOv9 مفاهيم رائعة تتعلق بالتدرجات القابلة للبرمجة واحتفاظ المعلومات، يمثل YOLO26 التطور العملي لهذه الأفكار ليصبح قوة جاهزة للإنتاج. إن بنيته الشاملة والخالية من NMS، جنبًا إلى جنب مع النظام البيئي البرمجي الشامل لـ Ultralytics، يجعله الخيار الموصى به للمطورين الذين يسعون إلى الموازنة بين السرعة والدقة وسهولة الاستخدام في عام 2026.

للمهتمين باستكشاف معماريات حديثة أخرى، تغطي الوثائق أيضًا YOLO11، الذي لا يزال نموذجًا عالي الكفاءة لمهام رؤية الكمبيوتر للأغراض العامة.


تعليقات