YOLOv9 في مقابل YOLO26: تحليل تقني معمق للكشف الحديث عن الأجسام

لقد تطور مشهد الكشف عن الأجسام في الوقت الفعلي بشكل ملحوظ على مدى السنوات القليلة الماضية. ونظراً لسعي ممارسي تعلم الآلة لنشر النماذج عبر مجموعة متنوعة من الأجهزة، أصبح اختيار البنية الصحيحة أمراً بالغ الأهمية. في هذا الدليل التقني الشامل، نقارن بين علامتين فارقتين في مجال الرؤية الحاسوبية: YOLOv9، الذي تم تقديمه في أوائل عام 2024 مع التركيز على تحسينات مسار التدرج، و Ultralytics YOLO26، وهو أحدث إطار عمل متطور تم إصداره في أوائل عام 2026 والذي يعيد تعريف الاستدلال على الحافة واستقرار التدريب بالكامل.

ملخص تنفيذي: سلالة النماذج والتأليف

يوفر فهم أصول نماذج التعلم العميق هذه سياقاً قيماً فيما يتعلق بخيارات تصميمها المعماري والجمهور المستهدف.

YOLOv9

تم تأليف YOLOv9 من قبل Chien-Yao Wang و Hong-Yuan Mark Liao من معهد علوم المعلومات في Academia Sinica في تايوان، وصدر في 21 فبراير 2024. يركز النموذج بشكل كبير على مفاهيم التعلم العميق النظرية، وتحديداً معالجة مشكلة عنق زجاجة المعلومات في الشبكات العصبية التلافيفية (CNNs) العميقة.

اعرف المزيد حول YOLOv9

Ultralytics YOLO26

تم تأليف YOLO26 من قبل Glenn Jocher و Jing Qiu في Ultralytics، وصدر في 14 يناير 2026. بناءً على النجاح الهائل لأسلافه مثل YOLO11 و YOLOv8، تم تصميم YOLO26 من الأساس لإعطاء الأولوية لجاهزية الإنتاج، والنشر على الحافة، والكفاءة الشاملة الأصلية.

اعرف المزيد عن YOLO26

جرب YOLO26 اليوم

هل أنت مستعد لترقية خط إنتاج الرؤية الحاسوبية الخاص بك؟ يمكنك بسهولة تدريب ونشر نماذج YOLO26 في السحابة دون كتابة أي كود باستخدام Ultralytics Platform.

الابتكارات المعمارية

يقدم كلا النموذجين تغييرات رائدة في كيفية معالجة الشبكات العصبية للبيانات المرئية، لكنهما يتعاملان مع المشكلة من زوايا مختلفة.

معلومات التدرج القابلة للبرمجة في YOLOv9

تتمثل المساهمة الرئيسية لـ YOLOv9 في هذا المجال في تقديم معلومات التدرج القابلة للبرمجة (PGI) و شبكة تجميع الطبقات الفعالة المعممة (GELAN). مع ازدياد عمق الشبكات العصبية، فإنها غالباً ما تعاني من فقدان المعلومات أثناء عملية التغذية الأمامية. تضمن PGI أن التدرجات المستخدمة لتحديث الأوزان أثناء الانتشار العكسي تظل دقيقة وموثوقة، مما يسمح لـ بنية GELAN بتحقيق دقة عالية مع عدد أقل من المعلمات.

ومع ذلك، يعتمد YOLOv9 بشكل كبير على كبت الحد الأقصى غير (NMS) التقليدي للمعالجة اللاحقة، وهو ما قد يصبح عنق زجاجة في زمن الاستجابة أثناء الاستدلال في العالم الحقيقي.

بنية الحافة أولاً لـ YOLO26

يتبع YOLO26 نهجاً مختلفاً جذرياً من خلال تحسين خط الإنتاج بأكمله من التدريب إلى النشر في الوقت الفعلي. وهو يبني على تصميم شامل خالٍ من NMS الذي تم ريادته لأول مرة في YOLOv10، مما يلغي تماماً الحاجة إلى معالجة NMS اللاحقة. ينتج عن هذا زمن استجابة منخفض للغاية، مما يجعله محسناً بشكل كبير لأجهزة الحافة مثل Raspberry Pi أو NVIDIA Jetson.

علاوة على ذلك، يزيل YOLO26 توزيع الفقد البؤري (DFL) تماماً. هذا التغيير الهيكلي يبسط تصدير النموذج إلى ONNX ويوفر توافقاً أفضل بكثير مع وحدات التحكم الدقيقة منخفضة الطاقة.

بالنسبة لمرحلة التدريب، يدمج YOLO26 مُحسِّن MuSGD الجديد، وهو هجين من الانحدار التدرجي العشوائي و Muon (مستوحى من منهجيات تدريب LLM الخاصة بـ Kimi K2 من Moonshot AI). وهذا يسد الفجوة بين ابتكارات تدريب النماذج اللغوية الكبيرة (LLM) والرؤية الحاسوبية، مما يوفر تدريباً أكثر استقراراً وأوقات تقارب أسرع بشكل كبير.

مقارنة الأداء والمقاييس

عند إجراء القياس على مجموعة بيانات COCO المستخدمة على نطاق واسع، يظهر كلا النموذجين قدرات استثنائية، لكن نظام Ultralytics يتألق في سرعات الاستدلال العملية وكفاءة المعلمات.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

تحليل النتائج

  • السرعة والكفاءة: نظراً لأن YOLO26 يستخدم بنية خالية من NMS ووظائف فقد مبسطة، فإنه يتميز بـ سرعة استدلال وحدة المعالجة المركزية (CPU) أسرع بنسبة تصل إلى 43% مقارنة بالبنى القديمة. يعمل نموذج YOLO26n بسرعة فائقة تبلغ 1.7 مللي ثانية على وحدة معالجة الرسومات NVIDIA T4 باستخدام TensorRT، مما يجعله الخيار الأمثل لتدفقات الفيديو في الوقت الفعلي.
  • الدقة: يحقق نموذج YOLO26x دقة 57.5 mAP غير مسبوقة، متفوقاً على أكبر نموذج YOLOv9e مع الحفاظ على زمن استجابة أقل.
  • متطلبات الذاكرة: تشتهر نماذج Ultralytics بكفاءتها. يتطلب YOLO26 ذاكرة CUDA أقل بكثير أثناء تدريب النموذج والاستدلال مقارنة بـ نماذج الرؤية القائمة على المحولات المعقدة، مما يسمح للمطورين باستخدام أحجام دفعات أكبر على الأجهزة الاستهلاكية.

النظام البيئي، وسهولة الاستخدام، وتعدد الاستخدامات

تكمن القوة الحقيقية لنظام Ultralytics في تجربة المستخدم. بينما يتعين على الباحثين الذين يستخدمون قاعدة كود GitHub الخاصة بـ YOLOv9 التنقل عبر إعدادات بيئة معقدة وكتابة نصوص برمجية يدوية، فإن YOLO26 مدمج بالكامل في واجهة برمجة تطبيقات Ultralytics Python البديهية.

مثال مبسط لواجهة برمجة التطبيقات

يتطلب تدريب نموذج YOLO26 متطور بضعة أسطر فقط من كود Python:

from ultralytics import YOLO

# Load the latest native end-to-end YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with the default MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export natively to ONNX format in a single command
model.export(format="onnx")

تعدد استخدامات لا مثيل له

على عكس YOLOv9، المصمم أساساً للكشف القياسي عن الأجسام، يدعم YOLO26 محلياً مجموعة واسعة من مهام الرؤية الحاسوبية مباشرة. تتضمن البنية تحسينات محددة لتطبيقات متنوعة:

  • تجزئة المثيلات: يتميز بفقد تجزئة دلالي متخصص و proto متعدد المقاييس لأقنعة دقيقة على مستوى البكسل.
  • تقدير الوضعية: يدمج تقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتتبع النقاط الهيكلية بدقة فائقة.
  • صناديق التحديد الموجهة (OBB): يتضمن وظيفة فقد زاوية متخصصة مصممة خصيصاً لحل مشكلات الحدود في الكشف عن الأجسام المدورة للصور الجوية.
  • تصنيف الصور: تصنيف قوي للصور بأكملها بناءً على معايير ImageNet.
نظام بيئي متكامل

تستفيد جميع نماذج YOLO26 من التكامل السلس مع Ultralytics Platform، مما يوفر ميزات مدمجة لتصنيف مجموعات البيانات، والتعلم النشط، وخطوط أنابيب النشر الفوري.

تطبيقات العالم الحقيقي

غالباً ما يعتمد الاختيار بين هذه النماذج على البيئة التي سيتم نشرها فيها.

إنترنت الأشياء وروبوتات الحافة

بالنسبة للروبوتات، والطائرات بدون طيار المستقلة، وأجهزة إنترنت الأشياء المنزلية الذكية، يعد YOLO26 البطل بلا منازع. يجلب دمج ProgLoss + STAL تحسينات ملحوظة على التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لـ المراقبة الزراعية من الطائرات بدون طيار عالية الارتفاع. مقترناً باستدلال وحدة المعالجة المركزية الأسرع بنسبة 43% وتصميمه الخالي من NMS، يمكن لـ YOLO26 العمل بسلاسة على الأجهزة بدون وحدات معالجة رسومات مخصصة.

البحث الأكاديمي وتحليل التدرج

يظل YOLOv9 نموذجاً يحظى باحترام كبير في الأوساط الأكاديمية. سيجد الباحثون الذين يبحثون في الحدود النظرية لتدفق التدرج، أو أولئك الذين يسعون لبناء طبقات PyTorch مخصصة بناءً على مفهوم PGI، أن قاعدة كود YOLOv9 هي أساس ممتاز لاستكشاف نظرية التعلم العميق.

خطوط أنابيب التصنيع عالية السرعة

في البيئات الصناعية مثل الكشف عن العيوب الآلي على أحزمة النقل عالية السرعة، تضمن سرعات TensorRT الفائقة لنماذج YOLO26 عدم فقدان أي إطارات، مما يزيد من إنتاجية أنظمة ضمان الجودة.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLOv9 و YOLO26 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار YOLOv9

يعتبر YOLOv9 خياراً قوياً لـ:

  • أبحاث عنق زجاجة المعلومات: المشاريع الأكاديمية التي تدرس معمارية معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
  • دراسات تحسين تدفق التدرج: الأبحاث التي تركز على فهم وتخفيف فقدان المعلومات في طبقات الشبكة العميقة أثناء التدريب.
  • قياس أداء الاكتشاف عالي الدقة: السيناريوهات التي تحتاج فيها إلى أداء قياس COCO القوي لـ YOLOv9 كنقطة مرجعية للمقارنات المعمارية.

متى تختار YOLO26

يُنصح باستخدام YOLO26 لـ:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استدلالاً ثابتاً ومنخفض التأخير دون تعقيد المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئات تعتمد فقط على CPU: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث توفر سرعة استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

خاتمة

يمثل كلا النموذجين قفزات مذهلة إلى الأمام للمجتمع مفتوح المصدر. قدم YOLOv9 تحسينات نظرية حيوية لتدفق التدرج ستلهم البنى لسنوات قادمة. ومع ذلك، بالنسبة للمطورين المعاصرين، والشركات الناشئة، وفرق المؤسسات التي تبحث عن توازن لا تشوبه شائبة بين السرعة والدقة وسهولة النشر، فإن Ultralytics YOLO26 هو التوصية الواضحة.

من خلال التخلص من NMS، وتقديم مُحسِّن MuSGD القوي، وتوفير مجموعة لا مثيل لها من الأدوات عبر مهام الكشف والتجزئة والوضعية، يضمن YOLO26 بناء مشاريع الرؤية الحاسوبية الخاصة بك على إطار العمل الأكثر موثوقية والمستقبلي المتاح اليوم.

التعليقات