Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 في مقابل YOLO26: تحليل تقني معمق للكشف الحديث عن الأجسام#

لقد تطور مشهد الكشف عن الأجسام في الوقت الفعلي بشكل ملحوظ على مدى السنوات القليلة الماضية. ونظراً لسعي ممارسي تعلم الآلة لنشر النماذج عبر مجموعة متنوعة من الأجهزة، أصبح اختيار البنية الصحيحة أمراً بالغ الأهمية. في هذا الدليل التقني الشامل، نقارن بين علامتين فارقتين في مجال الرؤية الحاسوبية: YOLOv9، الذي تم تقديمه في أوائل عام 2024 مع التركيز على تحسينات مسار التدرج، و Ultralytics YOLO26، وهو أحدث إطار عمل متطور تم إصداره في أوائل عام 2026 والذي يعيد تعريف الاستدلال على الحافة واستقرار التدريب بالكامل.

Link to this sectionملخص تنفيذي: سلالة النماذج والتأليف#

يوفر فهم أصول نماذج التعلم العميق هذه سياقاً قيماً فيما يتعلق بخيارات تصميمها المعماري والجمهور المستهدف.

Link to this sectionYOLOv9#

تم تأليف YOLOv9 من قبل Chien-Yao Wang و Hong-Yuan Mark Liao من معهد علوم المعلومات في Academia Sinica في تايوان، وصدر في 21 فبراير 2024. يركز النموذج بشكل كبير على مفاهيم التعلم العميق النظرية، وتحديداً معالجة مشكلة عنق زجاجة المعلومات في الشبكات العصبية التلافيفية (CNNs) العميقة.

اعرف المزيد حول YOLOv9

Link to this sectionUltralytics YOLO26#

تم تأليف YOLO26 من قبل Glenn Jocher و Jing Qiu في Ultralytics، وصدر في 14 يناير 2026. بناءً على النجاح الهائل لأسلافه مثل YOLO11 و YOLOv8، تم تصميم YOLO26 من الأساس لإعطاء الأولوية لجاهزية الإنتاج، والنشر على الحافة، والكفاءة الشاملة الأصلية.

اعرف المزيد عن YOLO26

جرب YOLO26 اليوم

هل أنت مستعد لترقية خط إنتاج الرؤية الحاسوبية الخاص بك؟ يمكنك بسهولة تدريب ونشر نماذج YOLO26 في السحابة دون كتابة أي كود باستخدام Ultralytics Platform.

Link to this sectionالابتكارات المعمارية#

يقدم كلا النموذجين تغييرات رائدة في كيفية معالجة الشبكات العصبية للبيانات المرئية، لكنهما يتعاملان مع المشكلة من زوايا مختلفة.

Link to this sectionمعلومات التدرج القابلة للبرمجة في YOLOv9#

تتمثل المساهمة الرئيسية لـ YOLOv9 في هذا المجال في تقديم معلومات التدرج القابلة للبرمجة (PGI) و شبكة تجميع الطبقات الفعالة المعممة (GELAN). مع ازدياد عمق الشبكات العصبية، فإنها غالباً ما تعاني من فقدان المعلومات أثناء عملية التغذية الأمامية. تضمن PGI أن التدرجات المستخدمة لتحديث الأوزان أثناء الانتشار العكسي تظل دقيقة وموثوقة، مما يسمح لـ بنية GELAN بتحقيق دقة عالية مع عدد أقل من المعلمات.

ومع ذلك، يعتمد YOLOv9 بشكل كبير على كبت الحد الأقصى غير (NMS) التقليدي للمعالجة اللاحقة، وهو ما قد يصبح عنق زجاجة في زمن الاستجابة أثناء الاستدلال في العالم الحقيقي.

Link to this sectionبنية الحافة أولاً لـ YOLO26#

يتبع YOLO26 نهجاً مختلفاً جذرياً من خلال تحسين خط الإنتاج بأكمله من التدريب إلى النشر في الوقت الفعلي. وهو يبني على تصميم شامل خالٍ من NMS الذي تم ريادته لأول مرة في YOLOv10، مما يلغي تماماً الحاجة إلى معالجة NMS اللاحقة. ينتج عن هذا زمن استجابة منخفض للغاية، مما يجعله محسناً بشكل كبير لأجهزة الحافة مثل Raspberry Pi أو NVIDIA Jetson.

علاوة على ذلك، يزيل YOLO26 توزيع الفقد البؤري (DFL) تماماً. هذا التغيير الهيكلي يبسط تصدير النموذج إلى ONNX ويوفر توافقاً أفضل بكثير مع وحدات التحكم الدقيقة منخفضة الطاقة.

بالنسبة لمرحلة التدريب، يدمج YOLO26 مُحسِّن MuSGD الجديد، وهو هجين من الانحدار التدرجي العشوائي و Muon (مستوحى من منهجيات تدريب LLM الخاصة بـ Kimi K2 من Moonshot AI). وهذا يسد الفجوة بين ابتكارات تدريب النماذج اللغوية الكبيرة (LLM) والرؤية الحاسوبية، مما يوفر تدريباً أكثر استقراراً وأوقات تقارب أسرع بشكل كبير.

Link to this sectionمقارنة الأداء والمقاييس#

عند إجراء القياس على مجموعة بيانات COCO المستخدمة على نطاق واسع، يظهر كلا النموذجين قدرات استثنائية، لكن نظام Ultralytics يتألق في سرعات الاستدلال العملية وكفاءة المعلمات.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Link to this sectionتحليل النتائج#

  • السرعة والكفاءة: نظراً لأن YOLO26 يستخدم بنية خالية من NMS ووظائف فقد مبسطة، فإنه يتميز بـ سرعة استدلال وحدة المعالجة المركزية (CPU) أسرع بنسبة تصل إلى 43% مقارنة بالبنى القديمة. يعمل نموذج YOLO26n بسرعة فائقة تبلغ 1.7 مللي ثانية على وحدة معالجة الرسومات NVIDIA T4 باستخدام TensorRT، مما يجعله الخيار الأمثل لتدفقات الفيديو في الوقت الفعلي.
  • الدقة: يحقق نموذج YOLO26x دقة 57.5 mAP غير مسبوقة، متفوقاً على أكبر نموذج YOLOv9e مع الحفاظ على زمن استجابة أقل.
  • متطلبات الذاكرة: تشتهر نماذج Ultralytics بكفاءتها. يتطلب YOLO26 ذاكرة CUDA أقل بكثير أثناء تدريب النموذج والاستدلال مقارنة بـ نماذج الرؤية القائمة على المحولات المعقدة، مما يسمح للمطورين باستخدام أحجام دفعات أكبر على الأجهزة الاستهلاكية.

Link to this sectionالنظام البيئي، وسهولة الاستخدام، وتعدد الاستخدامات#

تكمن القوة الحقيقية لنظام Ultralytics في تجربة المستخدم. بينما يتعين على الباحثين الذين يستخدمون قاعدة كود GitHub الخاصة بـ YOLOv9 التنقل عبر إعدادات بيئة معقدة وكتابة نصوص برمجية يدوية، فإن YOLO26 مدمج بالكامل في واجهة برمجة تطبيقات Ultralytics Python البديهية.

Link to this sectionمثال مبسط لواجهة برمجة التطبيقات#

يتطلب تدريب نموذج YOLO26 متطور بضعة أسطر فقط من كود Python:

from ultralytics import YOLO

# Load the latest native end-to-end YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with the default MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export natively to ONNX format in a single command
model.export(format="onnx")

Link to this sectionتعدد استخدامات لا مثيل له#

على عكس YOLOv9، المصمم أساساً للكشف القياسي عن الأجسام، يدعم YOLO26 محلياً مجموعة واسعة من مهام الرؤية الحاسوبية مباشرة. تتضمن البنية تحسينات محددة لتطبيقات متنوعة:

  • تجزئة المثيلات: يتميز بفقد تجزئة دلالي متخصص و proto متعدد المقاييس لأقنعة دقيقة على مستوى البكسل.
  • تقدير الوضعية: يدمج تقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتتبع النقاط الهيكلية بدقة فائقة.
  • صناديق التحديد الموجهة (OBB): يتضمن وظيفة فقد زاوية متخصصة مصممة خصيصاً لحل مشكلات الحدود في الكشف عن الأجسام المدورة للصور الجوية.
  • تصنيف الصور: تصنيف قوي للصور بأكملها بناءً على معايير ImageNet.
نظام بيئي متكامل

تستفيد جميع نماذج YOLO26 من التكامل السلس مع Ultralytics Platform، مما يوفر ميزات مدمجة لتصنيف مجموعات البيانات، والتعلم النشط، وخطوط أنابيب النشر الفوري.

Link to this sectionتطبيقات العالم الحقيقي#

غالباً ما يعتمد الاختيار بين هذه النماذج على البيئة التي سيتم نشرها فيها.

Link to this sectionإنترنت الأشياء وروبوتات الحافة#

بالنسبة للروبوتات، والطائرات بدون طيار المستقلة، وأجهزة إنترنت الأشياء المنزلية الذكية، يعد YOLO26 البطل بلا منازع. يجلب دمج ProgLoss + STAL تحسينات ملحوظة على التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لـ المراقبة الزراعية من الطائرات بدون طيار عالية الارتفاع. مقترناً باستدلال وحدة المعالجة المركزية الأسرع بنسبة 43% وتصميمه الخالي من NMS، يمكن لـ YOLO26 العمل بسلاسة على الأجهزة بدون وحدات معالجة رسومات مخصصة.

Link to this sectionالبحث الأكاديمي وتحليل التدرج#

يظل YOLOv9 نموذجاً يحظى باحترام كبير في الأوساط الأكاديمية. سيجد الباحثون الذين يبحثون في الحدود النظرية لتدفق التدرج، أو أولئك الذين يسعون لبناء طبقات PyTorch مخصصة بناءً على مفهوم PGI، أن قاعدة كود YOLOv9 هي أساس ممتاز لاستكشاف نظرية التعلم العميق.

Link to this sectionخطوط أنابيب التصنيع عالية السرعة#

في البيئات الصناعية مثل الكشف عن العيوب الآلي على أحزمة النقل عالية السرعة، تضمن سرعات TensorRT الفائقة لنماذج YOLO26 عدم فقدان أي إطارات، مما يزيد من إنتاجية أنظمة ضمان الجودة.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOv9 و YOLO26 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOv9#

يعتبر YOLOv9 خياراً قوياً لـ:

  • أبحاث عنق زجاجة المعلومات: المشاريع الأكاديمية التي تدرس معمارية معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
  • دراسات تحسين تدفق التدرج: الأبحاث التي تركز على فهم وتخفيف فقدان المعلومات في طبقات الشبكة العميقة أثناء التدريب.
  • قياس أداء الاكتشاف عالي الدقة: السيناريوهات التي تحتاج فيها إلى أداء قياس COCO القوي لـ YOLOv9 كنقطة مرجعية للمقارنات المعمارية.

Link to this sectionمتى تختار YOLO26#

يُنصح باستخدام YOLO26 لـ:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استدلالاً ثابتاً ومنخفض التأخير دون تعقيد المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئات تعتمد فقط على CPU: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث توفر سرعة استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionخاتمة#

يمثل كلا النموذجين قفزات مذهلة إلى الأمام للمجتمع مفتوح المصدر. قدم YOLOv9 تحسينات نظرية حيوية لتدفق التدرج ستلهم البنى لسنوات قادمة. ومع ذلك، بالنسبة للمطورين المعاصرين، والشركات الناشئة، وفرق المؤسسات التي تبحث عن توازن لا تشوبه شائبة بين السرعة والدقة وسهولة النشر، فإن Ultralytics YOLO26 هو التوصية الواضحة.

من خلال التخلص من NMS، وتقديم مُحسِّن MuSGD القوي، وتوفير مجموعة لا مثيل لها من الأدوات عبر مهام الكشف والتجزئة والوضعية، يضمن YOLO26 بناء مشاريع الرؤية الحاسوبية الخاصة بك على إطار العمل الأكثر موثوقية والمستقبلي المتاح اليوم.

المساهمون

التعليقات