YOLOX مقابل YOLOv9: مقارنة التصميمات الخالية من المراسي بالتدرجات القابلة للبرمجة
لقد تشكلت رؤية الكمبيوتر بفضل الاختراقات المعمارية المستمرة التي توازن بين الكفاءة الحاسوبية والدقة العالية. عند تقييم نماذج الكشف عن الأشياء في الوقت الفعلي، YOLOv9 المقارنة بين YOLOX من Megvii و YOLOv9 من Academia Sinica فلسفتين متميزتين في تطوير التعلم العميق. ففي حين أن إحداهما كانت رائدة في نموذج مبسط خالٍ من المراسي، أدخلت الأخرى تقنيات توجيه متدرجة متقدمة لتعظيم الاحتفاظ بالمعلومات.
يستكشف هذا الدليل الفني الفروق الدقيقة في بنيتها ومعايير أدائها وحالات الاستخدام المثالية، كما يوضح كيف توفر الحلول الحديثة مثل Ultralytics ونموذج YOLO26 الذي تم إصداره مؤخرًا بدائل فائقة الجودة للعمليات النشر الجاهزة للإنتاج.
YOLOX: رائدة في نموذج بدون مرساة
صدر YOLOX في منتصف عام 2021، وكان خطوة كبيرة إلى الأمام في سد الفجوة بين البحث الأكاديمي والتطبيق الصناعي. من خلال إزالة الحاجة إلى مربعات الربط المحددة مسبقًا، فقد بسط بشكل كبير الضبط التجريبي المطلوب لمجموعات البيانات المخصصة.
- المؤلفون: تشنغ قه، سونغتاو ليو، فنغ وانغ، زيمينغ لي، وجيان صن
- المؤسسة:Megvii
- تاريخ الإصدار: 18 يوليو 2021
- المصدر:ورقة أرشيفية
- كود المصدر:مستودع YOLOX GitHub
- الوثائق:الوثائق الرسمية لـ YOLOX
الابتكارات المعمارية
أدخلت YOLOX عدة تغييرات أساسية على خط أنابيب الكشف القياسي. فقد طبقت رأسًا منفصلاً، وفصلت مهام التصنيف والانحدار، مما قلل بشكل كبير من التضارب بين تحديد الكائن وتحديد حدوده. علاوة على ذلك، اعتمدت YOLOX SimOTA، وهي استراتيجية متقدمة لتعيين التسميات قامت بتخصيص العينات الإيجابية ديناميكيًا أثناء التدريب، مما أدى إلى تقارب أسرع وأداء عام أفضل على مجموعات البيانات القي اسية المعيارية.
نقاط القوة والقيود
تكمن القوة الأساسية لـ YOLOX في تصميمها المبسط. تعني الآلية الخالية من المراسي أن المطورين يقضون وقتًا أقل في تشغيل خوارزميات التجميع للعثور على أحجام المراسي المثلى لبياناتهم المحددة. ومع ذلك، باعتبارها بنية قديمة تم إنشاؤها أصلاً دون التقدمات الحديثة في مجال الانتباه الذاتي أو مسار التدرج، فإنها تكافح لمضاهاة كفاءة المعلمات للشبكات الأحدث. كما أنها تفتقر إلى الدعم الأصلي للمهام المتقدمة مثل تقسيم المثيلات وتقدير الوضع ضمن واجهة برمجة تطبيقات موحدة.
YOLOv9: تعظيم معلومات التدرج
بالانتقال السريع إلى عام 2024، YOLOv9 نهجًا نظريًا للغاية لحل مشكلة اختناق المعلومات المتأصلة في الشبكات العصبية التلافيفية العميقة.
- المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
- المؤسسة:معهد علوم المعلومات، أكاديميا سينيكا
- تاريخ الإصدار: 21 فبراير 2024
- المصدر:ورقة أرشيفية
- كود المصدر:مستودعYOLOv9
- الوثائق:YOLOv9 Ultralytics YOLOv9
الابتكارات المعمارية
الميزة المميزة YOLOv9 هي معلومات التدرج القابلة للبرمجة (PGI)، والتي تضمن عدم فقدان البيانات الدلالية المهمة أثناء مرورها عبر طبقات متعددة من الشبكة. بالاقتران مع شبكة تجميع الطبقات العامة الفعالة (GELAN)، YOLOv9 نسبة استثنائية بين المعلمات والدقة. وهذا يسمح للنموذج بالاحتفاظ بتدرجات دقيقة لتحديث الأوزان، مما يجعله فعالًا للغاية حتى في متغيراته خفيفة الوزن.
نقاط القوة والقيود
YOLOv9 في تجاوز الحدود النظرية لدقة النموذج. فهو يحقق mAP رائعة على COCO مما يجعله المفضل لدى الباحثين. ومع ذلك، على الرغم من كفاءته، YOLOv9 يعتمد على تقنية Non-Maximum Suppression (NMS) التقليدية للمعالجة اللاحقة، مما يؤدي إلى ارتفاعات في زمن الاستجابة أثناء الاستدلال. بالنسبة للمهندسين الذين يركزون على نشر الذكاء الاصطناعي على الأجهزة الطرفية، فإن إدارة NMS تضيف تعقيدًا غير ضروري إلى مسار النشر.
عقبات ما بعد المعالجة
YOLOv9 النماذج التقليدية مثل YOLOX و YOLOv9 تقنية Non-Maximum Suppression (NMS) لتصفية المربعات المحددة المكررة. هذه الخطوة متسلسلة بطبيعتها وغالبًا ما تخلق اختناقًا في وحدات المعالجة المركزية (CPU)، مما يسلط الضوء على الحاجة إلى البنى الأصلية الشاملة الموجودة في أحدث Ultralytics .
مقارنة الأداء
عند مقارنة المقاييس الحسابية الأولية لهذه البنى، يتضح أن YOLOv9 أساسًا أكثر حداثة، بينما يظل YOLOX خيارًا خفيفًا للإعدادات القديمة. فيما يلي تفصيل مفصل لنماذجها القياسية.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
بينما YOLOv9 دقة فائقة عبر عدد معلمات قابلة للمقارنة، يجب على المطورين الباحثين عن التوازن المثالي بين السرعة والدقة وسهولة الاستخدام أن يأخذوا في الاعتبار أحدث التطورات من Ultralytics.
Ultralytics : تعرف على YOLO26
في حين أن تقييم النماذج التاريخية مثل YOLOX و YOLOv9 سياقًا قيمًا، فإن أحدث ما توصلت إليه التكنولوجيا حاليًا يتمثل في Ultralytics . تم إصدار YOLO26 في أوائل عام 2026، وهو يعيد تصميم خط أنابيب الكشف بشكل جذري لبيئات المؤسسات الحديثة.
ابتكارات معمارية لا مثيل لها
يحل YOLO26 تمامًا مشاكل المعالجة اللاحقة التي واجهتها الإصدارات السابقة بفضل تصميمه الأصلي الشامل NMS، مما يضمن سهولة النشر على جميع الأجهزة. علاوة على ذلك، من خلال إزالة خسارة التركيز التوزيعي (DFL) ودمج مُحسِّن MuSGDالجديد — وهو مزيج من التدرج العشوائي والميون — يحقق YOLO26 استقرارًا غير مسبوق في التدريب.
بالنسبة للمطورين الذين ينشرون في بيئات مقيدة مثل Raspberry Pi، يوفر YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU . كما يقدم وظائف الخسارة ProgLoss + STAL، مما يؤدي إلى تحسينات كبيرة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية للتصوير الجوي وتحليلات الطائرات بدون طيار.
نظام بيئي مبسط للتطوير
على عكس مستودعات الأبحاث المستقلة، يوفر Ultralytics تجربة مطورين لا مثيل لها. باستخدام Python Ultralytics Python ، يمكن للمهندسين تقليل الكود النمطي بشكل كبير. علاوة على ذلك، يتم الحفاظ على متطلبات الذاكرة محسّنة للغاية، مما يعني أنه يمكنك تدريب نماذج قوية باستخدام GPU أقل مقارنة بالبنى القائمة على الاهتمام بشكل كبير.
from ultralytics import YOLO
# Load the highly optimized, NMS-free YOLO26 small model
model = YOLO("yolo26s.pt")
# Train on a custom dataset with minimal memory footprint
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Easily export to optimized deployment formats
model.export(format="engine", half=True) # Exports to TensorRT
بالإضافة إلى الكشف، يدعم YOLO26 بسلاسة العديد من المهام ضمن نفس الإطار بالضبط. سواء كنت بحاجة إلى مربعات حدودية موجهة (OBB) دقيقة للتصوير عبر الأقمار الصناعية أو أقنعة بكسل دقيقة لتطبيقات التصوير الطبي، يظل سير العمل كما هو. بالنسبة للفرق التي استثمرت في سير العمل من الجيل السابق، Ultralytics YOLO11 متاح أيضًا ومدعوم بالكامل.
حالات الاستخدام المثالية واستراتيجيات النشر
يعتمد اختيار البنية المناسبة بشكل كامل على بيئة النشر المستهدفة ومتطلبات المشروع.
الحوسبة الطرفية والروبوتات
بالنسبة للأجهزة منخفضة الطاقة، فإن الاعتماد على النماذج التي تتطلب معالجة لاحقة مكثفة يمكن أن يضعف الأداء. على الرغم من أن YOLOX-Nano صغير للغاية، إلا أن دقته غالبًا ما تكون غير كافية للمهام الحساسة من الناحية الأمنية. YOLO26 هو الخيار الأمثل هنا؛ حيث إن عدم احتوائه على DFL و NMS له بالعمل بسلاسة على CPU الخام، مما يجعله مثاليًا للروبوتات المستقلة أو إدارة مواقف السيارات الذكية.
المقارنة المعيارية الأكاديمية
إذا كان الهدف الوحيد هو تحليل تدفق التدرج ودراسة اختناقات الشبكات العميقة، YOLOv9 موضوعًا ممتازًا للدراسة. يوفر إطار عمل PGI الخاص به رؤى مثيرة للاهتمام حول كيفية الحفاظ على الميزات عبر طبقات الشبكات العصبية العميقة، مما يجعله أداة قيّمة للباحثين الجامعيين الذين يستكشفون نظرية التلافيف.
تحليلات الفيديو المؤسسية
بالنسبة لمهام معالجة الفيديو على نطاق واسع مثل أنظمة الإنذار الأمني أو مراقبة حركة المرور، فإن السرعة وقدرات التصدير المتنوعة تعتبر أمراً بالغ الأهمية. تتيح أدوات التصدير الأصلية التي يوفرها Ultralytics للفرق تجميع YOLO26 مباشرة إلى TensorRT أو OpenVINO بأمر واحد، مما يقلل بشكل كبير من وقت طرح المنتج في السوق.
من خلال الاستفادة من الميزات الشاملة Ultralytics يمكن لفرق التعلم الآلي تجاوز تعقيدات قواعد بيانات البحوث الأولية والتركيز مباشرة على بناء تطبيقات ذكاء اصطناعي قابلة للتطوير وواقعية.