Meet YOLO26: next-gen vision AI.

Link to this sectionمقارنة بين YOLOv9 و YOLOv5#

شهد مجال الرؤية الحاسوبية نمواً هائلاً، حيث يعمل اكتشاف الكائنات كركيزة أساسية لعدد لا يحصى من التطبيقات الصناعية والبحثية. غالباً ما يتطلب اختيار البنية المناسبة تقييماً دقيقاً لمتوسط دقة التحديد (mAP)، وسرعة الاستدلال، وحمل الذاكرة. في هذه المقارنة، نستكشف نموذجين مؤثرين للغاية: YOLOv9، الذي يشتهر باختراقاته المعمارية في الاحتفاظ بمعلومات التدرج، و Ultralytics YOLOv5، المعيار الصناعي المجرب والمختبر المعروف بسهولة استخدامه الفائقة وتعدد استخدامات النشر غير المسبوقة.

Link to this sectionالابتكارات المعمارية والأصول التقنية#

يوفر فهم الآليات الكامنة وراء هذين النموذجين سياقاً حيوياً لملفات الأداء الخاصة بهما.

Link to this sectionYOLOv9: معلومات التدرج القابلة للبرمجة#

تم تطوير YOLOv9 من قبل الباحثين Chien-Yao Wang و Hong-Yuan Mark Liao في معهد علوم المعلومات التابع لـ Academia Sinica في تايوان، وأُصدر في 21 فبراير 2024. يقدم النموذج مفهومين رائدين لمعالجة اختناق المعلومات الشائع في الشبكات العصبية العميقة: معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).

من خلال استخدام PGI، يضمن YOLOv9 الاحتفاظ بالمعلومات الحيوية طوال عملية التغذية الأمامية، مما يؤدي إلى تحديثات تدرج دقيقة للغاية. وفي الوقت نفسه، تزيد بنية GELAN من كفاءة المعاملات، مما يسمح للنموذج بتحقيق دقة متطورة مع حمل حسابي منخفض بشكل مدهش. يمكنك استكشاف التفاصيل التقنية في ورقة YOLOv9 على Arxiv أو عرض مستودع YOLOv9 على GitHub.

اعرف المزيد عن YOLOv9

Link to this sectionUltralytics YOLOv5: معيار الإنتاج#

تم تأليف YOLOv5 بواسطة Glenn Jocher وإصداره بواسطة Ultralytics في 26 يونيو 2020، وقد أحدث ثورة في إمكانية الوصول إلى الرؤية الحاسوبية. كونه أحد أوائل نماذج اكتشاف الكائنات التي تم بناؤها محلياً على إطار العمل PyTorch، فقد تجاوز تعقيدات إطار عمل Darknet C القديم. يستفيد YOLOv5 من بنية عمود فقري CSPNet محسنة للغاية وعنق PANet، مع إعطاء الأولوية لتوازن سلس بين السرعة والدقة.

ومع ذلك، فإن أعظم إنجازاته هو تكامله ضمن نظام Ultralytics البيئي الأوسع. تم تحسين YOLOv5 بشكل كبير لتحقيق كفاءة تدريب سريعة وبيئات ذات ذاكرة منخفضة، مما يجعله مستقراً للغاية لعمليات النشر على الحافة (Edge).

اعرف المزيد عن YOLOv5

كفاءة الذاكرة

عند تقييم النماذج لأجهزة الحافة، تذكر أن نماذج Ultralytics YOLO تتطلب عادةً ذاكرة GPU أقل بكثير أثناء التدريب والاستدلال مقارنة بالبنى الثقيلة القائمة على Transformer.

Link to this sectionتحليل الأداء: السرعة مقابل الدقة#

عند تصميم خط أنابيب للرؤية الحاسوبية، يجب على المطورين موازنة المقايضات بين الدقة والزمن المستغرق. يوضح الجدول التالي فروق الأداء على مجموعة بيانات COCO القياسية.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionتحليل المقايضات#

يؤسس YOLOv9 هيمنة مطلقة في الدقة الخام. يدفع YOLOv9e حدود mAP إلى 55.6%، مستفيداً من طبقات GELAN الخاصة به للحفاظ على التفاصيل الدقيقة. وهذا يجعله خياراً استثنائياً لـ التصوير الطبي أو السيناريوهات التي تتطلب دقة صارمة على الكائنات الصغيرة.

على العكس من ذلك، يتألق YOLOv5 في سرعة النشر الخام ومرونة الأجهزة. يتميز نموذج YOLOv5n (Nano) بخفة وزنه الشهيرة، حيث ينفذ عمليات الاستدلال في 1.12 مللي ثانية فقط على وحدة معالجة رسومات T4 عبر TensorRT. إذا كنت تقوم بالنشر على أجهزة IoT مقيدة، أو هواتف محمولة، أو Raspberry Pi، فإن بصمة الذاكرة الخاصة بـ YOLOv5 تجعله موثوقاً للغاية.

Link to this sectionميزة نظام Ultralytics البيئي#

هناك اعتبار رئيسي عند اختيار نموذج وهو نظام البرمجيات المحيط به. في حين يوفر YOLOv9 معايير بحثية من الطراز الأول، فإن استخدام كلا النموذجين عبر Ultralytics Python API الحديث يسد الفجوة، مما يوفر للمطورين تجربة موحدة ومبسطة.

Link to this sectionسهولة الاستخدام والتصدير#

تعمل Ultralytics على تجريد العقبات الهندسية المعقدة. يتم التعامل مع ميزات مثل تعزيز البيانات التلقائي و ضبط المعلمات الفائقة بشكل مباشر. نقل النماذج إلى الإنتاج أمر بسيط بنفس القدر، مع أوامر تصدير مدمجة لتحويل النماذج إلى تنسيقات ONNX، أو OpenVINO، أو TFLite.

Link to this sectionتعدد استخدامات المهام#

بينما يتفوق كلا النموذجين في اكتشاف الكائنات، فقد تم تصميم نماذج Ultralytics الحديثة لمعالجة مجموعة متنوعة من تحديات الرؤية الحاسوبية. يوفر الإطار الأوسع دعماً أصلياً لـ تصنيف الصور، و تجزئة المثيلات، و تقدير الوضعية، و صناديق التحديد الموجهة (OBB)، مما يسمح للمطورين بحل مشكلات رؤية متعددة دون تبديل قواعد التعليمات البرمجية.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOv9 و YOLOv5 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOv9#

YOLOv9 هي خيار قوي لـ:

  • أبحاث اختناق المعلومات: المشاريع الأكاديمية التي تدرس معمارية معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
  • دراسات تحسين تدفق التدرج: الأبحاث التي تركز على فهم وتخفيف فقدان المعلومات في طبقات الشبكة العميقة أثناء التدريب.
  • قياس أداء الكشف عالي الدقة: السيناريوهات التي تكون فيها أداء معيار COCO القوي لـ YOLOv9 مطلوباً كنقطة مرجعية للمقارنات المعمارية.

Link to this sectionمتى تختار YOLOv5#

يُنصح باستخدام YOLOv5 في الحالات التالية:

  • أنظمة الإنتاج المثبتة: عمليات النشر الحالية حيث يتم تقدير سجل YOLOv5 الطويل من الاستقرار، والوثائق الشاملة، ودعم المجتمع الضخم.
  • التدريب محدود الموارد: البيئات ذات موارد GPU المحدودة حيث تكون خط أنابيب التدريب الفعال لـ YOLOv5 ومتطلبات الذاكرة الأقل ميزة.
  • دعم واسع لتنسيقات التصدير: المشاريع التي تتطلب النشر عبر العديد من التنسيقات بما في ذلك ONNX وTensorRT وCoreML وTFLite.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionمثال على التنفيذ#

جمال نظام Ultralytics البيئي هو أنه يمكنك التبديل بين نموذج YOLOv5 ونموذج YOLOv9 ببساطة عن طريق تغيير سلسلة الأوزان.

from ultralytics import YOLO

# Load a pretrained YOLOv9 model (swap to "yolov5s.pt" to use YOLOv5)
model = YOLO("yolov9c.pt")

# Train the model efficiently on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on new images
predictions = model.predict("https://ultralytics.com/images/zidane.jpg")

# Export to ONNX for seamless deployment
model.export(format="onnx")

Link to this sectionاستكشاف البنى الأحدث#

بينما يعد YOLOv5 و YOLOv9 نموذجين ممتازين بمزايا متميزة، فإن المجال يواصل التقدم. قد يرغب المستخدمون الذين يستكشفون مشاريع جديدة أيضاً في تقييم أحدث الإصدارات من Ultralytics.

  • YOLO11: تطور قوي ومصقول لسلالة YOLOv8 يوفر توازناً ممتازاً بين السرعة والدقة عبر جميع مهام الرؤية.
  • YOLO26: تم إصداره في عام 2026، وهو التوصية النهائية لخطوط الأنابيب الحديثة. يقدم تصميماً بدون NMS من البداية إلى النهاية، مما يلغي تماماً اختناقات ما بعد المعالجة. مع إزالة DFL (تمت إزالة Distribution Focal Loss لتبسيط التصدير وتحسين التوافق مع أجهزة الحافة/الأجهزة منخفضة الطاقة)، فإنه يحقق استدلالاً على وحدة المعالجة المركزية (CPU) أسرع بنسبة تصل إلى 43%. يتم تعزيز استقرار التدريب من خلال مُحسِّن MuSGD الجديد، وتوفر ProgLoss + STAL وظائف خسارة محسنة مع تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو أمر بالغ الأهمية لـ IoT، والروبوتات، والصور الجوية، مما يجعله البنية الأكثر قوة لكل من عمليات النشر على الحافة والسحابة.

بالنسبة للفرق التي تدير مجموعات بيانات ضخمة وخطوط أنابيب نشر معقدة، يوفر استخدام منصة Ultralytics حلاً بدون تعليمات برمجية لتدريب وتتبع ونشر هذه النماذج المتطورة دون عناء.

المساهمون

التعليقات