تخطي إلى المحتوى

YOLOv9 YOLOv8: الهندسة المعمارية والأداء والتطبيقات

تستمر وتيرة تطور نماذج الكشف عن الأجسام في التسارع، مما يوفر للمطورين أدوات متطورة بشكل متزايد لمهام الرؤية الحاسوبية. ومن أهم المساهمات في هذا المجال YOLOv9، الذي طوره باحثون في أكاديمية سينيكا، و YOLOv8 من Ultralytics. على الرغم من أن كلا النموذجين يمثلان تطوراً في أحدث ما توصلت إليه التكنولوجيا، إلا أنهما يستخدمان استراتيجيات معمارية متميزة ويلبيان احتياجات نشر مختلفة.

يقدم هذا الدليل مقارنة تقنية متعمقة بين YOLOv9 YOLOv8 حيث يحلل هياكلهما ومقاييس أدائهما ومنهجيات التدريب الخاصة بهما لمساعدتك في اختيار الأداة المناسبة لتطبيقك.

نظرة عامة على النموذج

قبل الخوض في المواصفات الفنية، من الضروري فهم الأصول والفلسفات التصميمية الأساسية الكامنة وراء هاتين البنيتين القويتين.

YOLOv9: معلومات التدرج القابلة للبرمجة

صدر YOLOv9 في فبراير 2024 عن Chien-Yao Wang و Hong-Yuan Mark Liao من معهد علوم المعلومات، أكاديمية سينكا، YOLOv9 على حل مشكلة فقدان المعلومات في الشبكات العميقة. يقدم المؤلفان ابتكارين أساسيين: معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).

  • PGI: يعالج مشكلة "اختناق المعلومات" حيث يتم فقدان البيانات أثناء مرورها عبر الطبقات العميقة. ويوفر إشرافًا إضافيًا لضمان احتفاظ الفرع الرئيسي بالمعلومات المهمة.
  • GELAN: بنية خفيفة الوزن تعمل على تحسين كفاءة المعلمات، وتجمع بين أفضل جوانب CSPNet و ELAN لتعظيم تخطيط مسار التدرج.

تعرف على المزيد حول YOLOv9

YOLOv8: المعيار القياسي للاستخدامية والسرعة

أطلقت Ultralytics YOLOv8 Ultralytics يناير 2023، YOLOv8 أصبح معيارًا صناعيًا للكشف عن الأجسام في الوقت الفعلي. وقد أدخلت رأس كشف بدون مرساة وعمود فقري جديد مصمم للسرعة والدقة. وبالإضافة إلى المقاييس الأولية، YOLOv8 تجربة المطور، حيث توفر إطارًا موحدًا للكشف والتجزئة والتصنيف وتقدير الوضع.

  • تصميم خالٍ من المراسي: يقلل من عدد تنبؤات الصناديق، مما يسرع عملية Non-Maximum Suppression (NMS).
  • تعزيز الفسيفساء: روتينات تدريب متقدمة تعمل على تحسين المتانة في مواجهة الخلفيات المتنوعة.
  • تكامل النظام البيئي: يتكامل بسلاسة مع أدوات النشر والتصدير والتتبع.

تعرف على المزيد حول YOLOv8

مقارنة الأداء

عند اختيار نموذج للإنتاج، فإن التوازن بين سرعة الاستدلال ودقة الكشف (mAP) أمر بالغ الأهمية. يوضح الجدول أدناه الأداء على COCO وهي معيار قياسي للكشف عن الكائنات.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

النقاط الرئيسية

  • الدقة: يحقق YOLOv9 mAP أعلى في نماذج ذات نطاقات مماثلة. تلتقط بنية GELAN الميزات المعقدة بفعالية، مما يجعلها خيارًا قويًا للبحوث الأكاديمية حيث كل نقطة مئوية من الدقة مهمة.
  • السرعة: YOLOv8 بسرعات استدلال فائقة، لا سيما على GPU (TensorRT). تتيح وحدات C2f المُحسّنة والرأس الخالي من المثبتات معالجة أسرع، وهو أمر بالغ الأهمية للاستدلال في الوقت الفعلي في تدفقات الفيديو.
  • الكفاءة: في حين أن YOLOv9 عدد أقل من المعلمات في بعض التكوينات، فإن Ultralytics عادةً ما تستهلك ذاكرة أقل أثناء التدريب. تتيح هذه الكفاءة للمطورين تدريب YOLOv8 أجهزة من فئة المستهلكين ذات CUDA أقل مقارنةً بالبنى البحثية الأكثر تعقيدًا.

التدريب وسهولة الاستخدام

غالبًا ما تحدد تجربة المستخدم مدى سرعة انتقال المشروع من مرحلة التصور إلى مرحلة التنفيذ. وهنا، يتضح الفرق في دعم النظام البيئي.

ميزة Ultralytics

Ultralytics ، بما في ذلك YOLOv8 YOLO26 الأحدث، مبنية على Python موحدة. وهذا يضمن اتساق واجهة برمجة التطبيقات (API)، مما يسمح للمطورين بالتبديل بين إصدارات النماذج أو المهام بسطر واحد من التعليمات البرمجية.

تشمل ميزات نظام Ultralytics ما يلي:

  • MLOps الآلي: دعم متكامل لـ Comet و MLflow لتتبع التجارب.
  • تصدير بسيط: تصدير بنقرة واحدة إلى تنسيقات مثل ONNXو OpenVINOو CoreML الأجهزة المحمولة والأجهزة الطرفية.
  • وثائق شاملة: مكتبة ضخمة من الأدلة التي تغطي كل شيء بدءًا من ضبط المعلمات الفائقة وحتى زيادة البيانات.
from ultralytics import YOLO

# Load a model (YOLOv8 or YOLOv9)
model = YOLO("yolov8n.pt")  # Switch to 'yolov9c.pt' instantly

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export for deployment
model.export(format="onnx")

YOLOv9

على الرغم من YOLOv9 في Ultralytics لتسهيل الاستخدام، YOLOv9 التنفيذ الأصلي يعتمد على نصوص برمجية وملفات تكوين منفصلة. قد يجد المستخدمون الذين ينتقلون من قاعدة الكود الأصلية أن Ultralytics يبسط سير عملهم بشكل كبير، مما يلغي الحاجة إلى إدارة هياكل المجلدات المعقدة أو تنزيل الأوزان يدويًا.

سير عمل مبسط

استخدام YOLOv9 ultralytics تمنح الحزمة إمكانية الوصول إلى جميع مزايا النظام البيئي، بما في ذلك المحور التكامل و المستكشف API، والتي لا تتوفر في المستودع المستقل.

حالات الاستخدام في العالم الحقيقي

يعتمد اختيار النموذج المناسب بشكل كبير على القيود المحددة لتطبيقك.

السيناريوهات المثالية لـ YOLOv9

  • التصوير الطبي: في مهام مثل الكشف عن أورام الدماغ أو تحليل الأشعة السينية، تساعد معلومات التدرج القابلة للبرمجة (PGI) في الاحتفاظ بتفاصيل النسيج الهامة التي قد تضيع بخلاف ذلك، مما يضمن دقة تشخيصية عالية.
  • كشف الأجسام الصغيرة: تتميز بنية GELAN بالحفاظ على الميزات، مما يجعل YOLOv9 لكشف الأجسام الصغيرة في الصور الجوية عالية الدقة أو مقاطع الفيديو الملتقطة بواسطة الطائرات بدون طيار.
  • المقارنة الأكاديمية: سيستفيد الباحثون الذين يهدفون إلى نشر أحدث النتائج من mAP العالية mAP التي توفرها نماذج YOLOv9 الأكبر حجماً.

السيناريوهات المثالية لـ YOLOv8

  • تحليلات البيع بالتجزئة: بالنسبة لتطبيقات مثل الدفع الآلي أو خرائط الحرارة في المتاجر، YOLOv8 السرعة اللازمة لمعالجة عدة موجات كاميرا في وقت واحد دون الحاجة إلى أجهزة باهظة الثمن.
  • الأنظمة المدمجة: توافق النموذج مع TFLite و Edge TPU مثاليًا للتشغيل على أجهزة مثل Raspberry Pi أو NVIDIA .
  • الروبوتات: في البيئات الديناميكية حيث يكون زمن الاستجابة عاملاً حاسماً في التنقل وتجنب العوائق، YOLOv8 الاستدلال السريع لـ YOLOv8 قدرة الروبوتات على الاستجابة في الوقت الفعلي.

المستقبل: YOLO26

على الرغم من أن YOLOv9 YOLOv8 خياران ممتازان، YOLOv8 هذا المجال استمر في التقدم. يجب على المطورين الذين يبحثون عن أحدث التقنيات أن يأخذوا YOLO26 في الاعتبار. تم إصداره في يناير 2026، وهو يمثل قفزة كبيرة إلى الأمام في الكفاءة والأداء.

يقدم YOLO26 العديد من الميزات الرائدة:

  • NMS من البداية إلى النهاية: من خلال التخلص من تقنية Non-Maximum Suppression، تعمل YOLO26 على تبسيط النشر وتقليل زمن الاستجابة بشكل كبير، وهي تقنية تم تحسينها من YOLOv10.
  • MuSGD Optimizer: مُحسِّن هجين يجمع بين SGD Muon، مما يوفر تحسينات في استقرار التدريب التي تظهر في LLMs إلى الرؤية الحاسوبية.
  • تعدد الاستخدامات المحسّن: التحسينات المتخصصة في الصناديق المحددة الاتجاه (OBB) وتقدير الوضع تجعلها الأداة الأكثر تنوعًا في الاستخدامات لمهام الرؤية المعقدة.
  • تحسين الحافة: مع CPU أسرع بنسبة تصل إلى 43٪ من الأجيال السابقة، تم تصميمه خصيصًا للحوسبة الطرفية والتطبيقات المحمولة.

بالنسبة للمشاريع الجديدة، YOLOv9 بشدة بتقييم YOLO26 جنبًا إلى جنب مع YOLOv8 YOLOv9 لضمان الاستفادة من أحدث التطورات في كفاءة الذكاء الاصطناعي.

تعرف على المزيد حول YOLO26

الخلاصة

YOLOv8 كل من YOLOv9 YOLOv8 مزايا مميزة. YOLOv9 بنية قوية لتحقيق أقصى دقة من خلال إدارة معلومات التدرج المتقدمة، بينما YOLOv8 توازنًا لا مثيل له بين السرعة وسهولة الاستخدام ودعم النظام البيئي.

بالنسبة للمطورين الذين يبحثون عن تجربة سلسة مع وثائق شاملة ودعم من المجتمع، تظل Ultralytics — بما في ذلك YOLOv8 YOLO26 الجديدة — الخيار الأول. تتيح القدرة على الانتقال بسهولة بين الكشف والتجزئة والتصنيف ضمن إطار عمل واحد للفرق بناء حلول ذكاء اصطناعي معقدة بشكل أسرع وأكثر موثوقية.

استكشف المجموعة الكاملة من النماذج وابدأ التدريب اليوم باستخدام Ultralytics وهي أبسط طريقة لتعليق نماذج الرؤية الحاسوبية وتدريبها ونشرها.


تعليقات