Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 مقابل YOLOv8#

تطور مشهد الرؤية الحاسوبية في الوقت الفعلي بشكل ملحوظ على مدى السنوات القليلة الماضية، حيث يدفع كل نموذج جديد الحدود النظرية لما هو ممكن على أجهزة الحافة وخوادم السحابة على حد سواء. عند مقارنة معمارية YOLOv9 الأحدث بإطار العمل الشهير جداً Ultralytics YOLOv8، غالباً ما يواجه المطورون خياراً بين مسارات التدرج النظرية المتطورة والنظام البيئي الجاهز للإنتاج والمختبر ميدانياً بشكل مكثف.

يقارن هذا الدليل الشامل بين هذين العملاقين، ويحلل ابتكاراتهما المعمارية، ومقاييس الأداء، وسيناريوهات النشر المثالية لمساعدتك في اختيار النموذج المناسب لمشروعك القادم في مجال الذكاء الاصطناعي.

Link to this sectionالمواصفات الفنية والتأليف#

يوفر فهم سلالة هذه النماذج سياقاً أساسياً لخيارات تصميمها الخاصة.

YOLOv9 تم إصدار YOLOv9 في 21 فبراير 2024، من تأليف Chien-Yao Wang و Hong-Yuan Mark Liao في معهد علوم المعلومات، Academia Sinica، تايوان. يركز البحث الأساسي على حل عنق زجاجة المعلومات في الشبكات العصبية العميقة. يمكنك استكشاف ورقة بحث YOLOv9 الأصلية على Arxiv أو الاطلاع على الكود المصدري في مستودع YOLOv9 الرسمي على GitHub.

اعرف المزيد عن YOLOv9

Ultralytics YOLOv8 تم تطوير YOLOv8 بواسطة Glenn Jocher و Ayush Chaurasia و Jing Qiu في Ultralytics، وتم إطلاقه في 10 يناير 2023. وقد رسخ مكانته كمعيار صناعي للتنوع، حيث يوفر واجهة برمجة تطبيقات (API) موحدة لمجموعة واسعة من مهام الرؤية. تتم صيانة الكود المصدري داخل مستودع Ultralytics الرئيسي على GitHub، مما يضمن تحديثات مستمرة واستقراراً طويل الأمد.

تعرف على المزيد حول YOLOv8

Link to this sectionالابتكارات المعمارية#

Link to this sectionYOLOv9: معلومات التدرج القابلة للبرمجة#

الميزة المحددة لـ YOLOv9 هي تقديم معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN). مع ازدياد عمق الشبكات العصبية التلافيفية، فإنها عادة ما تفقد معلومات ميزات حاسمة أثناء عملية التغذية الأمامية. تعالج PGI عنق زجاجة المعلومات هذا من خلال الاحتفاظ بتدرجات دقيقة تستخدم لتحديث الأوزان، مما يضمن استخراج ميزات موثوق. تعمل هذه المعمارية على تعظيم كفاءة المعلمات، مما يسمح لـ YOLOv9 بتحقيق دقة عالية مع عدد أقل من عمليات الفاصلة العائمة (FLOPs).

Link to this sectionYOLOv8: حصان العمل متعدد الاستخدامات#

قدم YOLOv8 آلية كشف مبسطة خالية من المراسي (anchor-free)، مما يقلل من عدد توقعات الصناديق ويسرع عملية كبت غير الحد الأقصى (NMS) أثناء المعالجة اللاحقة. تعمل وحدة C2f (عنق الزجاجة الجزئي عبر المراحل مع تلافيفين) على تحسين تدفق التدرج عبر الشبكة مقارنة بالنماذج الأقدم. والأهم من ذلك، تم تصميم YOLOv8 مع مراعاة التنوع، حيث يدعم أصلياً استخراج كشف الأشياء، وتجزئة الحالات، وتقدير الوضعية، وتصنيف الصور، وصندوق الإحاطة الموجه (OBB) بشكل مباشر.

تكامل النظام البيئي

بينما يوفر YOLOv9 مقاييس كشف خام استثنائية، قد يكون دمجه أصلياً في خطوط أنابيب معقدة أمراً صعباً. يسد استخدام YOLOv9 عبر إطار عمل Ultralytics هذه الفجوة، حيث يوفر وصولاً إلى أدوات التصدير والنشر القوية لدينا.

Link to this sectionتوازن الأداء والمعايير القياسية#

تعتبر المقايضة بين السرعة والدقة العامل الأكثر أهمية عند نشر نماذج الرؤية. فيما يلي مقارنة مفصلة لأحجام النماذج، وزمن الوصول، ومتوسط الدقة (mAP) التي تم تقييمها على مجموعة بيانات COCO القياسية.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

عند تحليل المقاييس، يظهر YOLOv9 نسبة رائعة بين المعلمات والدقة. يحقق نموذج YOLOv9c نسبة mAP مذهلة تبلغ 53.0% باستخدام 25.3 مليون معلمة فقط. ومع ذلك، يحتفظ YOLOv8 بميزة كبيرة في متطلبات الذاكرة وسرعة الاستدلال على مسرعات الأجهزة، لا سيما مع متغير YOLOv8n الذي يسجل 1.47 مللي ثانية على إعداد NVIDIA TensorRT.

Link to this sectionميزة نظام Ultralytics البيئي#

اعتبار رئيسي عند اختيار معمارية هو سهولة الاستخدام والنظام البيئي البرمجي المحيط. يمكن أن تؤدي إدارة التبعيات، وكتابة أدوات تحميل البيانات المخصصة، والتعامل مع نصوص التصدير المعقدة إلى عرقلة التطوير. يقوم نظام Ultralytics البيئي المتكامل بتجريد هذه التعقيدات.

سواء اخترت YOLOv8 أو YOLOv9 (الذي يتم دعمه بالكامل ضمن مكتبة Ultralytics)، فأنت تستفيد من واجهة برمجة تطبيقات موحدة، وتقنيات تعزيز البيانات التلقائية، وتصدير تنسيق ONNX المبسط. علاوة على ذلك، تتميز معماريات Ultralytics عادةً بـ كفاءة تدريب محسنة للغاية، مما يتجنب تضخم ذاكرة CUDA الهائل المرتبط عادةً بنماذج Transformer الكبيرة.

Link to this sectionمثال على كود التدريب#

يعد تدريب أي من النموذجين باستخدام واجهة برمجة تطبيقات Python أمراً مباشراً ولا يتطلب سوى بضعة أسطر من الكود.

from ultralytics import YOLO

# Load the preferred model (swap 'yolov9c.pt' with 'yolov8n.pt' as needed)
model = YOLO("yolov8n.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance metrics
metrics = model.val()

# Export to ONNX for production deployment
model.export(format="onnx")

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOv9 و YOLOv8 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOv9#

YOLOv9 هي خيار قوي لـ:

  • أبحاث اختناق المعلومات: المشاريع الأكاديمية التي تدرس معمارية معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
  • دراسات تحسين تدفق التدرج: الأبحاث التي تركز على فهم وتخفيف فقدان المعلومات في طبقات الشبكة العميقة أثناء التدريب.
  • قياس أداء الكشف عالي الدقة: السيناريوهات التي تكون فيها أداء معيار COCO القوي لـ YOLOv9 مطلوباً كنقطة مرجعية للمقارنات المعمارية.

Link to this sectionمتى تختار YOLOv8#

يوصى بـ YOLOv8 لـ:

  • النشر متعدد المهام المتنوع: المشاريع التي تتطلب نموذجاً ثابتاً لـ الكشف، والتجزئة، والتصنيف، وتقدير الوضعية داخل نظام Ultralytics البيئي.
  • أنظمة الإنتاج الراسخة: بيئات الإنتاج الحالية المبنية بالفعل على بنية YOLOv8 مع خطوط أنابيب نشر مستقرة ومختبرة جيداً.
  • دعم مجتمعي ونظام بيئي واسع: التطبيقات التي تستفيد من دروس YOLOv8 الواسعة، والتكاملات مع أطراف ثالثة، وموارد المجتمع النشطة.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionنتطلع قدماً: وصول YOLO26#

بينما يعتبر كل من YOLOv8 و YOLOv9 قادرين بشكل لا يصدق، فإن مشهد الرؤية الحاسوبية يتحرك بسرعة. بالنسبة لعمليات النشر الحديثة، نوصي بشدة باستخدام Ultralytics YOLO26، الذي تم إصداره في يناير 2026.

يمثل YOLO26 تحولاً جذرياً في كيفية عمل كاشفات الأشياء في الإنتاج. فهو يتميز بـ تصميم أصلي خالٍ من NMS من البداية إلى النهاية، مما يلغي بشكل فعال زمن الوصول والسلوك غير الحتمي للمعالجة اللاحقة. ولدعم أجهزة الحافة والأجهزة منخفضة الطاقة بشكل أفضل، يدمج YOLO26 إزالة كاملة لـ DFL (خسارة البؤرة التوزيعية)، مما يجعل عمليات التصدير للهواتف المحمولة أبسط بكثير.

علاوة على ذلك، يستخدم YOLO26 مُحسِّن MuSGD الثوري، وهو مزيج من SGD و Muon الذي يجلب استقرار تدريب بمستوى LLM إلى مهام الرؤية، مما يؤدي إلى تقارب أسرع بشكل ملحوظ. مع ما يصل إلى 43% استدلال أسرع على وحدة المعالجة المركزية (CPU) وتكامل ProgLoss + STAL لتحسين التعرف على الأشياء الصغيرة بشكل كبير، يعد YOLO26 الخيار بلا منازع لمبادرات المؤسسات الجديدة.

تعرف على المزيد حول YOLO26

معماريات بديلة

اعتماداً على قيود أجهزتك، قد تكون مهتماً أيضاً بمقارنة هذه النماذج مع Ultralytics YOLO11 للمهام العامة المتوازنة، أو استكشاف النماذج القائمة على Transformer مثل RT-DETR للأبحاث المتخصصة عالية الدقة.

Link to this sectionتطبيقات وحالات استخدام في العالم الحقيقي#

يعتمد الاختيار بين YOLOv8 و YOLOv9 إلى حد كبير على قيود مشروعك والأجهزة المستهدفة.

  • الرعاية الصحية والتصوير الطبي: عندما يكون كل بكسل مهماً، كما هو الحال في أنظمة الكشف عن الأورام، تحافظ معمارية GELAN في YOLOv9 على التفاصيل الدقيقة بشكل استثنائي، مما يقلل من النتائج السلبية الكاذبة في التشخيصات الحرجة.
  • تجارة التجزئة وتحليلات المخزون: بالنسبة لـ أنظمة السوبر ماركت الذكية التي تتعقب الرفوف المزدحمة، يوفر YOLOv9 دقة mAP اللازمة لفصل العناصر المتداخلة بشكل موثوق.
  • المدن الذكية ومراقبة المرور: في الخدمات اللوجستية وإدارة المرور سريعة الوتيرة، يجعل زمن الوصول المنخفض للغاية والمتانة المثبتة لـ YOLOv8 منه مثالياً لتتبع المركبات عبر تدفقات كاميرات متعددة في وقت واحد.
  • عمليات نشر الحافة: إذا كنت تقوم بالنشر على أجهزة مقيدة مثل Raspberry Pi أو أجهزة محمولة، فإن كتل C2f المحسنة للغاية في YOLOv8 (وتحسينات CPU في YOLO26) توفر خط أنابيب استدلال أكثر سلاسة وملاءمة للبطارية.
المساهمون

التعليقات