Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv8 مقابل YOLOv9#

اتسم تطور الكشف عن الكائنات في الوقت الفعلي بالسعي المستمر نحو دقة أفضل، وزمن انتقال أقل، واستخدام محسّن للموارد العتادية. ومن أبرز المحطات في هذه المسيرة Ultralytics YOLOv8 وYOLOv9. فبينما يمثل النموذجان أحدث القدرات في مجال رؤية الحاسوب، إلا أنهما يلبيان احتياجات نشر وفلسفات معمارية وأنظمة مطورين مختلفة.

يوضح هذا الدليل الشامل الاختلافات التقنية والابتكارات المعمارية واعتبارات النشر العملية لمساعدتك في اختيار النموذج المناسب لمشروعك القادم في مجال الذكاء الاصطناعي.

Link to this sectionنسب النموذج والفلسفات الأساسية#

قبل الغوص في المقاييس، من الضروري فهم الأصول وأهداف التصميم الأساسية لكل نموذج.

Link to this sectionUltralytics YOLOv8: معيار النظام البيئي متعدد الاستخدامات#

تم إصدار YOLOv8 من قبل الفريق في Ultralytics، ولم يُصمم فقط ككاشف كائنات مستقل، بل كإطار عمل موحد ومتعدد المهام. وهو يعطي الأولوية لتجربة مطور سلسة، ومتطلبات ذاكرة منخفضة، وتوافق واسع مع الموارد العتادية.

تعرف على المزيد حول YOLOv8

Link to this sectionYOLOv9: معلومات التدرج القابلة للبرمجة#

تم تطوير YOLOv9 بشكل مستقل من قبل باحثين في أكاديمية سينيكا، ويركز بشكل كبير على النظرية المعمارية، وتحديداً معالجة ظاهرة اختناق المعلومات في الشبكات العصبية العميقة.

  • المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
  • المنظمة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان
  • التاريخ: 21-02-2024
  • Arxiv: 2402.13616
  • GitHub: WongKinYiu/yolov9

اعرف المزيد عن YOLOv9

النشر المؤسسي

إذا كنت تخطط لنشر تجاري واسع النطاق، ففكر في استكشاف منصة Ultralytics لتبسيط التدريب السحابي وإدارة مجموعات البيانات ونقاط نهاية API بضغطة زر واحدة.

Link to this sectionغوص معمق في البنية#

تحدد الخيارات المعمارية في التعلم العميق مدى كفاءة تعلم النموذج ومدى سرعته في العمل على الموارد العتادية المستهدفة مثل NVIDIA Jetson أو Intel CPU.

Link to this sectionمعمارية YOLOv8: وحدة C2f والرؤوس المنفصلة#

قدم YOLOv8 وحدة C2f (عنق الزجاجة الجزئي عبر المراحل مع وحدتي التفاف)، والتي حلت محل وحدة C3 الأقدم. هذا التغيير يحسن تدفق التدرج ويسمح للشبكة بتعلم تمثيلات ميزات أكثر ثراءً دون إرهاق ذاكرة GPU بشكل كبير.

علاوة على ذلك، يستخدم YOLOv8 تصميماً خالياً من نقاط الارتكاز (anchor-free) مع رأس منفصل. من خلال معالجة احتمالية وجود كائن والتصنيف والانحدار عبر مسارات منفصلة، يتقارب النموذج بشكل أسرع أثناء التدريب ويعمم بشكل أفضل على مجموعات بيانات مخصصة متنوعة.

Link to this sectionمعمارية YOLOv9: تقنية PGI وGELAN#

يقدم YOLOv9 معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN). تضمن PGI عدم فقدان البيانات المهمة أثناء مرورها عبر طبقات الشبكة، مما يوفر تدرجات موثوقة لتحديثات الأوزان. تعمل GELAN على تعظيم كفاءة المعلمات، مما يسمح للنموذج بتحقيق دقة عالية مع محاولة إبقاء عدد العمليات الحسابية (FLOPs) ضمن نطاق يمكن التحكم فيه.

على الرغم من إثارة الإعجاب من الناحية الرياضية، فإن اعتماد YOLOv9 على فروع مساعدة قابلة للعكس أثناء التدريب يمكن أن يجعل كود التدريب أكثر تعقيداً في التخصيص مقارنة بخطوط الإنتاج القياسية.

Link to this sectionمقاييس الأداء والمعايير#

يوفر الجدول أدناه مقارنة مباشرة للنماذج عبر أحجام مختلفة. يتم قياس الأداء على مجموعة بيانات MS COCO، وهي معيار قياسي للكشف عن الكائنات.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

ملاحظة: تم تمييز أفضل القيم في كل عمود بـ الخط العريض.

Link to this sectionتحليل المقايضات#

يحقق YOLOv9 دقة قصوى (mAP) أعلى قليلاً، خاصة مع متغيره الأكبر e. ومع ذلك، يأتي هذا بتكلفة. يحافظ Ultralytics YOLOv8 على ميزة كبيرة في سرعة الاستدلال، خاصة عند تجميعه بتنسيقات مثل TensorRT أو ONNX. بالنسبة للتطبيقات التي تتطلب معدل إطارات مرتفع في الثانية (FPS) على أجهزة طرفية محدودة الموارد (مثل Raspberry Pi أو رقائق الهواتف المحمولة القديمة)، توفر متغيرات n وs في YOLOv8 توازناً عملياً أكثر بكثير في الأداء.

Link to this sectionكفاءة التدريب وتكامل النظام البيئي#

يتضمن اختيار النموذج أكثر من مجرد النظر إلى جداول الدقة؛ فتجربة المطور هي أمر بالغ الأهمية.

Link to this sectionميزة Ultralytics: سهولة الاستخدام#

غالباً ما يتطلب تدريب YOLOv9 استنساخ مستودعات GitHub المعقدة، وإدارة بيئات PyTorch بعناية، وتكوين أوزان الخسارة المساعدة يدوياً.

في المقابل، يتم دعم Ultralytics YOLOv8 بواسطة Python API مبسط بشكل ملحوظ. تم تصميمه لسهولة الاستخدام، وهو يتعامل مع زيادة البيانات، والتسجيل (في أدوات مثل Weights & Biases وComet ML)، وتوزيع الموارد العتادية بشكل أصلي.

from ultralytics import YOLO

# Load a pre-trained YOLOv8 small model
model = YOLO("yolov8s.pt")

# Train the model efficiently on custom data
results = model.train(data="custom_dataset.yaml", epochs=100, imgsz=640)

# Export for edge deployment
model.export(format="engine", quantize=16)  # TensorRT export

تقلل واجهة البرمجة الواحدة هذه بشكل كبير من الوقت المستغرق من النموذج الأولي إلى الإنتاج. علاوة على ذلك، يتطلب YOLOv8 عموماً ذاكرة CUDA أقل أثناء التدريب، مما يسمح للمطورين باستخدام أحجام دفعات (batch sizes) أكبر على الأجهزة الموجهة للمستهلكين.

Link to this sectionتعدد استخدامات المهام#

بينما يعد YOLOv9 كاشفاً ممتازاً للصناديق المحيطة، غالباً ما يتطلب ذكاء رؤية العالم الحقيقي المزيد. يعد YOLOv8 قوة متعددة الاستخدامات تدعم أصلياً تجزئة المثيلات، وتقدير الوضعية، وتصنيف الصور، والصناديق المحيطة الموجهة (OBB). إن استخدام إطار عمل واحد لمهام متعددة يقلل بشكل كبير من تضخم البرمجيات وتكاليف الصيانة.

نظرة إلى المستقبل

إذا كنت تبدأ مشروعاً جديداً، فقد ترغب أيضاً في تقييم Ultralytics YOLO11 أو YOLO26 المتطور، والذي يتميز أصلياً بتصاميم نهاية-إلى-نهاية خالية من NMS.

Link to this sectionحالات الاستخدام في العالم الحقيقي#

كيف يكون أداء هذه النماذج في مرحلة الإنتاج؟

Link to this sectionالطائرات بدون طيار المستقلة والروبوتات#

بالنسبة للروبوتات التي تتطلب تجنب العقبات بسرعة، يعد YOLOv8 الخيار المفضل. يضمن زمن الانتقال المنخفض للغاية لـ YOLOv8n أن تتفاعل الأنظمة المستقلة مع بيئاتها في الوقت الفعلي، مما يمنع الاصطدامات. كما أن قدرات التصدير الأصلية إلى OpenVINO وCoreML تجعل من السهل نشرها على الرقائق منخفضة الطاقة النموذجية للطائرات بدون طيار التجارية.

Link to this sectionكشف العيوب عالي الدقة#

في بيئات التصنيع المتخصصة حيث يعد اكتشاف الشذوذ المجهري أمراً بالغ الأهمية ويكون المعالجة دون اتصال بالإنترنت مقبولاً، يمكن أن يكون YOLOv9 فعالاً للغاية. تساعد معمارية PGI الشبكة على الاحتفاظ بالتفاصيل البصرية الدقيقة اللازمة لتحديد الشقوق الشعرية أو أخطاء لحام PCB.

Link to this sectionتجار التجزئة الأذكياء وتحليلات الأمن#

لتتبع العملاء عبر ممرات المتاجر أو إدارة أنظمة الدفع الآلي، يوفر YOLOv8 أفضل توازن. قدرته على تشغيل الكشف وتتبع الكائنات المتعددة في وقت واحد باستخدام خوارزميات قياسية مثل BoT-SORT تجعل منه حلاً قوياً لعمليات النشر في متاجر التجزئة متعددة الكاميرات.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOv8 وYOLOv9 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOv8#

يعد YOLOv8 خياراً قوياً لـ:

  • النشر متعدد المهام المتنوع: المشاريع التي تتطلب نموذجاً ثابتاً لـ الكشف، والتجزئة، والتصنيف، وتقدير الوضعية داخل نظام Ultralytics البيئي.
  • أنظمة الإنتاج الراسخة: بيئات الإنتاج الحالية المبنية بالفعل على بنية YOLOv8 مع خطوط أنابيب نشر مستقرة ومختبرة جيداً.
  • دعم مجتمعي ونظام بيئي واسع: التطبيقات التي تستفيد من دروس YOLOv8 الواسعة، والتكاملات مع أطراف ثالثة، وموارد المجتمع النشطة.

Link to this sectionمتى تختار YOLOv9#

يوصى بـ YOLOv9 لـ:

  • أبحاث اختناق المعلومات: المشاريع الأكاديمية التي تدرس معمارية معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
  • دراسات تحسين تدفق التدرج: الأبحاث التي تركز على فهم وتخفيف فقدان المعلومات في طبقات الشبكة العميقة أثناء التدريب.
  • قياس أداء الكشف عالي الدقة: السيناريوهات التي تكون فيها أداء معيار COCO القوي لـ YOLOv9 مطلوباً كنقطة مرجعية للمقارنات المعمارية.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionالتطور القادم: YOLO26#

بينما يعد YOLOv8 وYOLOv9 قويين، فإن مشهد الذكاء الاصطناعي يتحرك بسرعة. بالنسبة للفرق التي تطالب بأفضل أداء على الإطلاق، يعتمد YOLO26 الذي تم إصداره حديثاً على نجاحات هذه الأجيال السابقة.

يقدم YOLO26 تصميماً من نهاية-إلى-نهاية خالياً من NMS، والذي يقضي تماماً على اختناقات المعالجة اللاحقة المعقدة، مما يجعل النشر أبسط وزمن الانتقال أكثر قابلية للتنبؤ. مدفوعاً بـ MuSGD Optimizer الجديد ووظائف الخسارة المحسنة ProgLoss + STAL، ومع إزالة DFL (تمت إزالة Distribution Focal Loss لتبسيط التصدير وتحسين التوافق مع الأجهزة الطرفية/منخفضة الطاقة)، فإنه يحقق سرعة استدلال CPU أسرع بنسبة تصل إلى 43% مع تعزيز التعرف على الكائنات الصغيرة. للمطورين الذين يتجاوزون حدود الحوسبة الطرفية، يوصى بشدة بتقييم YOLO26.

باختصار، بينما يقدم YOLOv9 بحثاً معمارياً رائعاً ودقة قصوى ممتازة، يظل Ultralytics YOLOv8 الخيار الأكثر عملية ودعماً وتعدداً للاستخدامات للغالبية العظمى من مهندسي رؤية الحاسوب الذين يهدفون إلى شحن برمجيات موثوقة بسرعة.

التعليقات