تخطي إلى المحتوى

YOLO11 مقابل YOLOv8: التطور المعماري وتحليل الأداء

يعد اختيار النموذج الأمثل للرؤية الحاسوبية قرارًا حاسمًا للمطورين والباحثين الذين يهدفون إلى تحقيق التوازن بين الدقة والسرعة وكفاءة الموارد. تقدم هذه الصفحة مقارنة تقنية شاملة بين Ultralytics YOLO11 و Ultralytics YOLOv8وهما بنيتان رائدتان في المجال مصممتان لاكتشاف الأجسام ومهام الرؤية المتقدمة. نحن نحلل ابتكاراتهما المعمارية ومقاييسهما المعيارية وسيناريوهات النشر المثالية لمساعدتك في تحديد الأنسب لتطبيقات الذكاء الاصطناعي لديك.

Ultralytics YOLO11

المؤلفون: جلين جوتشر، جينغ تشيو
المنظمة:Ultralytics
التاريخ: 2024-09-27 2024
GitHubultralytics
المستنداتyolo11

يمثّل YOLO11 أحدث تطور في سلسلة YOLO الشهيرة، حيث تم تصميم تحسينات كبيرة في استخراج المزايا وكفاءة المعالجة. من خلال تحسين بنية العمود الفقري والرقبة، يحقق YOLO11 متوسط دقة أعلى (mAP) مع استخدام معلمات أقل من سابقاته. وهو يدعم أصلاً طيفًا واسعًا من المهام، بما في ذلك تجزئة النماذج، وتصنيف الصور، وتقدير الوضعية، والمربعات المحدودة الموجهة (OBB).

البنية والميزات الرئيسية

تُقدِّم بنية YOLO11 وحدة C3k2، وهي نسخة مُحسَّنة من عنق الزجاجة CSP (الجزئي عبر المرحلة)، ووحدة C2PSA (الجزئي عبر المرحلة مع الانتباه المكاني). تعمل هذه المكونات على تعزيز قدرة النموذج على التقاط الأنماط البصرية المعقدة والعلاقات المكانية مع تقليل النفقات الحسابية الزائدة. تضمن فلسفة التصميم هذه أن يتفوق YOLO11 في سيناريوهات الاستدلال في الوقت الحقيقي، خاصةً على الأجهزة المتطورة حيث تكون الموارد الحاسوبية محدودة.

نقاط القوة

  • دقة فائقة: توفر أداءً فائقًا في الكشف عبر جميع مقاييس النموذج، وتتفوق باستمرار على التكرارات السابقة على مجموعة بياناتCOCO .
  • كفاءةCPU : تؤدي الخيارات المعمارية المحسّنة إلى سرعات استنتاج أسرع بكثير على وحدات المعالجة المركزية، مما يجعلها الخيار الأفضل لعمليات النشر بدون خادم أو الحافة.
  • كفاءة المعلمات: يحقق دقة عالية مع عدد أقل من المعلمات وعمليات التشغيل المتكررة، مما يقلل من متطلبات تخزين النموذج.
  • إطار عمل موحد: يعالج مهام الرؤية المتعددة بسلاسة ضمن واجهة برمجة تطبيقات واحدة سهلة الاستخدام.

نقاط الضعف

  • نضج النظام الإيكولوجي: كإصدار أحدث، يتزايد حجم البرامج التعليمية للجهات الخارجية والمحتوى الذي ينشئه المجتمع بشكل سريع، ولكنه قد يكون أقل شمولاً من YOLOv8 الراسخ.
  • كثافة الموارد للنماذج الكبيرة: على الرغم من كفاءتها، إلا أن المتغيرات الأكبر (على سبيل المثال، YOLO11x) لا تزال تتطلب موارد كبيرة من GPU للتدريب والاستدلال عالي الإنتاجية.

حالات الاستخدام

YOLO11 هو الخيار الأول للتطبيقات التي تتطلب أعلى نسبة دقة إلى سرعة ممكنة:

  • الذكاء الاصطناعي المتطور: نشر الكشف عالي الأداء على أجهزة NVIDIA Jetson أو Raspberry Pi.
  • الروبوتات في الوقت الحقيقي: تمكين الملاحة المستقلة والتفاعل مع الكائنات بأقل وقت استجابة.
  • التصوير الطبي: المساعدة في التحليل الدقيق للصور الطبية للتشخيص حيث تكون الدقة في غاية الأهمية.

تعرف على المزيد حول YOLO11

Ultralytics YOLOv8

المؤلفون: جلين جوتشر، أيوش تشوراسيا، جينغ تشيو
المنظمة:Ultralytics
التاريخ: 2023-01-10
GitHubultralytics
المستنداتyolov8

تم إصداره في أوائل عام 2023، أعاد YOLOv8 تعريف معيار الكشف عن الأجسام في الوقت الحقيقي. فقد قدم رأس كشف خالٍ من المثبتات ووحدة العمود الفقري C2f، مما يمثل خروجًا كبيرًا عن النهج القائم على المثبتات. تشتهر YOLOv8 بثباتها وتعدد استخداماتها ومنظومتها الضخمة التي تطورت حولها، مما يجعلها أحد أكثر نماذج الرؤية المعتمدة على نطاق واسع على مستوى العالم.

البنية والميزات الرئيسية

يستخدم YOLOv8 تعديلاً على العمود الفقري لشبكة CSPDarknet53، حيث يتضمن وحدات C2f التي تسمح بتدفق تدرجي أكثر ثراءً. يبسّط تصميمه الخالي من المرتكزات عملية الإخماد غير الأقصى (NMS) ويقلل من تعقيد ضبط المعلمة الفائقة المتعلقة بصناديق الارتكاز. النموذج قابل للتطوير بدرجة كبيرة، حيث يقدم متغيرات من نانو (n) إلى كبير جدًا (x) ليناسب مختلف الميزانيات الحسابية.

نقاط القوة

  • موثوقية مثبتة: تم اختبارها على نطاق واسع في بيئات الإنتاج في جميع أنحاء العالم، مما يضمن ثباتًا عاليًا.
  • نظام بيئي غني: مدعوم بآلاف البرامج التعليمية والتكاملات والمشروعات المجتمعية.
  • تعدد الاستخدامات: مثل YOLO11 فهو يدعم الاكتشاف والتجزئة والتصنيف وتقدير الوضعية.
  • خط أساس قوي: يستمر في تقديم أداء تنافسي يفوق العديد من البنى غير YOLO .

نقاط الضعف

  • فجوة الأداء: يتفوق YOLO11 بشكل عام على YOLO11 في كل من الدقةmAP) وسرعة الاستدلال، خاصةً على أجهزة CPU .
  • تكلفة حسابية أعلى: يتطلب المزيد من المعلمات ووحدات FLOP أكثر قليلاً لتحقيق دقة مماثلة ل YOLO11.

حالات الاستخدام

يظل YOLOv8 خيارًا ممتازًا لـ

  • الأنظمة القديمة: المشاريع التي تم دمجها بالفعل مع عمليات سير عمل YOLOv8 التي تتطلب ثباتًا أكثر من الأداء المتطور.
  • أدوات تعليمية: تعلّم مفاهيم الرؤية الحاسوبية باستخدام نموذج يحتوي على توثيق واسع وأمثلة مجتمعية.
  • الكشف للأغراض العامة: أداء موثوق به لتطبيقات الأمن والمراقبة القياسية.

تعرف على المزيد حول YOLOv8

مقارنة أداء مباشرة

يكمن الفرق الأكثر أهمية بين هذين النموذجين في كفاءتهما. يحقق YOLO11 "تحسينًا باريتو" على YOLOv8دقة أعلى مع تكلفة حسابية أقل.

تحليل الكفاءة والسرعة

تسمح التحسينات المعمارية في YOLO11 (C3k2 و C2PSA) بمعالجة الصور بشكل أسرع مع الاحتفاظ بمزيد من الميزات الدقيقة. ويتضح ذلك أكثر في الاستدلالCPU حيث تُظهر نماذج YOLO11 تسريعًا كبيرًا. على سبيل المثال، يُعدّ نموذج YOLO11n أسرع بنسبة 30% تقريبًا على CPU من نموذج YOLOv8n مع تحقيقه أيضًا سرعة أكبر في المعالجة mAP.

فيما يتعلق بالاستدلالGPU تُظهر نماذج YOLO11 أيضًا زمن استجابة أقل في معظم الأحجام، مما يجعلها فعالة للغاية في خطوط أنابيب معالجة الفيديو في الوقت الفعلي.

كفاءة الذاكرة

صُمم كل من Ultralytics YOLO11 و YOLOv8 لاستهلاك منخفض للذاكرة أثناء التدريب والاستدلال مقارنةً بالنماذج القائمة على المحولات مثل RT-DETR. وهذا يجعلها أكثر سهولة للمطورين الذين يستخدمون أجهزة من فئة المستهلكين أو البيئات السحابية ذات ذاكرة CUDA المحدودة.

المقاييس المقارنة

يوضح الجدول أدناه التحسينات في الأداء. لاحظ الانخفاض في المعلمات وعمليات التشغيل الآلي الثابتة لـ YOLO11 إلى جانب الزيادة في mAP.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

ميزة نظام Ultralytics البيئي

إن اختيار نموذج Ultralytics يعني الحصول على إمكانية الوصول إلى نظام بيئي شامل مصمم لتبسيط دورة حياة عمليات التشغيل الآلي بالكامل.

  • سهولة الاستخدام: يشترك كلا الطرازين في Python API وواجهة سطر الأوامرCLI). غالبًا ما يتطلب التحويل من YOLOv8 إلى YOLO11 تغيير حرف واحد فقط في سلسلة التعليمات البرمجية (على سبيل المثال "yolov8n.pt" إلى "yolo11n.pt").
  • كفاءة التدريب: تستخدم نماذج Ultralytics إجراءات تدريب متقدمة بما في ذلك زيادة الفسيفساء وتطور المعلمة الفائقة. تتوفر الأوزان المدربة مسبقًا بسهولة، مما يسمح بتعلم النقل الفعال على مجموعات البيانات المخصصة.
  • تعدد الاستخدامات: على عكس العديد من المنافسين الذين يقتصرون على مهام محددة، تقدم نماذج Ultralytics دعمًا أصليًا للكشف والتجزئة والتصنيف والوضع والوضعيات وOBB ضمن حزمة موحدة.
  • النشر: تصدير النماذج بسهولة إلى تنسيقات مثل ONNX, TensorRTو CoreML و OpenVINO للنشر الأمثل على أجهزة متنوعة.

مثال على الاستخدام الموحد

يسمح تصميم واجهة برمجة التطبيقات المشتركة بإجراء التجارب دون عناء. إليك كيفية تحميل وتشغيل التنبؤ باستخدام أي من النموذجين:

from ultralytics import YOLO

# Load YOLO11 or YOLOv8 by simply changing the model name
model = YOLO("yolo11n.pt")  # or "yolov8n.pt"

# Train on a custom dataset
# model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

الخلاصة: أي نموذج يجب أن تختاره؟

بالنسبة للغالبية العظمى من المشاريع الجديدة، فإن YOLO11 هو الخيار الموصى به. توفر التطورات المعمارية ميزة واضحة في كل من الدقة والسرعة، خاصةً بالنسبة لتطبيقات الحوسبة المتطورة حيث تكون الكفاءة أمرًا بالغ الأهمية. كما أن انخفاض عدد المعلمات يعني أيضًا متطلبات تخزين أخف وأوقات تنزيل أسرع لعمليات النشر المتنقلة.

YOLOv8 لا تزال أداة قوية وملائمة، خاصةً للفرق التي لديها خطوط أنابيب حالية مدمجة بعمق مع إصدارات YOLOv8 محددة أو لأولئك الذين يعتمدون على النضج المطلق لنظام التوثيق الخاص بها. ومع ذلك، فإن الترحيل إلى YOLO11 بسيط بشكل عام ويحقق فوائد فورية في الأداء.

تم إصدار كلا النموذجين بموجب AGPL-3.0 لتعزيز التعاون المفتوح المصدر، مع توفر تراخيص المؤسسات للمنتجات التجارية التي تتطلب قدرات خاصة.

استكشف نماذج أخرى

على الرغم من أن YOLO11 و YOLOv8 كاشفان ممتازان للأغراض العامة، إلا أن المتطلبات المحددة قد تستفيد من البنى الأخرى في عائلة Ultralytics :

  • YOLOv10: يركز على التدريب NMS لتقليل زمن الاستجابة.
  • YOLOv9: ي ركز على معلومات التدرج القابلة للبرمجة لتدريب النموذج العميق.
  • RT-DETR: كاشف قائم على المحولات يوفر دقة عالية، ولكن مع متطلبات ذاكرة وحساب أعلى.

استكشف مجموعتنا الكاملة من مقارنات الطرازات للعثور على الأنسب لمشروعك.


تعليقات