تخطي إلى المحتوى

YOLO11 مقابل YOLOv8: التطور المعماري وتحليل الأداء

يُعد اختيار نموذج الرؤية الحاسوبية الأمثل قرارًا بالغ الأهمية للمطورين والباحثين الذين يهدفون إلى تحقيق التوازن بين الدقة والسرعة وكفاءة الموارد. تقدم هذه الصفحة مقارنة فنية شاملة بين Ultralytics YOLO11 و Ultralytics YOLOv8، وهما بنيتان رائدتان في الصناعة مصممتان لـ الكشف عن العناصر ومهام الرؤية المتقدمة. نحلل ابتكاراتهم المعمارية ومقاييس الأداء وسيناريوهات النشر المثالية لمساعدتك في تحديد الأنسب لتطبيقات الذكاء الاصطناعي الخاصة بك.

Ultralytics YOLO11

المؤلفون: جلين جوتشر، جينغ تشيو
المنظمة:Ultralytics
التاريخ: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
المستندات:https://docs.ultralytics.com/models/yolo11/

يمثل YOLO11 أحدث تطور في سلسلة YOLO الشهيرة، حيث تم تصميم تحسينات كبيرة في استخراج الميزات وكفاءة المعالجة. من خلال تحسين هياكل العمود الفقري والرقبة، يحقق YOLO11 متوسط دقة متوسطة (mAP) أعلى مع استخدام عدد أقل من المعلمات من سابقاتها. وهو يدعم أصلاً مجموعة واسعة من المهام، بما في ذلك تقسيم المثيلات، و تصنيف الصور، و تقدير الوضعية، وصناديق الإحاطة الموجهة (OBB).

البنية والميزات الرئيسية

يقدم هيكل YOLO11 كتلة C3k2، وهي نسخة محسنة من عنق الزجاجة CSP (Cross Stage Partial)، ووحدة C2PSA (Cross Stage Partial with Spatial Attention). تعمل هذه المكونات على تحسين قدرة النموذج على التقاط الأنماط المرئية المعقدة والعلاقات المكانية مع تقليل النفقات الحسابية. تضمن فلسفة التصميم هذه تفوق YOLO11 في سيناريوهات الاستدلال في الوقت الفعلي، خاصة على الأجهزة الطرفية حيث الموارد الحسابية محدودة.

نقاط القوة

  • دقة متطورة: يوفر أداءً فائقًا في الكشف عبر جميع مقاييس النماذج، ويتفوق باستمرار على التكرارات السابقة في مجموعة بيانات COCO.
  • كفاءة وحدة المعالجة المركزية CPU: تؤدي الخيارات المعمارية المحسّنة إلى سرعات استدلال أسرع بشكل ملحوظ على وحدات المعالجة المركزية CPUs، مما يجعلها الخيار الأفضل لعمليات النشر بدون خادم أو الطرفية.
  • كفاءة المعلمات: تحقق دقة عالية مع عدد أقل من المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs)، مما يقلل من متطلبات تخزين النموذج.
  • إطار عمل موحد: يعالج بسلاسة مهام رؤية متعددة داخل API واحد سهل الاستخدام.

نقاط الضعف

  • نضج النظام البيئي: باعتباره إصدارًا أحدث، فإن حجم البرامج التعليمية الخاصة بالجهات الخارجية والمحتوى الذي ينشئه المجتمع ينمو بسرعة ولكنه قد يكون أقل شمولاً من YOLOv8 الراسخ.
  • كثافة الموارد للنماذج الكبيرة: على الرغم من كفاءتها، إلا أن أكبر المتغيرات (مثل YOLO11x) لا تزال تتطلب موارد GPU كبيرة للتدريب والاستدلال عالي الإنتاجية.

حالات الاستخدام

YOLO11 هو الخيار الأفضل للتطبيقات التي تتطلب أعلى نسبة ممكنة من الدقة إلى السرعة:

  • الذكاء الاصطناعي الطرفي: نشر الكشف عالي الأداء على NVIDIA Jetson أو أجهزة Raspberry Pi.
  • الروبوتات في الوقت الفعلي: تمكين الملاحة المستقلة والتفاعل مع الكائنات بأقل زمن وصول.
  • التصوير الطبي: المساعدة في تحليل الصور الطبية الدقيق للتشخيص حيث تكون الدقة ذات أهمية قصوى.

تعرف على المزيد حول YOLO11

Ultralytics YOLOv8

المؤلفون: جلين جوتشر، أيوش تشوراسيا، جينغ تشيو
المنظمة:Ultralytics
التاريخ: 2023-01-10
GitHub:https://github.com/ultralytics/ultralytics
المستندات:https://docs.ultralytics.com/models/yolov8/

أعاد YOLOv8، الذي تم إصداره في أوائل عام 2023، تعريف معيار الكشف عن الكائنات في الوقت الفعلي. لقد قدم رأس كشف خالٍ من المرساة ووحدة العمود الفقري C2f، مما يمثل خروجًا كبيرًا عن الأساليب القائمة على المرساة. يشتهر YOLOv8 باستقراره وتعدد استخداماته والنظام البيئي الضخم الذي تطور من حوله، مما يجعله أحد نماذج الرؤية الأكثر اعتمادًا على نطاق عالمي.

البنية والميزات الرئيسية

تستخدم YOLOv8 تعديلًا لـ CSPDarknet53 backbone، يتضمن وحدات C2f التي تسمح بتدفق تدرج أكثر ثراءً. تصميمه الخالي من anchor يسهل عملية non-maximum suppression (NMS) ويقلل من تعقيد ضبط المعلمات الفائقة المتعلقة بصناديق anchor. النموذج قابل للتطوير بدرجة كبيرة، ويقدم متغيرات من Nano (n) إلى Extra Large (x) لتناسب مختلف الميزانيات الحسابية.

نقاط القوة

  • موثوقية مثبتة: تم اختباره على نطاق واسع في بيئات الإنتاج في جميع أنحاء العالم، مما يضمن استقرارًا عاليًا.
  • نظام بيئي ثري: مدعوم بآلاف الدروس التعليمية وعمليات التكامل والمشاريع المجتمعية.
  • تنوع الاستخدامات: مثل YOLO11، فهو يدعم الكشف والتقسيم والتصنيف وتقدير الوضعية.
  • خط أساس قوي: لا يزال يقدم أداءً تنافسيًا يتجاوز العديد من Architectures غير YOLO.

نقاط الضعف

  • فجوة الأداء: يتفوق YOLO11 عليه بشكل عام في كل من الدقة (mAP) وسرعة الاستدلال، خاصة على أجهزة CPU.
  • تكلفة حسابية أعلى: يتطلب عددًا أكبر قليلاً من المعلمات وعمليات FLOPs لتحقيق دقة مماثلة لـ YOLO11.

حالات الاستخدام

لا يزال YOLOv8 خيارًا ممتازًا لـ:

  • الأنظمة القديمة: المشاريع المدمجة بالفعل مع مهام سير عمل YOLOv8 التي تتطلب الاستقرار على أداء متطور.
  • الأدوات التعليمية: تعلم مفاهيم رؤية الكمبيوتر باستخدام نموذج يحتوي على وثائق وأمثلة مجتمعية واسعة.
  • اكتشاف للأغراض العامة: أداء موثوق به لتطبيقات الأمان والمراقبة القياسية.

تعرف على المزيد حول YOLOv8

مقارنة أداء مباشرة

يكمن التمييز الأهم بين هذين النموذجين في كفاءتهما. يحقق YOLO11 "تحسين باريتو" على YOLOv8 - حيث يقدم دقة أعلى بتكلفة حسابية أقل.

تحليل الكفاءة والسرعة

تسمح التحسينات المعمارية في YOLO11 (C3k2، C2PSA) بمعالجة الصور بشكل أسرع مع الاحتفاظ بميزات أكثر دقة. يتضح هذا بشكل خاص في الاستدلال على وحدة المعالجة المركزية، حيث تُظهر نماذج YOLO11 تسريعًا كبيرًا. على سبيل المثال، نموذج YOLO11n أسرع بنسبة 30% تقريبًا على وحدة المعالجة المركزية من YOLOv8n مع تحقيق mAP أعلى أيضًا.

من حيث الاستدلال على GPU، تُظهر نماذج YOLO11 أيضًا زمن انتقال أقل عبر معظم الأحجام، مما يجعلها فعالة للغاية لخطوط أنابيب معالجة الفيديو في الوقت الفعلي.

كفاءة الذاكرة

تم تصميم كل من Ultralytics YOLO11 و YOLOv8 لاستهلاك منخفض للذاكرة أثناء التدريب والاستدلال مقارنة بالنماذج القائمة على المحولات مثل RT-DETR. وهذا يجعلها في متناول المطورين الذين يستخدمون أجهزة استهلاكية أو بيئات سحابية بذاكرة CUDA محدودة.

مقاييس مقارنة

يوضح الجدول أدناه تحسينات الأداء. لاحظ الانخفاض في المعلمات و FLOPs لـ YOLO11 جنبًا إلى جنب مع الزيادة في mAP.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

ميزة النظام البيئي لـ Ultralytics

يعني اختيار نموذج Ultralytics الوصول إلى نظام بيئي شامل مصمم لتبسيط دورة حياة MLOps بأكملها.

  • سهولة الاستخدام: يشترك كلا النموذجين في نفس Python API وواجهة سطر الأوامرCLI). غالبًا ما يتطلب التحويل من YOLOv8 إلى YOLO11 تغيير حرف واحد فقط في سلسلة التعليمات البرمجية (على سبيل المثال "yolov8n.pt" إلى "yolo11n.pt").
  • كفاءة التدريب: تستخدم نماذج Ultralytics إجراءات تدريب متقدمة بما في ذلك زيادة الفسيفساء وتطوير المعلمات الفائقة. الأوزان المدربة مسبقًا متاحة بسهولة، مما يسمح بالتعلم بالنقل الفعال على مجموعات البيانات المخصصة.
  • تنوع الاستخدامات: على عكس العديد من المنافسين الذين يقتصرون على مهام محددة، تقدم نماذج Ultralytics دعمًا أصليًا للكشف والتقسيم والتصنيف والوضعية و OBB داخل حزمة موحدة.
  • النشر: قم بتصدير النماذج بسهولة إلى تنسيقات مثل ONNX و TensorRT و CoreML و OpenVINO للنشر الأمثل على الأجهزة المتنوعة.

مثال على الاستخدام الموحد

يسمح تصميم API المشترك بإجراء تجارب سهلة. إليك كيف يمكنك تحميل وتشغيل التنبؤ بأي من النموذجين:

from ultralytics import YOLO

# Load YOLO11 or YOLOv8 by simply changing the model name
model = YOLO("yolo11n.pt")  # or "yolov8n.pt"

# Train on a custom dataset
# model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

الخلاصة: أي نموذج يجب أن تختاره؟

بالنسبة للغالبية العظمى من المشاريع الجديدة، يُعد YOLO11 هو الخيار الموصى به. توفر التطورات المعمارية ميزة واضحة في كل من الدقة والسرعة، خاصة بالنسبة لتطبيقات الحوسبة الطرفية حيث الكفاءة أمر بالغ الأهمية. يشير عدد المعلمات المنخفض أيضًا إلى متطلبات تخزين أخف وأوقات تنزيل أسرع لعمليات النشر على الأجهزة المحمولة.

YOLOv8 لا يزال أداة قوية وذات صلة، خاصةً للفرق التي لديها خطوط أنابيب حالية مدمجة بعمق مع إصدارات YOLOv8 محددة أو لأولئك الذين يعتمدون على النضج المطلق للنظام البيئي للوثائق الخاص به. ومع ذلك، فإن الترحيل إلى YOLO11 يكون بشكل عام مباشرًا ويحقق فوائد فورية في الأداء.

تم إصدار كلا النموذجين بموجب ترخيص AGPL-3.0، مما يعزز التعاون مفتوح المصدر، مع توفر تراخيص المؤسسات للمنتجات التجارية التي تتطلب قدرات مملوكة.

استكشف نماذج أخرى

في حين أن YOLO11 و YOLOv8 هما كاشفان ممتازان للأغراض العامة، إلا أن المتطلبات المحددة قد تستفيد من البنى الأخرى في عائلة Ultralytics:

  • YOLOv10: يركز على التدريب بدون NMS لتقليل زمن الوصول.
  • YOLOv9: يركز على معلومات التدرج القابلة للبرمجة لتدريب النماذج العميقة.
  • RT-DETR: كاشف يعتمد على المحولات ويوفر دقة عالية، ولكنه يتطلب ذاكرة وحسابات أكبر.

استكشف مجموعتنا الكاملة من مقارنات النماذج للعثور على الحل الأمثل لمشروعك.


تعليقات