تخطي إلى المحتوى

YOLO11 مقابل YOLOv6-3.0: مقارنة بين أحدث التقنيات في مجال الكشف عن الأجسام

يُعد اختيار نموذج الرؤية الحاسوبية الأمثل قرارًا محوريًا يؤثر على كفاءة ودقة وقابلية توسع تطبيقات الذكاء الاصطناعي. يقدم هذا الدليل تحليلًا فنيًا شاملاً يقارن بين Ultralytics YOLO11 و YOLOv6-3.0. ندرس ابتكاراتهم المعمارية ومعايير الأداء ومنهجيات التدريب ومدى ملاءمتهم لسيناريوهات النشر المختلفة في العالم الحقيقي. في حين أن كلا الإطارين قد قدما مساهمات كبيرة في هذا المجال، فإن YOLO11 يمثل أحدث تطور في الكفاءة والتنوع وتجربة المستخدم.

Ultralytics YOLO11

المؤلفون: جلين جوتشر و جينغ تشيو
المنظمة: Ultralytics
التاريخ: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
المستندات: https://docs.ultralytics.com/models/yolo11/

YOLO11 هو أحدث تطور في سلسلة YOLO (You Only Look Once)، التي أطلقتها Ultralytics في أواخر عام 2024. بالاعتماد على نجاح سابقاتها مثل YOLOv8، فإنه يقدم بنية محسنة مصممة لزيادة الأداء إلى أقصى حد مع تقليل التكاليف الحسابية. تم تصميم YOLO11 للتعامل مع مجموعة متنوعة من مهام رؤية الكمبيوتر، مما يجعله حلاً متعدد الاستخدامات للصناعات التي تتراوح من السيارات إلى الرعاية الصحية.

البنية والميزات الرئيسية

تركز بنية YOLO11 على تحسين استخراج الميزات وكفاءة المعالجة. وهي تتضمن تصميمًا محسنًا لـ backbone والعنق يقلل من العمليات الحسابية الزائدة، مما يسمح بسرعات استدلال أسرع على كل من الأجهزة الطرفية وخوادم الحوسبة السحابية. باعتباره كاشفًا خاليًا من anchor، يلغي YOLO11 الحاجة إلى التكوين اليدوي لمربع الربط، مما يبسط مسار التدريب ويحسن القدرة على التكيف مع أشكال الكائنات المتنوعة.

نقاط القوة

نقاط الضعف

  • منحنى الاعتماد: نظرًا لكونه نموذجًا تم إصداره مؤخرًا، فإن حجم البرامج التعليمية الخارجية والموارد الخارجية في ازدياد سريع ولكنه قد يكون حاليًا أقل من حجم الإصدارات القديمة مثل YOLOv5.
  • تحديات الكائنات الصغيرة: على الرغم من التحسن الكبير، يظل اكتشاف الكائنات الصغيرة للغاية مهمة صعبة بالنسبة إلى كاشفات الكائنات ذات المرحلة الواحدة مقارنة بالطرق المتخصصة، وإن كانت أبطأ.

حالات الاستخدام المثالية

يتفوق YOLO11 في السيناريوهات التي تتطلب إنتاجية عالية ودقة:

  • الأنظمة الذاتية: تتبع الأجسام في الوقت الفعلي للسيارات ذاتية القيادة والطائرات بدون طيار.
  • التصنيع الذكي: مهام ضمان الجودة التي تتطلب الكشف عن العيوب وتقسيمها في وقت واحد.
  • الرعاية الصحية: تحليل التصوير الطبي حيث يكون النشر المقيد بالموارد ضروريًا في كثير من الأحيان.
  • تحليلات البيع بالتجزئة: تحليل سلوك العملاء وإدارة المخزون باستخدام تقدير الوضع وتتبعه.

تعرف على المزيد حول YOLO11

YOLOv6-3.0

المؤلفون: تشوي لي، لولو لي، ييفي قنغ، هونغ ليانغ جيانغ، منغ تشنغ، بو تشانغ، زيدان كه، شياو مينغ شو، و شيانغ شيانغ تشو
المنظمة: ميتوان
التاريخ: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
المستندات: https://docs.ultralytics.com/models/yolov6/

إن YOLOv6-3.0 هو إطار عمل للكشف عن الأجسام تم تطويره بواسطة Meituan، ويستهدف تحديدًا التطبيقات الصناعية. تم إصداره في أوائل عام 2023، وقد تم تصميمه لتقديم موازنة تنافسية بين سرعة الاستدلال والدقة، وتلبية احتياجات الأنظمة في الوقت الفعلي في مجال الخدمات اللوجستية والأتمتة.

البنية والميزات الرئيسية

يقدم هيكل YOLOv6-3.0 "إعادة تحميل كاملة النطاق" للشبكة. يستخدم عمودًا فقريًا فعالًا لإعادة المعلمات (EfficientRep) وهيكل رأس فك الارتباط. تشمل الابتكارات الرئيسية استخدام تقنيات التقطير الذاتي أثناء التدريب لتعزيز الدقة دون زيادة تكاليف الاستدلال وتحسينات محددة لنشر TensorRT.

نقاط القوة

  • التركيز الصناعي: تم تصميم بنية النموذج خصيصًا للأجهزة الصناعية، وخاصةً تحسين زمن الوصول على وحدات معالجة الرسوميات NVIDIA.
  • Quantization Readiness: يوفر YOLOv6 دعمًا خاصًا لتكميم النموذج، مما يسهل النشر على الأجهزة ذات الدقة الحسابية المحدودة.
  • المتغيرات المحمولة: يشتمل الإطار على إصدارات YOLOv6-Lite المحسّنة لوحدات المعالجة المركزية المحمولة وهياكل DSP.

نقاط الضعف

  • كثافة الموارد: كما هو موضح في بيانات الأداء، غالبًا ما يتطلب YOLOv6-3.0 عددًا أكبر بكثير من المعلمات وعمليات الفاصلة العائمة لتحقيق دقة مماثلة للنماذج الأحدث مثل YOLO11.
  • نطاق مهمة محدود: ينصب التركيز الأساسي على اكتشاف الكائنات. يفتقر إلى الدعم الأصلي السلس متعدد المهام (التقسيم، والوضع، والتصنيف، OBB) الموجود في إطار Ultralytics الموحد.
  • تجزئة النظام البيئي: على الرغم من أن النظام مفتوح المصدر، إلا أن النظام البيئي أقل تكاملاً من نظام Ultralytics، مما قد يتطلب المزيد من الجهد اليدوي لمهام مثل إدارة مجموعات البيانات و track والتدريب السحابي.

حالات الاستخدام المثالية

YOLOv6-3.0 مناسب لـ:

  • الأنظمة الصناعية القديمة: البيئات التي تم ضبطها خصيصًا لهندسة YOLOv6.
  • مهام الكشف المخصصة: التطبيقات التي تتطلب فقط الكشف عن المربعات المحيطة، وقدرات المهام المتعددة غير ضرورية.
  • عمليات نشر أجهزة محددة: السيناريوهات التي تستفيد من خطوط أنابيب القياس المحددة التي يدعمها إطار عمل Meituan.

تعرف على المزيد حول YOLOv6

مقاييس الأداء: السرعة والدقة والكفاءة

يقدم الجدول التالي مقارنة تفصيلية بين YOLO11 و YOLOv6-3.0 على مجموعة بيانات COCO. تسلط المقاييس الضوء على التطورات في الكفاءة التي حققتها بنية YOLO11.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

تحليل البيانات

تكشف المقارنة عن اتجاه واضح: يحقق YOLO11 باستمرار دقة أعلى (mAP) مع تقليل النفقات العامة الحسابية بشكل كبير.

  • كفاءة المعلمات: يحقق نموذج YOLO11m قيمة 51.5 mAP متفوقة مقارنة بقيمة 50.0 mAP لـ YOLOv6-3.0m، ولكنه يستخدم فقط 20.1 مليون معلمة مقابل 34.9 مليون. يمثل هذا انخفاضًا بنسبة 42% تقريبًا في حجم النموذج لتحسين الأداء.
  • التكلفة الحسابية: وبالمثل، يتطلب YOLO11l 86.9B FLOPs للوصول إلى 53.4 mAP، بينما يتطلب YOLOv6-3.0l 150.7B FLOPs للحصول على 52.8 mAP أقل. تترجم FLOPs الأقل مباشرةً إلى استهلاك أقل للطاقة وتقليل توليد الحرارة، وهما عاملان حاسمان لأنظمة embedded systems.
  • سرعة الاستدلال: في حين أن YOLOv6-3.0n يُظهر سرعات TensorRT أسرع قليلاً، إلا أن فجوة الدقة الكبيرة (2.0 mAP) وحجم النموذج الأكبر يجعلان YOLO11n خيارًا أكثر توازناً للتطبيقات الحديثة حيث الدقة لها الأهمية القصوى.

ميزة النشر

لا يؤدي تقليل عدد المعلمات في YOLO11 إلى تسريع الاستدلال فحسب، بل يقلل أيضًا من متطلبات عرض النطاق الترددي للذاكرة. وهذا يجعل YOLO11 فعالاً بشكل خاص على الأجهزة الطرفية مثل Raspberry Pi أو NVIDIA Jetson، حيث غالبًا ما تكون موارد الذاكرة هي عنق الزجاجة.

التدريب وسهولة الاستخدام

سهولة الاستخدام والنظام البيئي

أحد أهم العوامل المميزة هو النظام البيئي المحيط بالنماذج. تم دمج Ultralytics YOLO11 في نظام أساسي شامل يبسط دورة حياة عمليات تعلم الآلة (MLOps) بأكملها.

  • واجهة برمجة تطبيقات بسيطة: يمكن للمطورين تحميل النماذج وتدريبها والتنبؤ بها باستخدام YOLO11 في بضعة أسطر فقط من تعليمات Python البرمجية.
  • الوثائق: تضمن الوثائق الشاملة والتي يتم تحديثها باستمرار أن يتمكن المستخدمون بسهولة من العثور على أدلة حول كل شيء بدءًا من ترميز البيانات وحتى تصدير النماذج.
  • المجتمع: يوفر مجتمع نابض بالحياة على GitHub و Discord دعمًا سريعًا وتحسينات مستمرة.

على النقيض من ذلك، في حين أن YOLOv6 يوفر قاعدة تعليمات برمجية قوية، إلا أنه يفتقر إلى نفس المستوى من الأدوات المتكاملة وتوافر الموارد التي يقودها المجتمع، مما قد يزيد من الوقت المستغرق في نشر المشاريع الجديدة.

كفاءة التدريب

تم تصميم YOLO11 ليكون عالي الكفاءة أثناء التدريب. تسمح بنيته بالتقارب بشكل أسرع، مما يعني أنه يمكن للمستخدمين غالبًا تحقيق الدقة المستهدفة في عدد أقل من الحقب مقارنة بالبنى القديمة. علاوة على ذلك، تم تحسين متطلبات الذاكرة أثناء التدريب، مما يسمح بأحجام دفعات أكبر على وحدات معالجة الرسومات من الدرجة الاستهلاكية.

إليك مثال على مدى سهولة البدء في تدريب نموذج YOLO11:

from ultralytics import YOLO

# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

الخلاصة

في حين أن YOLOv6-3.0 يظل نموذجًا قادرًا لمهام الكشف الصناعية المحددة، فإن Ultralytics YOLO11 يبرز باعتباره الخيار الأفضل لغالبية مشاريع رؤية الكمبيوتر الجديدة.

يوفر YOLO11 مزيجًا مقنعًا من دقة أعلى، و استهلاك أقل للموارد، و تعدد استخدامات لا مثيل له. إن قدرته على التعامل مع الـ detect، والـ segmentation، وتقدير الوضعية، والـ classification ضمن إطار عمل واحد سهل الاستخدام يبسط سير عمل التطوير. مدعومًا بنظام Ultralytics البيئي والأدوات التي يتم صيانتها بنشاط مثل Ultralytics HUB، يوفر YOLO11 أساسًا مضمونًا للمستقبل لبناء حلول ذكاء اصطناعي عالية الأداء وقابلة للتطوير.

بالنسبة للمطورين الباحثين عن أفضل توازن بين الأداء والكفاءة وسهولة الاستخدام، فإن YOLO11 هو المسار الموصى به للمضي قدمًا.

استكشف نماذج أخرى

إذا كنت مهتمًا بإجراء المزيد من المقارنات، فاستكشف هذه الصفحات ذات الصلة في الوثائق:


تعليقات