YOLOv6.0 مقابل YOLO11: نظرة متعمقة في اختيار النموذج
يعد اختيار البنية المثلى للرؤية الحاسوبية قرارًا محوريًا للمطورين والباحثين الذين يهدفون إلى تحقيق التوازن بين الدقة والسرعة وكفاءة الموارد. يقدم هذا التحليل مقارنة تقنية شاملة بين YOLOv6.0 و Ultralytics YOLO11حيث يفحص ابتكاراتهما المعمارية ومقاييس أدائهما وملاءمتهما للنشر في العالم الحقيقي. في حين أن YOLOv6.0 حقق YOLOv6.0 خطوات كبيرة في التطبيقات الصناعية عند إصداره، فإن YOLO11 يمثل أحدث تطور في أحدث تقنيات الذكاء الاصطناعي للرؤية (SOTA)، حيث يوفر تعدد استخدامات محسّن ونظام بيئي قوي.
YOLOv6.0
المؤلفون: تشوي لي، ولولو لي، ويفي قنغ، وهونغليانغ جيانغ، ومنغ تشنغ، وبو تشانغ، وبو تشانغ، وزيدان كي، وشياومينغ شو، وشيانغ شيانغ تشو
المنظمة: Meituan
التاريخ: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586https://arxiv.org/abs/2301.05586
GitHub: YOLOv6
Docs: https:ultralytics
تم تصميم YOLOv6.0 بواسطة Meituan مع التركيز بشكل خاص على التطبيقات الصناعية. تم إصداره في أوائل عام 2023، وقد تم تصميمه لتحسين المفاضلة بين سرعة الاستدلال ودقة الكشف، مستهدفًا على وجه التحديد سيناريوهات الوقت الفعلي على الأجهزة القياسية.
البنية والميزات الرئيسية
تقدم بنية YOLOv6.0 فلسفة تصميم "مدركة للأجهزة". فهي تستخدم بنية فعّالة للعمود الفقري والرقبة تهدف إلى زيادة الإنتاجية على وحدات معالجة الرسومات. تشمل الابتكارات الرئيسية استخدام تقنيات التقطير الذاتي أثناء التدريب، مما يساعد النماذج الأصغر على التعلم من النماذج الأكبر لتعزيز الدقة دون زيادة تكلفة الاستدلال. بالإضافة إلى ذلك، يركز إطار العمل على تكميم النماذج، مما يوفر دعمًا محددًا لنشر النماذج على الأجهزة ذات الموارد الحاسوبية المحدودة.
نقاط القوة
- التحسين الصناعي: مصممة خصيصًا لمهام الكشف عن الأجسام الصناعية حيث يتم تحديد قيود أجهزة معينة.
- دعم التحويل الكمي: يوفر تدفقات عمل راسخة للتقدير الكمي بعد التدريب، وهو مفيد لخطوط أنابيب نشر حافة محددة.
- متغيرات الأجهزة المحمولة: يتضمن تكوينات YOLOv6Lite المحسّنة لوحدات المعالجة المركزية المحمولة.
نقاط الضعف
- براعة محدودة: يقتصر في المقام الأول على اكتشاف الأجسام، ويفتقر إلى الدعم الأصلي للمهام المعقدة مثل تجزئة المثيل أو تقدير الوضعية أو الصناديق المحدودة الموجهة (OBB).
- كفاءة الموارد: كما هو موضّح في قسم الأداء، غالبًا ما تتطلب نماذج YOLOv6 عددًا أكبر من وحدات FLOP وعدد معلمات لتحقيق مستويات دقة مماثلة للمعماريّات الأحدث.
- نطاق النظام الإيكولوجي: على الرغم من أن النظام الإيكولوجي مفتوح المصدر، إلا أنه أقل شمولاً من منصة Ultralytics مما قد يوفر تكاملات أقل لعمليات التشغيل الآلي وإدارة البيانات والنشر السلس.
Ultralytics YOLO11
المؤلفان: جلين يوتشر وجينغ كيو
المنظمة: Ultralytics
التاريخ: 2024-09-27 2024
GitHub: ultralytics
المستندات: https:yolo11
يمثل Ultralytics YOLO11 أحدث تكرار في سلسلة YOLO الشهيرة، حيث يعيد تعريف التوقعات فيما يتعلق بالأداء وسهولة الاستخدام. تم إصداره في أواخر عام 2024، وهو يعتمد على إرث من الابتكار لتقديم نموذج ليس فقط أسرع وأكثر دقة ولكنه أيضًا متعدد الاستخدامات بشكل ملحوظ عبر مجموعة واسعة من مهام الرؤية الحاسوبية.
البنية والميزات الرئيسية
يتميّز YOLO11 ببنية محسّنة وخالية من الارتكازات تعمل على تحسين قدرات استخراج الميزة بشكل كبير مع تقليل النفقات الحسابية. يعطي التصميم الأولوية لكفاءة البارامترات، مما يسمح للنموذج بتحقيق أعلى mAP أعلى بمعلمات أقل مقارنةً بسابقاته ومنافسيه. تُترجم هذه الكفاءة إلى استخدام أقل للذاكرة أثناء التدريب والاستدلال، وهي ميزة حاسمة مقارنةً بالنماذج القائمة على المحولات التي غالبًا ما تتطلب ذاكرة كبيرة GPU .
براعة في العمل
وخلافاً للعديد من النماذج المتخصصة، يدعم YOLO11 في الأصل اكتشاف الكائنات، وتقسيم المثيلات، وتصنيف الصور، وتقدير الوضعية، واكتشاف الصندوق المحدود الموجه (OBB) ضمن إطار عمل واحد وموحد.
نقاط القوة
- توازن أداء لا مثيل له: يوفر دقة فائقة مع انخفاض كبير في حجم النموذج وعمليات التشغيل FLOP، مما يجعله مثاليًا لكل من الذكاء الاصطناعي المتطور على أجهزة مثل NVIDIA Jetson وعمليات النشر السحابية القابلة للتطوير.
- نظام بيئي شامل: بدعم من نظام Ultralytics البيئي الذي تتم صيانته بنشاط، يستفيد المستخدمون من التحديثات المتكررة، والوثائق الشاملة، والتكامل السلس مع أدوات مثل Ultralytics HUB للتدريب والنشر.
- سهولة الاستخدام: تسمح واجهة برمجة تطبيقاتPython API و CLI المبسطة للمطورين بالانتقال من مرحلة التثبيت إلى مرحلة الاستدلال في دقائق، مما يجعل الوصول إلى الذكاء الاصطناعي المتقدم أكثر ديمقراطية.
- كفاءة التدريب: تضمن إجراءات التدريب المُحسَّنة والأوزان المتاحة المُدرَّبة مسبقًا تقاربًا أسرع وتكاليف حسابية أقل.
نقاط الضعف
- اعتماد الهندسة المعمارية الجديدة: كإصدار متطور، تنمو بسرعة البرامج التعليمية والموارد المجتمعية التابعة لجهات خارجية ولكن قد تكون أقل وفرة من تلك الخاصة بالنماذج القديمة مثل YOLOv5.
مقارنة الأداء
يسلط التحليل المعياري التالي الضوء على مكاسب الكفاءة التي حققها YOLO11 على YOLOv6.0. تُظهر البيانات، التي تم تقييمها على مجموعة بياناتCOCO أن نماذج Ultralytics تحقق باستمرار دقة فائقة مع بصمة حسابية أخف.
على سبيل المثال، يتفوق نموذج YOLO11m على نموذج YOLOv6.0m في الدقة (51.5 مقابل 50.0 mAP) مع استخدام معلمات أقل بنسبة 42% تقريبًا و20% أقل من وحدات FLOP. هذه الكفاءة أمر بالغ الأهمية لتقليل وقت الاستجابة واستهلاك الطاقة في تطبيقات العالم الحقيقي.
| النموذج | الحجم (بالبكسل) | mAPفال 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6.0 م | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6.0L | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
منهجيات التدريب والنظام البيئي
تختلف تجربة التدريب اختلافًا كبيرًا بين الإطارين. يعتمد YOLOv6 على البرامج النصية القياسية للتعلم العميق ويركز على التقطير الذاتي لتحقيق أعلى مقاييس أدائه، مما قد يضيف تعقيدًا إلى خط أنابيب التدريب.
على النقيض من ذلك Ultralytics YOLO11 مصمم لإنتاجية المطورين. فهو يتكامل بسلاسة مع حزمة MLOPS الحديثة، ويدعم التسجيل التلقائي مع Weights & Biases, Cometو TensorBoard. تتسم عملية التدريب بكفاءة عالية في الذاكرة، مما يسمح في كثير من الأحيان بأحجام دفعات أكبر على نفس الأجهزة مقارنةً بأجهزة الكشف الأخرى.
مثال على سهولة الاستخدام
يسمح لك YOLO11 بتدريب نموذج مخصص ببضعة أسطر فقط من كود Python مما يعرض بساطة واجهة برمجة تطبيقات Ultralytics :
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
حالات الاستخدام المثالية
عند الاختيار بين هذه النماذج، ضع في اعتبارك المتطلبات المحددة لمشروعك:
يعد YOLOv6.0 مرشحاً صالحاً لـ
- الأنظمة الصناعية القديمة: البيئات التي تتوافق فيها تحسينات YOLOv6 الخاصة بالأجهزة مع البنية التحتية الحالية.
- الكشف عن الأجسام الثابتة: المشاريع التي يكون فيها المتطلب هو الكشف عن المربع المحدود فقط دون الحاجة إلى التوسع المستقبلي في التجزئة أو تقدير الوضع.
Ultralytics YOLO11 هو الخيار الموصى به لـ
- تطبيقات متعددة المهام: السيناريوهات التي تتطلب الكشف وتقدير الوضعية والتجزئة في وقت واحد، كما هو الحال في الروبوتات أو التحليلات الرياضية المتقدمة.
- نشر الحافة: التطبيقات التي تعمل على الأجهزة المحدودة الموارد مثل Raspberry Pi، حيث يوفر عدد معلمات YOLO11 المنخفض والدقة العالية أفضل أداء لكل واط.
- التطوير السريع: الفرق التي تحتاج إلى التكرار بسرعة، والاستفادة من الوثائق الشاملة والدعم المجتمعي النشط لحل المشاكل بشكل أسرع.
- الحلول التجارية: تطبيقات على مستوى المؤسسات تستفيد من خيارات الاستقرار والترخيص التي توفرها Ultralytics.
الخلاصة
بينما يظل YOLOv6.0 نموذجًا محترمًا لمنافذ صناعية محددة, Ultralytics YOLO11 يضع معيارًا جديدًا للرؤية الحاسوبية. إن توازنه المتفوق بين الدقة والكفاءة، بالإضافة إلى القدرة على التعامل مع مهام الرؤية المتنوعة، يجعله الحل الأكثر قدرة على مواجهة المستقبل وتنوعًا. تضمن متطلبات الذاكرة المنخفضة والنظام البيئي القوي الذي يتم صيانته جيدًا المحيط بـ YOLO11 أن يتمكن المطورون من بناء حلول الذكاء الاصطناعي الخاصة بهم ونشرها وتوسيع نطاقها بثقة.
للمهتمين باستكشاف المزيد، تقدم وثائق Ultralytics مقارنات مع نماذج أخرى مثل YOLOv8, YOLOv10و RT-DETR.