YOLOv6.0 مقابلYOLO: مواجهة تقنية
يتم تحديد مشهد الكشف عن الكائنات في الوقت الفعلي من خلال التكرار السريع والمنافسة لتحقيق التوازن الأمثل بين السرعة والدقة. هناك مساهمتان مهمتان في هذا المجال هما YOLOv6.YOLOv6 الذي طورته Meituan، و YOLO من أكاديمية DAMO التابعة لشركة Alibaba. تستكشف هذه المقارنة الابتكارات المعمارية ومعايير الأداء وسيناريوهات النشر المثالية لكلا النموذجين، مع تسليط الضوء على كيفية استمرار Ultralytics الحديث Ultralytics في توسيع حدود الرؤية الحاسوبية.
معيار الأداء
يستهدف كلا النموذجين التطبيقات الصناعية في الوقت الفعلي، ولكنهما يحققان نتائجهما من خلال استراتيجيات تحسين مختلفة. يوضح الجدول أدناه أداءهما على مجموعة بيانات COCO .
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
نظرة عامة على YOLOv6-3.0
أصدرت Meituan في أوائل عام 2023 YOLOv6.YOLOv6 يمثل "إعادة تحميل كاملة" لهيكلها السابق. ويركز بشكل كبير على النماذج الهندسية التي تم تحسينها للنشر على أجهزة مخصصة مثل وحدات معالجة الرسومات (GPU)، مما يجعلها المفضلة للأتمتة الصناعية.
الميزات الرئيسية:
- التسلسل ثنائي الاتجاه (BiC): طريقة محسنة لدمج الميزات في العنق تعزز دقة تحديد الموقع دون تكلفة حسابية كبيرة.
- التدريب بمساعدة المرجع (AAT): استراتيجية تدريب مختلطة تجمع بين النماذج القائمة على المرجع والنماذج الخالية من المرجع لتثبيت التقارب وتحسين الدقة النهائية.
- رأس منفصل: يفصل بين مهام التصنيف والانحدار، وهو معيار في أجهزة الكشف الحديثة، مما يسمح بتحسينات أكثر دقة في مربع الحدود.
- سهولة التكمية: تم تصميم البنية خصيصًا لتقليل فقدان الدقة عند التكمية إلى INT8 باستخدام تقنيات مثل RepOptimizer والتقطير حسب القناة.
نظرة عامة على DAMO-YOLO
تم تطوير YOLO بواسطة مجموعة Alibaba Group وإطلاقه في أواخر عام 2022، ويقدم العديد من التقنيات المبتكرة التي تهدف إلى تجاوز حدود التوازن بين السرعة والدقة، لا سيما من خلال البحث في البنية العصبية (NAS).
الميزات الرئيسية:
- MAE-NAS Backbone: يستخدم بنية أساسية تم اكتشافها عبر Neural Architecture Search (NAS) استنادًا إلى مبدأ Maximum Entropy، مما يضمن تدفقًا عاليًا للمعلومات وكفاءة عالية.
- RepGFPN الفعال: تصميم ثقيل الرقبة يستبدل PANet القياسي بشبكة هرمية عامة للميزات (GFPN)، مما يوفر دمجًا أفضل للميزات متعددة المستويات.
- ZeroHead: رأس كشف خفيف الوزن للغاية مصمم لتقليل الحمل الحسابي الذي يرتبط عادةً بالرؤوس "الثقيلة" المنفصلة.
- AlignedOTA: استراتيجية محدثة لتخصيص التسميات تعمل على مواءمة مهام التصنيف والانحدار بشكل أكثر فعالية أثناء التدريب.
تحليل مقارن
الهندسة المعمارية وفلسفة التصميم
يكمن الاختلاف الأساسي في أصل تصميمهما. تم تصميم YOLOv6 يدويًا مع التركيز بشكل كبير على "سهولة النشر"، مستهدفًا بشكل خاص TensorRT على NVIDIA . إن استخدامه للتلافيف القياسية وكتل RepVGG يجعله قابلاً للتنبؤ بدرجة كبيرة في بيئات الإنتاج.
في المقابل، يعتمد YOLO بشكل كبير على البحث الآلي (NAS) للعثور على الهياكل المثلى. على الرغم من أن هذا يؤدي إلى كفاءة نظرية ممتازة (FLOPs)، إلا أن الهياكل المتفرعة المعقدة الموجودة في الهياكل الأساسية المشتقة من NAS قد يكون من الصعب في بعض الأحيان تحسينها لمترجمات الأجهزة المحددة مقارنة بالتصميم البسيط لـ YOLOv6.
الأداء على الأجهزة الطرفية
للمهام التي تتضمن الذكاء الاصطناعي المتطور، يقدم كلا النموذجين متغيرات "Tiny" أو "Nano" تنافسية. يتميز YOLOv6 بخفة وزنه بشكل استثنائي (4.7 مليون معلمة)، مما يجعله مناسبًا للأجهزة ذات المحدودية الشديدة. على الرغم من أنYOLO أكبر قليلاً، إلا أنه غالبًا ما يوفر دقة أعلى (42.0 mAP) فور استخدامه، مما قد يبرر التكلفة الحسابية الإضافية للتطبيقات التي تتطلب تفاصيل أدق.
منهجيات التدريب
YOLOv6 التقطير الذاتي على نطاق واسع، حيث يوجه نموذج المعلم الأكبر نموذج الطالب أثناء التدريب. وهذا أمر بالغ الأهمية لأدائه العالي، ولكنه يضيف تعقيدًا إلى مسار التدريب.YOLO وحدة تحسين التقطير، ولكنه يركز على تعيين علامة AlignedOTA للتعامل مع العينات الصعبة بشكل أكثر فعالية أثناء عملية التعلم.
اعتبارات النشر
عند النشر في الإنتاج، ضع في اعتبارك أن YOLOv6 غالبًا ما يوفر دعمًا أفضل جاهزًا للاستخدام لتكمية INT8 عبر TensorRT، مما يمكن أن يضاعف سرعات الاستدلال على الأجهزة المتوافقة مثل NVIDIA Orin.
ميزة Ultralytics
في حين أنYOLO YOLOv6 إنجازين بحثيين مثيرين للإعجاب، فإن Ultralytics يوفر ميزة واضحة للمطورين الذين يولون الأولوية لسهولة الاستخدام وقابلية الصيانة والاستعداد للإنتاج.
تجربة مطور سلسة
Ultralytics ، بما في ذلك YOLO11 و YOLO26 المتطورة، مبنية على إطار عمل موحد. وهذا يعني أنه يمكنك تدريب النماذج والتحقق من صحتها ونشرها باستخدام واجهة برمجة تطبيقات بسيطة ومتسقة.
from ultralytics import YOLO
# Load a model (switch freely between versions)
model = YOLO("yolo26n.pt")
# Train on your custom dataset
results = model.train(data="coco8.yaml", epochs=100)
# Export to ONNX for deployment
model.export(format="onnx")
تعدد الاستخدامات عبر المهام
على عكس العديد من المستودعات المتخصصة، يدعم Ultralytics مجموعة واسعة من مهام الرؤية الحاسوبية التي تتجاوز مجرد الكشف البسيط. ويشمل ذلك تقسيم الحالات، وتقدير الوضع، والتصنيف، وكشف المربعات المحددة (OBB). تتيح هذه المرونة للفرق دمج أدوات الذكاء الاصطناعي الخاصة بهم في سير عمل واحد.
تكامل المنصة
منصة Ultralytics تدريب السحابة بنقرة واحدة. هذا النهج المتكامل يزيل الصعوبات المرتبطة بإعداد بيئات محلية معقدة وإدارة مجموعات بيانات متباينة.
المستقبل: Ultralytics
بالنسبة للمطورين الذين يبحثون عن أحدث ما توصلت إليه التكنولوجيا في مجال الأداء والابتكار المعماري، فإن YOLO26 تضع معيارًا جديدًا.
- NMS من البداية إلى النهاية: من خلال التخلص من تقنية Non-Maximum Suppression (NMS)، تعمل YOLO26 على تبسيط خط أنابيب النشر وتقليل تباين زمن الاستجابة، وهي ميزة بالغة الأهمية لأنظمة السلامة في الوقت الفعلي.
- CPU : مع إزالة فقدان التركيز التوزيعي (DFL) وتحسين قيود الحافة، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU مقارنةً بالأجيال السابقة، مما يجعله خيارًا متميزًا للأجهزة التي لا تحتوي على وحدات معالجة رسومات مخصصة.
- استقرار التدريب المتقدم: يوفر دمج MuSGD Optimizer— المستوحى من تقنيات تدريب LLM — استقرارًا غير مسبوق لتدريب نموذج الرؤية، مما يضمن تقاربًا أسرع وتعميمًا أفضل.
- مكاسب خاصة بالمهام: سواء كان ذلك تقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتقدير الوضع الدقيق أو خسائر الزاوية المتخصصة لـ OBB، يقدم YOLO26 تحسينات موجهة لحالات الاستخدام المعقدة.
ملخص
- اختر YOLOv6. YOLOv6 إذا كان هدف النشر الأساسي هو NVIDIA عالية الإنتاجية (مثل T4 و A100) وتحتاج إلى دعم كمي ناضج للفحص الصناعي أو تحليل الفيديو.
- اخترYOLO إذا كنت مهتمًا بالبنى القائمة على NAS وتحتاج إلى بنية أساسية عالية الكفاءة للأبحاث أو السيناريوهات المحددة التي يوفر فيها RepGFPN دمجًا أفضل للميزات.
- اختر Ultralytics للحصول على أفضل توازن شامل بين السرعة والدقة وتجربة المطور. إن تصميمهNMS ومتطلباته المنخفضة من الذاكرة أثناء التدريب ودعمه الشامل للنظام البيئي يجعله الخيار المثالي للتوسع من النماذج الأولية السريعة إلى حلول الإنتاج المؤسسية.
مزيد من القراءة
اكتشف المزيد من المقارنات والنماذج في Ultralytics :
- YOLOv8 مقابل YOLOv6
- RT-DETR - محول الكشف في الوقت الحقيقي.
- YOLOv10 - الكشف عن الأجسام في الوقت الفعلي من البداية إلى النهاية.
- COCO - المعيار القياسي لاكتشاف الكائنات.