YOLOv6.0 مقابل YOLOv10: استكشاف بنى الكشف عن الكائنات في الوقت الفعلي
أصبح مجال الرؤية الحاسوبية أكثر تعقيدًا، مما يجعل اختيار النموذج الأمثل قرارًا حاسمًا للمطورين ومهندسي التعلم الآلي. عند تقييم تطورYOLO الكشف عن الكائناتYOLO من المهم فهم المفاضلات بين مختلف النهج المعمارية. يقدم هذا الدليل مقارنة تقنية شاملة بين YOLOv6. YOLOv10 و YOLOv10 وهما نموذجان يقدمان مزايا مميزة للتطبيقات الصناعية والتطبيقات المتطورة.
تفكيك YOLOv6.0: مصمم لتحقيق إنتاجية صناعية
تم تطوير YOLOv6. YOLOv6 لتعظيم الإنتاجية في التطبيقات الصناعية من جانب الخادم، ويمنح الأولوية للاستدلال السريع على مسرعات الأجهزة، وخاصة وحدات معالجة الرسومات (GPU). من خلال استخدام بنية أساسية محسّنة، يهدف إلى تحقيق التوازن بين معالجة الفيديو عالية السرعة والدقة التنافسية.
المؤلفون: تشوي لي، لولو لي، ييفي جينغ، وآخرون.
المنظمة: ميتوان
التاريخ: 2023-01-13
أرشيف: 2301.05586
جيت هاب: meituan/YOLOv6
أبرز الملامح المعمارية
يكمن جوهر YOLOv6 في تصميمه المتوافق مع الأجهزة. فهو يدمج وحدة تسلسل ثنائي الاتجاه (BiC) في بنية العنق لتعزيز دمج الميزات متعددة النطاقات. بالإضافة إلى ذلك، تستفيد الشبكة من استراتيجية التدريب بمساعدة المراسي (AAT) التي تمزج بذكاء بين استقرار أجهزة الكشف القائمة على المراسي أثناء التدريب وسرعة الاستدلال في نموذج خالٍ من المراسي.
مدعومًا ببنية EfficientRep الأساسية، يتألق هذا النموذج في مهام أتمتة التصنيع الثقيلة حيث تعتبر المعالجة المجمعة على NVIDIA القوية (مثل وحدات معالجة الرسومات T4 أو A100) هي القاعدة. على الرغم من أدائه الرائع في مجموعات الخوادم، إلا أن اعتماده على تحسينات أجهزة معينة قد يجعله أقل كفاءة على وحدات المعالجة المركزية ذات الطاقة المنخفضة.
تفكيك YOLOv10: الرائد NMS
بعد أكثر من عام من طرحه، YOLOv10 النموذج السائد من خلال معالجة أحد أكثر العقبات صعوبة في عمليات الكشف التقليدية: المعالجة اللاحقة لعدم القمع الأقصى (NMS).
المؤلفون: آو وانغ، هوي تشن، لي هاو ليو، وآخرون.
المنظمة: جامعة تسينغهوا
التاريخ: 2024-05-23
أرشيف: 2405.14458
جيت هاب: THU-MIG/yolov10
أبرز الملامح المعمارية
تتمثل المساهمة الرئيسية YOLOv10 في هذا المجال في تصميمها الشامل NMS. من خلال استخدام التعيينات المزدوجة المتسقة أثناء التدريب، تضطر الشبكة إلى إنتاج مربع حدود واحد عالي الجودة لكل كائن، مما يلغي الحاجة إلى NMS القائمة على الاستدلال أثناء الاستدلال. يقلل هذا الابتكار بشكل كبير من زمن الاستدلال الشامل ويبسط بشكل كبير منطق النشر على الأجهزة الطرفية مثل وحدات المعالجة العصبية (NPUs).
علاوة على ذلك، يتميز النموذج بتصميم شامل يركز على الكفاءة والدقة. من خلال التحسين الشامل لمختلف الطبقات، يقلل YOLOv10 من التكرار الحسابي. وهذا يجعله مناسبًا للغاية للبيئات المحدودة الموارد، بما في ذلك المركبات ذاتية القيادة والروبوتات المتطورة.
مقارنة مفصلة للأداء
عند مقارنة هذه النماذج، يتم قياس الأداء عادةً من حيث الدقة والسرعة وكفاءة المعلمات. يوضح الجدول أدناه أداء المقاييس المختلفة لهذه البنى.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
تحليل
يحقق YOLOv10 متوسط دقة متفوق (mAP) عبر فئات الحجم المكافئة مقارنةً بـ YOLOv6. YOLOv6. على سبيل المثال، يصل YOLOv10n إلى 39.5٪ mAP 2.3 مليون معلمة فقط، في حين أن YOLOv6. YOLOv6 يسجل 37.5٪ باستخدام أكثر من ضعف عدد المعلمات. ومع ذلك، يدير YOLOv6. YOLOv6 زمن TensorRT خالص أسرع قليلاً على GPU T4 GPU 1.17 مللي ثانية)، مما يظهر تحسينه العميق لأجهزة المعالجة المتوازية.
اعتبارات النشر
في حين أن مقاييس زمن الاستجابة الخام على GPU تفضل YOLOv6 قليلاً YOLOv6 المعايير الدقيقة، فإن طبيعة YOLOv10 NMS غالباً ما تؤدي إلى سرعات أنابيب نقل أسرع في العالم الواقعي، لا سيما على الأجهزة الطرفية حيث يمكن أن تؤدي المعالجة اللاحقة إلى إعاقة وحدة CPU.
حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLOv6 و YOLOv10 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
متى تختار YOLOv6
YOLOv6 خيار قوي لـ:
- النشر الصناعي المدرك للأجهزة: سيناريوهات حيث يوفر تصميم النموذج المدرك للأجهزة وإعادة التكوين الفعالة أداءً محسنًا على أجهزة مستهدفة محددة.
- detect سريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الخام على GPU لمعالجة الفيديو في الوقت الفعلي في بيئات محكومة.
- تكامل نظام Meituan البيئي: الفرق التي تعمل بالفعل ضمن مكدس تقنية Meituan والبنية التحتية للنشر.
متى تختار YOLOv10
يوصى YOLOv10 في الحالات التالية:
- detect في الوقت الفعلي خالٍ من NMS: التطبيقات التي تستفيد من detect الشامل دون التثبيط غير الأقصى، مما يقلل من تعقيد النشر.
- مقايضات متوازنة بين السرعة والدقة: المشاريع التي تتطلب توازنًا قويًا بين سرعة الاستدلال ودقة الكشف عبر مقاييس النماذج المختلفة.
- تطبيقات زمن الاستجابة المتسق: سيناريوهات النشر التي تكون فيها أوقات الاستدلال المتوقعة حاسمة، مثل الروبوتات أو الأنظمة المستقلة.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
- بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
- اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.
Ultralytics : لماذا يعد YOLO26 الخيار الأفضل
بينما YOLOv10 YOLOv6. YOLOv6 و YOLOv10 بنى أساسية متينة، تتطلب بيئات الإنتاج الحديثة نماذج تجمع بين الدقة القصوى وسهولة الاستخدام الفائقة. وهنا يتفوق إطار عمل نموذج Ultralytics بشكل أساسي على الإصدارات الأكاديمية المستقلة.
صدر YOLO26 في يناير 2026، ويضم أفضل الابتكارات من السنوات السابقة ويضمها في نظام بيئي يتم صيانته بدقة.
ابتكارات YOLO26 الرئيسية
- تصميم خالٍ من NMS وشامل: استنادًا إلى المفهوم الذي تم ابتكاره في YOLOv10، يلغي YOLO26 معالجة NMS اللاحقة بشكل طبيعي، مما يؤدي إلى أوقات استدلال أكثر سلاسة وقابلية للتنبؤ، والتي أسهل بكثير للنشر في الإنتاج.
- مُحسِّن MuSGD: مستوحى من تحسينات نماذج اللغة الكبيرة مثل Kimi K2 من Moonshot AI، يضمن هذا المزيج من SGD و Muon تدريبًا مستقرًا بشكل لا يصدق وتقاربًا أسرع بشكل كبير.
- سرعة استدلال أسرع بنسبة تصل إلى 43% على الـ CPU: بالنسبة للأجهزة الطرفية، يتميز YOLO26 بتبسيطات معمارية محددة، مما يجعله متفوقًا جدًا للنشر على رقائق إنترنت الأشياء ووحدات CPU الاستهلاكية.
- إزالة DFL: تبسط إزالة Distribution Focal Loss تصدير الرأس، مما يحسن بشكل كبير التوافق مع محركات النشر منخفضة الطاقة مثل OpenVINO أو NCNN.
- ProgLoss + STAL: صيغ الخسارة المتقدمة تعزز بشكل ملحوظ الدقة في التعرف على الكائنات الصغيرة، وهو أمر بالغ الأهمية لعمليات الطائرات بدون طيار (UAV) وتتبع الأهداف البعيدة.
علاوة على ذلك، وعلى عكس مستودعات المهام الفردية، يتعامل Ultralytics مجموعة ضخمة من مهام الرؤية الجاهزة للاستخدام، بما في ذلك الكشف عن المربعات المحيطة، وتجزئة الحالات، وتصنيف الصور، وتقدير الوضع.
كفاءة التدريب وتحسين الذاكرة
تتمثل إحدى المزايا الحاسمة لنماذج Ultralytics YOLO مقارنة بالبنيات المعقدة القائمة على المحولات مثل RT-DETR في استهلاكها المنخفض للغاية لذاكرة CUDA أثناء التدريب. يمكن للمطور ضبط YOLO26 بسهولة على وحدة معالجة رسوميات (GPU) من الفئة الاستهلاكية أو من خلال موارد سحابية مجانية، مما يساهم بشكل كبير في إضفاء الطابع الديمقراطي على تطوير الذكاء الاصطناعي.
مثال على الكود: البدء مع YOLO26
تتيح لك سهولة الاستخدام التي توفرها Python Ultralytics Python تحميل النماذج وتدريبها واختبارها باستخدام بضع أسطر من التعليمات البرمجية فقط.
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
# Evaluate model performance on validation data
metrics = model.val()
# Run real-time NMS-free inference on a target image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to ONNX format for cross-platform deployment
model.export(format="onnx")
الخلاصة والخيارات البديلة
عند الاختيار بين YOLOv6. YOLOv6 و YOLOv10 يعتمد القرار على بيئة النشر. يظل YOLOv6. YOLOv6 قابلاً للتطبيق في الخوادم الخلفية عالية الإنتاجية GPU التي تركز على معالجة مجموعات الفيديو. YOLOv10 بنية أكثر ذكاءً NMS وهي أكثر ملاءمة للتوازن بين الدقة والتكامل المعقد للحواف.
ومع ذلك، بالنسبة للمطورين الذين يبحثون عن أداء لا يقبل المساومة مدعوم بوثائق شاملة، وتسجيل سحابي عبر Ultralytics وتعدد المهام، فإن YOLO26 هو الخيار الموصى به بشكل قاطع.
بالنسبة لمتطلبات البنية التحتية القديمة، قد تقوم الفرق أيضًا بدراسة الجيل السابق Ultralytics YOLO11، أو استكشاف YOLO للحصول على إمكانات فريدة للكشف عن المفردات المفتوحة.