تخطي إلى المحتوى

YOLOv6.0 مقابل YOLOv10: استكشاف بنى الكشف عن الكائنات في الوقت الفعلي

أصبح مجال الرؤية الحاسوبية أكثر تعقيدًا، مما يجعل اختيار النموذج الأمثل قرارًا حاسمًا للمطورين ومهندسي التعلم الآلي. عند تقييم تطورYOLO الكشف عن الكائناتYOLO من المهم فهم المفاضلات بين مختلف النهج المعمارية. يقدم هذا الدليل مقارنة تقنية شاملة بين YOLOv6. YOLOv10 و YOLOv10 وهما نموذجان يقدمان مزايا مميزة للتطبيقات الصناعية والتطبيقات المتطورة.

تفكيك YOLOv6.0: مصمم لتحقيق إنتاجية صناعية

تم تطوير YOLOv6. YOLOv6 لتعظيم الإنتاجية في التطبيقات الصناعية من جانب الخادم، ويمنح الأولوية للاستدلال السريع على مسرعات الأجهزة، وخاصة وحدات معالجة الرسومات (GPU). من خلال استخدام بنية أساسية محسّنة، يهدف إلى تحقيق التوازن بين معالجة الفيديو عالية السرعة والدقة التنافسية.

المؤلفون: Chuyi Li، Lulu Li، Yifei Geng، وآخرون.
المنظمة: Meituan
التاريخ: 2023-01-13
Arxiv: 2301.05586
GitHub: YOLOv6

أبرز الملامح المعمارية

يكمن جوهر YOLOv6 في تصميمه المتوافق مع الأجهزة. فهو يدمج وحدة تسلسل ثنائي الاتجاه (BiC) في بنية العنق لتعزيز دمج الميزات متعددة النطاقات. بالإضافة إلى ذلك، تستفيد الشبكة من استراتيجية التدريب بمساعدة المراسي (AAT) التي تمزج بذكاء بين استقرار أجهزة الكشف القائمة على المراسي أثناء التدريب وسرعة الاستدلال في نموذج خالٍ من المراسي.

مدعومًا ببنية EfficientRep الأساسية، يتألق هذا النموذج في مهام أتمتة التصنيع الثقيلة حيث تعتبر المعالجة المجمعة على NVIDIA القوية (مثل وحدات معالجة الرسومات T4 أو A100) هي القاعدة. على الرغم من أدائه الرائع في مجموعات الخوادم، إلا أن اعتماده على تحسينات أجهزة معينة قد يجعله أقل كفاءة على وحدات المعالجة المركزية ذات الطاقة المنخفضة.

تعرف على المزيد حول YOLOv6

تفكيك YOLOv10: الرائد NMS

بعد أكثر من عام من طرحه، YOLOv10 النموذج السائد من خلال معالجة أحد أكثر العقبات صعوبة في عمليات الكشف التقليدية: المعالجة اللاحقة لعدم القمع الأقصى (NMS).

المؤلفون: Ao Wang، Hui Chen، Lihao Liu، وآخرون.
المنظمة: جامعة تسينغهوا
التاريخ: 2024-05-23
Arxiv: 2405.14458
GitHub: THU-MIG/yolov10

أبرز الملامح المعمارية

تتمثل المساهمة الرئيسية YOLOv10 في هذا المجال في تصميمها الشامل NMS. من خلال استخدام التعيينات المزدوجة المتسقة أثناء التدريب، تضطر الشبكة إلى إنتاج مربع حدود واحد عالي الجودة لكل كائن، مما يلغي الحاجة إلى NMS القائمة على الاستدلال أثناء الاستدلال. يقلل هذا الابتكار بشكل كبير من زمن الاستدلال الشامل ويبسط بشكل كبير منطق النشر على الأجهزة الطرفية مثل وحدات المعالجة العصبية (NPUs).

علاوة على ذلك، يتميز النموذج بتصميم شامل يركز على الكفاءة والدقة. من خلال التحسين الشامل لمختلف الطبقات، يقلل YOLOv10 من التكرار الحسابي. وهذا يجعله مناسبًا للغاية للبيئات المحدودة الموارد، بما في ذلك المركبات ذاتية القيادة والروبوتات المتطورة.

تعرف على المزيد حول YOLOv10

مقارنة مفصلة للأداء

عند مقارنة هذه النماذج، يتم قياس الأداء عادةً من حيث الدقة والسرعة وكفاءة المعلمات. يوضح الجدول أدناه أداء المقاييس المختلفة لهذه البنى.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

تحليل

يحقق YOLOv10 متوسط دقة متفوق (mAP) عبر فئات الحجم المكافئة مقارنةً بـ YOLOv6. YOLOv6. على سبيل المثال، يصل YOLOv10n إلى 39.5٪ mAP 2.3 مليون معلمة فقط، في حين أن YOLOv6. YOLOv6 يسجل 37.5٪ باستخدام أكثر من ضعف عدد المعلمات. ومع ذلك، يدير YOLOv6. YOLOv6 زمن TensorRT خالص أسرع قليلاً على GPU T4 GPU 1.17 مللي ثانية)، مما يظهر تحسينه العميق لأجهزة المعالجة المتوازية.

اعتبارات النشر

في حين أن مقاييس زمن الاستجابة الخام على GPU تفضل YOLOv6 قليلاً YOLOv6 المعايير الدقيقة، فإن طبيعة YOLOv10 NMS غالباً ما تؤدي إلى سرعات أنابيب نقل أسرع في العالم الواقعي، لا سيما على الأجهزة الطرفية حيث يمكن أن تؤدي المعالجة اللاحقة إلى إعاقة وحدة CPU.

حالات الاستخدام والتوصيات

YOLOv10 الاختيار بين YOLOv6 YOLOv10 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار YOLOv6

YOLOv6 خيار قوي لـ:

  • النشر الصناعي المراعي للأجهزة: سيناريوهات يوفر فيها تصميم النموذج المراعي للأجهزة وإعادة تحديد المعلمات بكفاءة أداءً محسّنًا على أجهزة مستهدفة محددة.
  • الكشف السريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الأولي على GPU الفيديو في الوقت الفعلي في البيئات الخاضعة للرقابة.
  • تكامل نظام Meituan البيئي: فرق تعمل بالفعل ضمن مجموعة تقنيات Meituan وبنيتها التحتية للنشر.

متى تختار YOLOv10

يوصى YOLOv10 في الحالات التالية:

  • الكشف في الوقت الفعليNMS: تطبيقات تستفيد من الكشف الشامل بدون قمع غير أقصى، مما يقلل من تعقيد النشر.
  • التوازن بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر نماذج مختلفة.
  • تطبيقات ذات زمن انتقال ثابت: سيناريوهات النشر التي يكون فيها زمن الاستدلال المتوقع أمرًا بالغ الأهمية، مثل الروبوتات أو الأنظمة المستقلة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

Ultralytics : لماذا يعد YOLO26 الخيار الأفضل

بينما YOLOv10 YOLOv6. YOLOv6 و YOLOv10 بنى أساسية متينة، تتطلب بيئات الإنتاج الحديثة نماذج تجمع بين الدقة القصوى وسهولة الاستخدام الفائقة. وهنا يتفوق إطار عمل نموذج Ultralytics بشكل أساسي على الإصدارات الأكاديمية المستقلة.

صدر YOLO26 في يناير 2026، ويضم أفضل الابتكارات من السنوات السابقة ويضمها في نظام بيئي يتم صيانته بدقة.

ابتكارات YOLO26 الرئيسية

  • تصميم شامل NMS: بناءً على المفهوم الذي ابتكرته YOLOv10، تقضي YOLO26 بشكل أساسي على NMS مما ينتج عنه أوقات استدلال أكثر سلاسة وقابلية للتنبؤ، وأسهل بكثير في نقلها إلى مرحلة الإنتاج.
  • MuSGD Optimizer: مستوحى من تحسينات نماذج اللغة الكبيرة مثل Kimi K2 من Moonshot AI، يضمن هذا المزيج من SGD Muon تدريبًا مستقرًا للغاية وتقاربًا أسرع بشكل ملحوظ.
  • CPU أسرع بنسبة تصل إلى 43٪ CPU : بالنسبة للأجهزة الطرفية، يتميز YOLO26 بتبسيطات معمارية محددة، مما يجعله متفوقًا بشكل كبير في النشر على رقائق إنترنت الأشياء ووحدات المعالجة المركزية الاستهلاكية.
  • إزالة DFL: تعمل إزالة Distribution Focal Loss على تبسيط تصدير الرأس، مما يحسن بشكل كبير التوافق مع محركات النشر منخفضة الطاقة مثل OpenVINO أو NCNN.
  • ProgLoss + STAL: تعمل الصيغ المتقدمة لحساب الخسارة على تعزيز الدقة بشكل ملحوظ في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لعمليات الطائرات بدون طيار (UAV) وتتبع الأجسام البعيدة.

علاوة على ذلك، وعلى عكس مستودعات المهام الفردية، يتعامل Ultralytics مجموعة ضخمة من مهام الرؤية الجاهزة للاستخدام، بما في ذلك الكشف عن المربعات المحيطة، وتجزئة الحالات، وتصنيف الصور، وتقدير الوضع.

كفاءة التدريب وتحسين الذاكرة

تتمثل إحدى المزايا الهامةYOLO Ultralytics YOLO مقارنة بالبنى المعقدة القائمة على المحولات مثل RT-DETR في استهلاكها المنخفض للغاية CUDA أثناء التدريب. يمكن للمطور ضبط YOLO26 بسهولة على GPU مخصصة للمستهلكين GPU من خلال موارد سحابية مجانية، مما يساهم بشكل كبير في إتاحة تطوير الذكاء الاصطناعي للجميع.

مثال على الكود: البدء مع YOLO26

تتيح لك سهولة الاستخدام التي توفرها Python Ultralytics Python تحميل النماذج وتدريبها واختبارها باستخدام بضع أسطر من التعليمات البرمجية فقط.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Evaluate model performance on validation data
metrics = model.val()

# Run real-time NMS-free inference on a target image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for cross-platform deployment
model.export(format="onnx")

تعرف على المزيد حول YOLO26

الخلاصة والخيارات البديلة

عند الاختيار بين YOLOv6. YOLOv6 و YOLOv10 يعتمد القرار على بيئة النشر. يظل YOLOv6. YOLOv6 قابلاً للتطبيق في الخوادم الخلفية عالية الإنتاجية GPU التي تركز على معالجة مجموعات الفيديو. YOLOv10 بنية أكثر ذكاءً NMS وهي أكثر ملاءمة للتوازن بين الدقة والتكامل المعقد للحواف.

ومع ذلك، بالنسبة للمطورين الذين يبحثون عن أداء لا يقبل المساومة مدعوم بوثائق شاملة، وتسجيل سحابي عبر Ultralytics وتعدد المهام، فإن YOLO26 هو الخيار الموصى به بشكل قاطع.

بالنسبة لمتطلبات البنية التحتية القديمة، قد تقوم الفرق أيضًا بدراسة الجيل السابق Ultralytics YOLO11، أو استكشاف YOLO للحصول على إمكانات فريدة للكشف عن المفردات المفتوحة.


تعليقات