تخطي إلى المحتوى

YOLOv10 YOLOv6.0: مواجهة بين الجيل الجديد من برامج الكشف عن الأجسام في الوقت الفعلي

في عالم الرؤية الحاسوبية سريع التطور، يعد اختيار نموذج الكشف عن الأجسام المناسب أمراً بالغ الأهمية لتحقيق النجاح. هناك نوعان من البنى البارزة، وهما YOLOv10 و YOLOv6، خطوتا خطوات كبيرة في تحقيق التوازن بين السرعة والدقة. تستكشف هذه المقارنة التفصيلية ابتكاراتهما المعمارية ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في تحديد النموذج الأنسب لاحتياجاتك.

بينما يقدم كلا النموذجين حلولاً قوية للتطبيقات الصناعية والبحثية، يوفر Ultralytics بيئة موحدة لتدريب هذه البنى وتقييمها ونشرها بسهولة. سواء كنت تعمل على بناء بنية تحتية لمدينة ذكية أو تحسين خطوط الإنتاج، فإن فهم الفروق الدقيقة بين هذين النموذجين أمر أساسي.

مقارنة مقاييس الأداء

يوضح الجدول التالي أداء YOLOv10 YOLOv6. YOLOv6 عبر نطاقات نماذج مختلفة. تم تقييم كلا النموذجين على COCO مع التركيز على متوسط الدقة (mAP) ووقت الاستدلال على الأجهزة القياسية.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

YOLOv10: المبتكر الشامل

YOLOv10، الذي قدمه باحثون من جامعة تسينغهوا، يمثل تحولًا جذريًا في YOLO . وتتمثل أهم ميزاته في التخلص من تقنية Non-Maximum Suppression (NMS) أثناء المعالجة اللاحقة، والتي تتحقق من خلال استراتيجية مزدوجة متسقة. ويتيح هذا التصميم التدريب والنشر الحقيقيين من البداية إلى النهاية، مما يقلل بشكل كبير من تقلب زمن الاستجابة في التطبيقات الواقعية.

الميزات المعمارية الرئيسية

  • تدريبNMS: من خلال استخدام تعيينات التسمية المزدوجة — واحد إلى العديد من أجل الإشراف الغني وواحد إلى واحد من أجل الاستدلال الفعال —YOLOv10 الاختناق الحسابي لـ NMS.
  • تصميم كفاءة شامل: تتميز البنية بوجود رأس تصنيف خفيف الوزن وتقليل دقة العينة المفردة عن القناة المكانية، مما يؤدي إلى تحسين عدد المعلمات وعمليات FLOPs.
  • تصميم الكتل الموجه بالرتبة: لتقليل التكرار، YOLOv10 تصميم الكتل الموجه بالرتبة الذي يتكيف مع التعقيد بناءً على مرحلة الشبكة.

المؤلف: Ao Wang، Hui Chen، Lihao Liu، وآخرون.
المنظمة:جامعة تسينغهوا
التاريخ: 23 مايو 2024
الروابط:arXiv | GitHub | Docs

تعرف على المزيد حول YOLOv10

YOLOv6-3.0: العملاق الصناعي

يركز YOLOv6.YOLOv6، الذي طورته Meituan، بشكل كبير على سيناريوهات التطبيقات الصناعية حيث يكون الإنتاجية على الأجهزة المخصصة (مثل وحدات معالجة الرسومات) أمرًا بالغ الأهمية. ويقدم تحديث "إعادة التحميل"، الذي يعمل على تحسين الشبكة للحصول على دقة وأداء تكمية أفضل.

الميزات المعمارية الرئيسية

  • التسلسل ثنائي الاتجاه (BiC): وحدة جديدة في العنق تعمل على تحسين دقة تحديد الموقع من خلال دمج الميزات من مستويات مختلفة بشكل أفضل.
  • التدريب بمساعدة المرساة (AAT): تسمح هذه الاستراتيجية للنموذج بالاستفادة من استقرار التحسين القائم على المرساة مع الحفاظ على بنية خالية من المرساة للاستدلال.
  • سهولة التكمية: تم تصميم البنية خصيصًا لتقليل تدهور الدقة عند التكمية إلى INT8، مما يجعلها مثالية للأجهزة الطرفية التي تستخدم TensorRT.

المؤلف: Chuyi Li، Lulu Li، Yifei Geng، وآخرون.
المنظمة:Meituan
التاريخ: 13 يناير 2023
الروابط:arXiv | GitHub | Docs

تعرف على المزيد حول YOLOv6

تحليل المقارنة

1. زمن الاستجابة والكفاءة

يتفوق YOLOv10 على YOLOv6. YOLOv6 من حيث كفاءة المعلمات وعمليات FLOP. على سبيل المثال، يحقق نموذج YOLOv10s معدل mAP أعلى mAP 46.3٪ مقابل 45.0٪) مع معلمات أقل بكثير (7.2 مليون مقابل 18.5 مليون) مقارنةً بـ YOLOv6.YOLOv6. YOLOv10 إزالة NMS YOLOv10 في تقليل زمن الاستجابة وجعله أكثر قابلية للتنبؤ، خاصة على وحدات المعالجة المركزية (CPU) حيث تكون تكلفة المعالجة اللاحقة كبيرة. على العكس من ذلك، تم تحسين YOLOv6. YOLOv6 بشكل كبير من أجل GPU ، وغالبًا ما تظهر مزايا السرعة الخام في سيناريوهات الدُفعات الكبيرة على وحدات معالجة الرسومات T4.

2. النشر وسهولة الاستخدام

كلا النموذجين مدعومان من قبل Ultralytics مما يضمن للمطورين إمكانية الوصول إليهما عبر واجهة برمجة تطبيقات موحدة. ومع ذلك، فإن الطبيعة الأصلية الشاملة YOLOv10 تبسط عملية التصدير إلى تنسيقات مثل ONNX و CoreML، حيث لا توجد حاجة لإضافة NMS معقدة إلى الرسم البياني للنموذج.

نصيحة حول النشر

عند النشر على أجهزة طرفية مثل Raspberry Pi أو NVIDIA يؤدي عدد المعلمات الأقل YOLOv10 وتصميمه NMS عادةً إلى استهلاك أقل للذاكرة وأوقات بدء تشغيل أسرع مقارنة بالبنى القديمة.

3. منهجية التدريب

يعتمد YOLOv6.YOLOv6 على تقنيات مثل التقطير الذاتي والتدريب بمساعدة المراسي لتعزيز الأداء، مما قد يزيد من وقت التدريب واستخدام الذاكرة. YOLOv10 مهام مزدوجة متسقة، مما يبسط حساب الخسارة ويحقق التقارب بكفاءة. المستخدمون الذين يستفيدون من منصة Ultralytics يمكن تدريب كلا النموذجين دون القلق بشأن هذه التعقيدات الداخلية، بفضل التجريد model.train() الواجهة.

ميزة Ultralytics

يضمن اختيار نموذج ضمن Ultralytics تجربة "من الصفر إلى القمة". على عكس المستودعات المستقلة التي قد تفتقر إلى التوثيق أو الصيانة، تتمتع Ultralytics بالمزايا التالية:

  • واجهة برمجة تطبيقات موحدة: يمكنك التبديل بين YOLOv10 و YOLOv6 وغيرها عن طريق تغيير سلسلة واحدة في الكود الخاص بك.
  • تنوع المهام: في حين أن YOLOv10 YOLOv6 في الأساس أجهزة كشف، Ultralytics تقدير الوضع وتقسيم الحالات والتصنيف عبر نماذجها الأساسية.
  • تصدير قوي: قم بتصدير النماذج بسلاسة إلى TensorRT و OpenVINO و TFLite الإنتاج.
from ultralytics import YOLO

# Load a pre-trained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

الاستعداد للمستقبل مع YOLO26

على الرغم من أن YOLOv10 YOLOv6.0 خياران ممتازان، إلا أن هذا المجال استمر في التقدم. بالنسبة للمطورين الباحثين عن أحدث ما توصلت إليه التكنولوجيا، يستند YOLO26 على الاختراق NMS لـ YOLOv10 يقدم تحسينات مهمة لأجهزة 2026.

لماذا الترقية إلى YOLO26؟

  • أصلي من البداية إلى النهاية: مثل YOLOv10، YOLO26 NMS، مما يضمن أبسط مسار للنشر.
  • MuSGD Optimizer: مستوحى من تدريب LLM، يضمن هذا المحسن الهجين تقاربًا مستقرًا ويقلل من الحاجة إلى ضبط المعلمات الفائقة بشكل مكثف.
  • تصميم Edge-First: مع إزالة Distribution Focal Loss (DFL) والكتل المحسّنة، يوفر YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعله الخيار الأفضل لتطبيقات الأجهزة المحمولة وإنترنت الأشياء.
  • خصوصية المهمة: على عكس سابقاتها، تتضمن YOLO26 وظائف خسارة متخصصة مثل ProgLoss و STAL، مما يعزز اكتشاف الأجسام الصغيرة ويوفر دعمًا أصليًا لمهام OBB و Pose.

تعرف على المزيد حول YOLO26

الخلاصة

YOLOv10 هو الخيار الموصى به للمستخدمين الذين يفضلون كفاءة المعلمات وخطوط أنابيب النشر البسيطة والشاملة. قدرته على توفير دقة عالية مع عدد أقل من FLOPs تجعله مثاليًا للتطبيقات في الوقت الفعلي على أجهزة متنوعة.

يظل YOLOv6.YOLOv6 منافسًا قويًا في البيئات الصناعية التي تتمتع GPU مخصصة GPU ، حيث يمكن الاستفادة الكاملة من تحسيناته المحددة TensorRT .

بالنسبة لأولئك الذين يحتاجون إلى أعلى مستويات الأداء، والتنوع في المهام (التجزئة، الوضع، OBB)، والدعم المستقبلي، فإن YOLO26 هو التوصية النهائية من Ultralytics.

مزيد من القراءة


تعليقات