تخطي إلى المحتوى

YOLOX مقابل YOLOv10: مقارنة تقنية

شهد مجال الكشف عن الأجسام تطوراً سريعاً مدفوعاً بالحاجة إلى نماذج توازن بين الدقة العالية وسرعة الاستدلال في الوقت الحقيقي. يولوكس و YOLOv10 يمثلان معلمين هامين في هذا الجدول الزمني. فقد أعاد YOLOX، الذي صدر في عام 2021، تنشيط عائلة YOLO من خلال تقديم بنية خالية من الارتكاز، بينما يضع YOLOv10 الذي صدر في عام 2024، معيارًا جديدًا من خلال إلغاء الحاجة إلى نظام "الكبح غير الأقصىNMS، مما يقلل بشكل كبير من زمن انتقال الاستدلال.

يستكشف هذا التحليل الشامل الابتكارات المعمارية ومقاييس الأداء وحالات الاستخدام المثالية لكلا النموذجين، مما يساعد المطورين والباحثين على اختيار أفضل أداة لتطبيقات الرؤية الحاسوبية الخاصة بهم.

يولوكس: الرائد الخالي من المرساة

تم تقديم YOLOX من قبل شركة Megvii في عام 2021، مما يمثل تحولاً بعيداً عن التصميمات القائمة على المرساة التي هيمنت على إصدارات YOLO السابقة. من خلال اعتماد آلية خالية من المرساة ودمج تقنيات متقدمة مثل الرؤوس المنفصلة وSIMOTA، حقق YOLOX أداءً تنافسيًا وسد الفجوة بين الأطر البحثية والتطبيقات الصناعية.

التفاصيل الفنية:
المؤلفون: تشنغ جي، وسونغتاو ليو، وفنغ وانغ، وزيمينغ لي، وجيان صن
المنظمة:ميجفي
التاريخ: 2021-07-18
اركسيف:https://arxiv.org/abs/2107.08430
جيثب:https://github.com/Megvii-BaseDetection/YOLOX
المستندات:https://yolox.readthedocs.io/en/latest/

البنية والميزات الرئيسية

اختلفت YOLOX عن سابقاتها مثل YOLOv4 و YOLOv5 من خلال تنفيذ العديد من التغييرات المعمارية الرئيسية المصممة لتحسين التعميم وتبسيط خط أنابيب التدريب.

  • آلية خالية من المرساة: من خلال إزالة مربعات الارتكاز المحددة مسبقًا، يلغي YOLOX الحاجة إلى ضبط الارتكاز يدويًا، مما يجعل النموذج أكثر قوة في التعامل مع أشكال الأجسام المتنوعة ويقلل من عدد معلمات التصميم.
  • الرأس المنفصل: على عكس الرؤوس المقترنة التي تشترك في ميزات التصنيف والتوطين، يستخدم YOLOX رأسًا منفصلًا. يسمح هذا الفصل لكل مهمة بتحسين معلماتها بشكل مستقل، مما يؤدي إلى تقارب أسرع ودقة إجمالية أفضل.
  • تعيين التسمية SimOTA: قدّمت YOLOX طريقة SimOTA (تعيين النقل الأمثل المبسط)، وهي استراتيجية تعيين التسمية الديناميكية التي تتعامل مع مشكلة التعيين على أنها مهمة نقل مثالية. تتكيف هذه الطريقة بفعالية مع مقاييس الكائنات المختلفة وتحسن استقرار التدريب.
  • تعزيزات قوية: يشتمل خط أنابيب التدريب على زيادة بيانات MixUp و Mosaic، والتي كانت حاسمة لتحقيق أحدث النتائج وقت إصداره.

نقاط القوة والضعف

نقاط القوة:

  • دقة عالية: يحقق YOLOX نتائج قوية mAP مجموعة بياناتCOCO خاصةً مع متغيراته الأكبر مثل YOLOX-x.
  • تصميم مبسط: يقلل النهج الخالي من الارتكاز من المعلمات الزائدة الاستدلالية، مما يبسّط تكوين النموذج.
  • الدعم القديم: باعتباره نموذجًا راسخًا، فقد تم اختباره على نطاق واسع في مختلف البيئات الأكاديمية والصناعية.

نقاط الضعف:

  • كمون أعلى: مقارنةً بالكاشفات الحديثة، يعتمد YOLOX على المعالجة اللاحقة NMS والتي يمكن أن تكون عنق الزجاجة للتطبيقات ذات زمن الاستجابة المنخفض للغاية.
  • التكلفة الحسابية: يتطلب بشكل عام عددًا أكبر من وحدات FLOP ومعلمات أكثر من النماذج الأحدث لتحقيق دقة مماثلة.
  • التكامل: على الرغم من أنه مفتوح المصدر، إلا أنه يفتقر إلى التكامل السلس الموجود في نظام Ultralytics مما قد يتطلب المزيد من الجهد لنشر خطوط الأنابيب.

تعرف على المزيد حول YOLOX

YOLOv10: الكشف من النهاية إلى النهاية في الوقت الفعلي

يمثل YOLOv10 الذي أطلقه باحثون من جامعة تسينغهوا في مايو 2024، نقلة نوعية في الكشف عن الأجسام في الوقت الحقيقي. من خلال الاستغناء عن الحاجة إلى الكبح غير الأقصىNMS وتحسين مكونات النموذج لتحقيق الكفاءة، يحقق YOLOv10 سرعة ودقة فائقة مع انخفاض كبير في النفقات الحسابية.

التفاصيل الفنية:
المؤلفون: Ao Wang, Hui Chen, Lihao Liu, et al.
منظمة جامعة تسينغهوا
التاريخ: 2024-05-23
Arxiv:https://arxiv.org/abs/2405.14458
GitHub:https://github.com/THU-MIG/yolov10
Docsultralytics

الهندسة المعمارية والابتكار

يركّز YOLOv10 على تصميم نموذج شامل قائم على الكفاءة والدقة، ويتناول كلاً من البنية وخط أنابيب ما بعد المعالجة.

  • التدريبNMS: الميزة الأكثر ريادة هي استخدام التعيينات المزدوجة المتسقة. تسمح هذه الاستراتيجية بتدريب النموذج بإشارات إشرافية غنية مع تمكين المطابقة الفردية أثناء الاستدلال. وهذا يلغي الحاجة إلى NMS النماذج، وهو عنق الزجاجة الشائع في النشر.
  • تصميم نموذج شامل: يستخدم YOLOv10 رؤوس تصنيف خفيفة الوزن، وتقليل الفصل بين القنوات المكانية وتصميم الكتلة الموجهة بالترتيب. تقلل هذه التحسينات من التكرار الحسابي واستخدام الذاكرة دون التضحية بالأداء.
  • التلافيف ذات النواة الكبيرة: تستخدم البنية بشكل انتقائي التلافيف ذات النواة الكبيرة ذات العمق الكبير لتوسيع المجال الاستقبالي مما يعزز اكتشاف الأجسام الصغيرة.

نقاط القوة والفوائد

نقاط القوة:

  • كفاءة على أحدث طراز: يوفر YOLOv10 مفاضلة لا مثيل لها بين السرعة والدقة. يقلل التصميم NMS من زمن الاستجابة من طرف إلى طرف بشكل كبير.
  • كفاءة المعلمات: يحقق دقة أعلى مع عدد أقل من المعلمات مقارنةً بالأجيال السابقة، مما يجعله مثاليًا لأجهزة الذكاء الاصطناعي الحافة مثل Raspberry Pi.
  • تكاملUltralytics : كونه جزءًا من نظام Ultralytics البيئي يضمن سهولة استخدامه وتوثيقه بشكل جيد ودعمه لتنسيقات التصدير المختلفة مثل ONNX و TensorRT.

اعرف المزيد عن YOLOv10

تحليل الأداء

يقارن الجدول التالي بين أداء YOLOX و YOLOv10 على مجموعة بياناتCOCO القياسية. تسلط المقاييس الضوء على التحسينات الكبيرة في كفاءة النموذج الأحدث.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

التحليل: توضح البيانات بوضوح تفوق YOLOv10 في الكفاءة. على سبيل المثال، يُحقق YOLOv10 mAP أعلى بكثير في mAP بنسبة 46.7% مقارنةً بـ YOLOV10-s (40.5%)، مع استخدام عدد أقل من المعلمات (7.2 مليون مقابل 9.0 مليون). والجدير بالذكر أن YOLOv10 يتفوق على YOLOv10-x في الدقة (54.4% مقابل 51.1%) بينما يكون أسرع بكثير (12.2 مللي ثانية مقابل 16.1 مللي ثانية) ويتطلب نصف المعلمات تقريبًا (56.9 مليون مقابل 99.1 مليون). هذه الكفاءة تجعل YOLOv10 خيارًا أفضل بكثير لأنظمة الوقت الحقيقي.

نظرة على الكفاءة

ويعني إلغاء YOLOv10 للمعالجة اللاحقة NMS أن أوقات الاستدلال أكثر استقراراً ويمكن التنبؤ بها، وهو عامل حاسم للتطبيقات ذات الأهمية الحرجة للسلامة مثل المركبات ذاتية القيادة والروبوتات الصناعية.

منهجيات التدريب والنظام البيئي

بينما قدم YOLOX تقنيات التعزيز المتقدمة التي أصبحت الآن قياسية، يستفيد YOLOv10 من خط أنابيب تدريب Ultralytics الناضج وسهل الاستخدام.

  • سهولة الاستخدام: تشتهر نماذج Ultralytics بواجهة برمجة تطبيقاتPython المبسطة. لا يتطلب تدريب نموذج YOLOv10 سوى بضعة أسطر من التعليمات البرمجية، في حين أن استخدام YOLOX غالبًا ما يتضمن ملفات تكوين أكثر تعقيدًا وإدارة التبعية.
  • نظام بيئي جيد الصيانة: تم دمج YOLOv10 بالكامل في إطار عمل Ultralytics . يتيح ذلك للمستخدمين الوصول إلى ميزات مثل الضبط التلقائي للمقياس التشعبي وإدارة مجموعة البيانات بسلاسة عبر مستكشفUltralytics وخيارات النشر المتنوعة.
  • كفاءة الذاكرة: تضمن تحسينات Ultralytics أن النماذج مثل YOLOv10 تستهلك ذاكرة CUDA أقل أثناء التدريب مقارنةً بالبنى القديمة أو نماذج المحولات الثقيلة، مما يسمح بأحجام دفعات أكبر على وحدات معالجة الرسومات الاستهلاكية.

مثال على الكود: استخدام YOLOv10

يوضّح المثال التالي مدى سهولة تحميل المطورين لنموذج YOLOv10 المدرّب مسبقًا وتشغيل الاستدلال على صورة باستخدام مكتبة Ultralytics .

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Run inference on a local image
results = model("path/to/image.jpg")

# Display the results
results[0].show()

حالات الاستخدام المثالية

كلا الطرازين له مكانته، ولكن بنية YOLOv10 الحديثة تجعله مناسبًا لمجموعة واسعة من التطبيقات المعاصرة.

  • حافة الذكاء الاصطناعي وإنترنت الأشياء: إن انخفاض عدد معلمات YOLOv10 وسرعته العالية يجعلانه مثاليًا للنشر على الأجهزة ذات الحوسبة المحدودة، مثل NVIDIA Jetson أو الكاميرات الذكية.
  • التصنيع عالي السرعة: في الفحص الصناعي، حيث تتحرك السيور الناقلة بسرعة، يضمن الاستدلال NMS الأجسام في YOLOv10 أن يواكب اكتشاف الأجسام خطوط الإنتاج دون حدوث اختناقات.
  • المراقبة والأمن: بالنسبة لتحليل تدفقات الفيديو المتعددة في وقت واحد، تسمح الكفاءة الحسابية لـ YOLOv10 بكثافة أعلى من التدفقات لكل خادم مقارنةً بـ YOLOX.
  • خطوط الأساس البحثية: لا يزال YOLOX خط أساس قيّم للباحثين الذين يدرسون تطور أجهزة الكشف الخالية من الارتكاز وطرق التعيين الأمثل للنقل.

الخلاصة

بينما لعبت YOLOX دورًا محوريًا في تعميم الكشف الخالي من المراسي, YOLOv10 يبرز كخيار متفوق للتطوير الحديث. حيث توفر بنيته المبتكرة NMS جنبًا إلى جنب مع نظام Ultralytics البيئي الشامل، حلاً قويًا أسرع وأكثر دقة.

بالنسبة للمطورين الذين يبحثون عن أفضل توازن في الأداء وسهولة الاستخدام والدعم طويل الأمد، يوصى بشدة باستخدام YOLOv10 . بالإضافة إلى ذلك، بالنسبة لأولئك الذين يحتاجون إلى المزيد من التنوع في مهام مثل تقدير الوضعية أو تجزئة المثيل، فإن YOLO11 القوي كبديل ممتاز ضمن نفس الإطار سهل الاستخدام.

باختيارك لنماذج Ultralytics فإنك تضمن أن مشاريعك مبنية على أساس من الأبحاث المتطورة والدعم المجتمعي النشط والموثوقية الجاهزة للإنتاج.


تعليقات