تخطي إلى المحتوى

YOLOX مقابل YOLOv6 مقابل YOLOv6.0: مقارنة تقنية

يعد اختيار البنية الصحيحة للكشف عن الأجسام قرارًا حاسمًا للمطورين والباحثين الذين يهدفون إلى تحقيق التوازن بين الأداء والسرعة والكفاءة الحسابية. تستكشف هذه المقارنة الشاملة الفروق الفنية بين YOLOX، وهو كاشف عالي الأداء خالٍ من الارتكاز من Megvii، و YOLOv6.0، وهو إطار عمل من الدرجة الصناعية طورته شركة Meituan. من خلال تحليل بنيتيهما ومعاييرهما ومنهجيات التدريب الخاصة بهما، نهدف إلى إرشادك نحو أفضل نموذج لتطبيقات الرؤية الحاسوبية الخاصة بك.

يولوكس: الربط بين البحث العلمي والصناعة

المؤلفون: Zheng Ge، وSongtao Liu، وFeng Wang، وZeming Li، وJian Sun
المنظمة:Megvii
التاريخ: 2021-07-18
Arxiv:https://arxiv.org/abs/2107.08430
GitHub:https://github.com/Megvii-BaseDetection/YOLOX
Docs:https://yolox.readthedocs.io/en/latest/

يمثل YOLOX، الذي صدر في عام 2021، تحولاً كبيراً في سلالة YOLO من خلال اعتماد آلية خالية من المراسي ودمج تقنيات الكشف المتقدمة التي كانت مخصصة سابقاً للأبحاث الأكاديمية. من خلال إزالة الاعتماد على مربعات الارتكاز المحددة مسبقًا، سهّل YOLOX عملية التدريب وحسّن التعميم عبر مختلف أشكال الأجسام.

البنية والميزات الرئيسية

يتميز YOLOX ببنية "الرأس المنفصل". على عكس نماذج YOLO التقليدية التي تجمع بين مهمتي التصنيف والتوطين في فرع واحد، يفصل YOLOX بينهما، مما يحسن بشكل كبير من سرعة التقارب والدقة. كما أنه يستخدم استراتيجية تعيين التسمية SimOTA (تعيين النقل الأمثل المبسط)، والتي تقوم بتعيين عينات إيجابية ديناميكيًا لعناصر الحقيقة الأرضية، مما يقلل من عدم استقرار التدريب.

تصميم خالي من المراسي

يُلغي YOLOX الحاجة إلى تجميع صندوق الارتكاز يدويًا، وهي خطوة شائعة في إصدارات YOLO السابقة. يقلل هذا من عدد المعلمات الفائقة الإرشادية وخيارات التصميم المتضمنة في التدريب، مما يجعل النموذج أكثر قوة في مجموعات البيانات المتنوعة دون الحاجة إلى ضبط مكثف.

نقاط القوة والضعف

نقاط القوة:

  • دقة عالية: يسمح الرأس المنفصل والتعيين المتقدم للتسميات لـ YOLOX بتحقيق متوسط دقة تنافسي (mAP) ، خاصةً على مجموعة بياناتCOCO .
  • مرونة البحث: تصميمها المبسط يجعلها أساسًا ممتازًا للباحثين الذين يقومون بتجربة رؤوس كشف جديدة أو استراتيجيات تعيين جديدة.
  • اكتشاف الأجسام الصغيرة: يمكن أن يوفر النهج الخالي من المرساة في بعض الأحيان أداءً أفضل على الأجسام الصغيرة مقارنةً بالأنظمة القائمة على المرساة الصلبة.

نقاط الضعف:

  • زمن انتقال الاستدلال: على الرغم من دقته، فإن الرأس المنفصل يقدم نفقات حسابية زائدة طفيفة، مما يؤدي غالبًا إلى سرعات استدلال أبطأ مقارنةً بالنماذج الصناعية المحسّنة بالكامل مثل YOLOv6.
  • نضج النظام الإيكولوجي: في حين أن الكود مفتوح المصدر، فإن النظام البيئي لأدوات الطرف الثالث، وأدلة النشر، ودعم المجتمع أصغر من النظام البيئي لأدوات Ultralytics YOLOv8 أو YOLOv5.

حالات الاستخدام المثالية

يعد YOLOX مناسبًا بشكل خاص للأبحاث الأكاديمية والسيناريوهات التي تكون فيها الأولوية للدقة على سرعة الاستدلال الأولية.

  • التصوير الطبي: تحليل الهياكل المعقدة في تحليل الصور الطبية حيث تكون الدقة أمرًا بالغ الأهمية.
  • اكتشاف العيوب: تحديد الحالات الشاذة الخفية في التصنيع حيث تكون عمليات الكشف عن العيوب غير المُكتشفة مكلفة.
  • التجريب الأكاديمي: العمل كخط أساس نظيف وخالٍ من المراسي لتطوير خوارزميات رؤية حاسوبية جديدة.

تعرف على المزيد حول YOLOX

YOLOv6.0: مصمم هندسيًا للسرعة الصناعية

المؤلفون: Chuyi Li وLulu Li وYifei Geng وHongliang Jiang وMeng Cheng وBo Zhang وZaidan Ke وXiaoming Xu وXiangxiang Chu
المنظمة:Meituan
التاريخ: 2023-01-13
Arxiv:https://arxiv.org/abs/2301.05586
GitHubYOLOv6
Docsultralytics

YOLOv6.0 هو كاشف أجسام مصمم خصيصًا للتطبيقات الصناعية في العالم الحقيقي. أدخل التحديث "3.0"، المعروف باسم "إعادة التحميل على نطاق كامل"، تحسينات معمارية كبيرة لزيادة الإنتاجية على أجهزة مثل وحدات معالجة الرسومات NVIDIA .

البنية والميزات الرئيسية

إن جوهر YOLOv6.0 هو استخدامه المكثف لإعادة المعلمات. ويستخدم النموذج العمود الفقري EfficientRepbone والعنق Rep-PAN، مما يسمح للشبكة بأن يكون لها هياكل معقدة متعددة التفرعات أثناء التدريب ولكنها تنهار إلى هياكل بسيطة أحادية المسار أثناء الاستدلال. ويضمن هذا النهج "على غرار RepVGG" قدرة عالية على استخراج الميزات دون عقوبة زمن التشغيل للتفرع المعقد.

وبالإضافة إلى ذلك، يستخدم YOLOv6.0 التدريب بمساعدة المرساة (AAT)، الذي يجمع بين مزايا النموذجين القائم على المرساة والخالي من المرساة لتحقيق الاستقرار في التدريب وتسريع التقارب.

نقاط القوة والضعف

نقاط القوة:

  • سرعة استثنائية: مُحسَّن لـ TensorRT، يوفر YOLOv6.0 زمن انتقال منخفض للغاية، مما يجعله مثاليًا للتطبيقات عالية الإطارات في الثانية.
  • جاهز للنشر: ميزات مثل دعم تكميم النماذج تسهّل النشر الأسهل على الأجهزة الطرفية والخوادم.
  • الكفاءة: توفر تقنية إعادة المقاييس توازناً ممتازاً بين وحدات FLOP والدقة.

نقاط الضعف:

  • كثافة موارد التدريب: يمكن أن تتطلب بنية وقت التدريب المعقدة (قبل إعادة المعلمة) ذاكرة كبيرة GPU مقارنةً بالنماذج الأبسط.
  • نطاق المهام المحدود: يركز YOLOv6 بشكل أساسي على الاكتشاف. فهو يفتقر إلى الدعم الأصلي والمتكامل للمهام الأخرى مثل تقدير الوضعية أو المربعات المحددة الموجهة (OBB) ضمن نفس واجهة برمجة التطبيقات السلسة الموجودة في عروض Ultralytics .

حالات الاستخدام المثالية

يتألق YOLOv6.0 في البيئات التي تكون فيها سرعة الاستدلال في الوقت الحقيقي مطلبًا صارمًا.

  • الروبوتات المستقلة: تمكين الروبوتات من التنقل والتفاعل مع البيئات الديناميكية على الفور.
  • فحص خط الإنتاج: فحص الجودة عالي السرعة على أحزمة التصنيع حيث لا يمكن المساس بالإنتاجية.
  • تحليلات الفيديو: معالجة تدفقات فيديو متعددة في وقت واحد لأنظمة الإنذار الأمني.

اعرف المزيد عن YOLOv6

مقارنة أداء مباشرة

تكشف مقارنة مقاييس الأداء على مجموعة بياناتCOCO عن فلسفات تصميم متميزة. يقدم YOLOX بنية مبسطة ذات دقة محترمة، في حين أن YOLOv6.0 يدفع حدود سرعة الاستدلال من خلال التحسين الهيكلي.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0 م64050.0-5.2834.985.8
YOLOv6.0L64052.8-8.9559.6150.7

تسلط البيانات الضوء على أن YOLOv6.0n أسرع بكثير على أجهزة GPU (1.17 مللي ثانية مقابل 2.56 مللي ثانية لـ YOLOX) مع الحفاظ على معلمات mAP قوية. بالنسبة للأجهزة ذات الموارد المحدودة حيث يكون كل ميغابايت مهمًا، يظل YOLOXnano خيارًا مثيرًا للاهتمام مع معلمات أقل من 1 مليون، على الرغم من أن دقته أقل. في النهاية الأعلى، يتفوق YOLOv6.0l على YOLOXx في كل من الدقة (52.8 مقابل 51.1 mAP) والكفاءة، باستخدام معلمات أقل بنسبة 40% تقريبًا.

منهجيات التدريب والنظام البيئي

تختلف تجربة المستخدم في تدريب هذه النماذج بشكل كبير.

يعتمد YOLOX على تقنيات زيادة البيانات القوية مثل Mosaic و MixUp لتحقيق نتائجه دون أوزان مُدرَّبة مسبقًا. إن خط أنابيب التدريب الخاص به موجه نحو البحث، مما يوفر مرونة لمن هم على دراية عميقة بتكوينات PyTorch .

YOLOv6.0 التقطير الذاتي، حيث يقوم نموذج المعلم الأكبر بتوجيه نموذج الطالب أثناء التدريب، مما يعزز دقة النماذج الأصغر دون زيادة تكلفة الاستدلال. هذه المنهجية قوية ولكنها تضيف تعقيدًا إلى إعداد التدريب.

ومع ذلك، غالبًا ما يجد المطورون الذين يعطون الأولوية لسير العمل المبسط أن نظامUltralytics البيئي هو الأفضل. على عكس الأدوات المجزأة التي غالبًا ما توجد مع نماذج البحث المستقلة، توفر Ultralytics منصة موحدة.

  • سهولة الاستخدام: تسمح واجهة برمجة تطبيقات Python البسيطة بالتدريب والتحقق والاستدلال في بضعة أسطر من التعليمات البرمجية.
  • نظام بيئي جيد الصيانة: تضمن التحديثات المتكررة التوافق مع أحدث إصدارات PyTorch و CUDA وتنسيقات التصدير مثل ONNX و OpenVINO.
  • كفاءة التدريب: تم تحسين نماذج Ultralytics من أجل الاستخدام الفعال للذاكرة، وغالباً ما يتم تدريبها بشكل أسرع وبذاكرة GPU أقل من البنى المماثلة القائمة على المحولات.

سهولة استخدام Ultralytics

إن تدريب نموذج متطور باستخدام Ultralytics بسيط مثل:

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

الخاتمة: ميزة Ultralytics

بينما يقدم YOLOX تصميمًا مبتكرًا خاليًا من المراسي ومناسبًا للأبحاث، ويوفر YOLOv6.0 سرعة مذهلة لأجهزة صناعية محددة, Ultralytics YOLO11 يمثل ذروة تكنولوجيا الرؤية الحاسوبية الحالية.

YOLO11 و YOLO11 و YOLOv8 توفر توازناً فائقاً في الأداء، وتحقق أحدث نتائج mAP مع سرعات استدلالية رائعة عبر CPU GPU على حد سواء. على عكس المنافسين الذين يقتصرون في المقام الأول على الاكتشاف، تقدم نماذج Ultralytics تنوعًا لا مثيل له، حيث تدعم في الأصل

بالنسبة للمطورين الذين يبحثون عن حل مستقبلي مدعوم بالتطوير النشط والتوثيق الشامل والمجتمع المزدهر، تظل Ultralytics الخيار الموصى به لنقل المشاريع من مرحلة المفهوم إلى مرحلة الإنتاج.

لاستكشاف المزيد من المقارنات، يمكنك قراءة المزيد عن YOLOv5 مقابل YOLOv6 أو YOLO11 مقابل RT-DETR.


تعليقات