تخطي إلى المحتوى

YOLOv7 ضد YOLOX: مقارنة فنية تفصيلية

في المشهد المتطور بسرعة لرؤية الحاسوب، وضعت عائلة نماذج YOLO (أنت تنظر مرة واحدة فقط) باستمرار معيارًا لاكتشاف الكائنات في الوقت الفعلي. هناك معلمَان مهمان في هذا التاريخ هما YOLOv7 و YOLOX. في حين أن كلا النموذجين يهدفان إلى تحقيق التوازن بين السرعة والدقة، إلا أنهما يختلفان اختلافًا كبيرًا في فلسفاتهما المعمارية - وتحديدًا فيما يتعلق بالمنهجيات القائمة على المرساة مقابل المنهجيات الخالية من المرساة.

يقدم هذا الدليل مقارنة فنية متعمقة لمساعدة الباحثين والمهندسين على اختيار الأداة المناسبة لتطبيقات الرؤية الحاسوبية الخاصة بهم. سنقوم بتحليل بنياتها وأداء المعايير واستكشاف سبب تقديم البدائل الحديثة مثل Ultralytics YOLO11 في كثير من الأحيان تجربة مطور فائقة.

مقاييس الأداء: السرعة والدقة

عند تقييم أدوات الكشف عن الكائنات، فإن المفاضلة بين زمن انتقال الاستدلال ومتوسط الدقة (mAP) له أهمية قصوى. يقدم الجدول أدناه مقارنة مباشرة بين متغيرات YOLOv7 و YOLOX على مجموعة بيانات COCO.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

تحليل النتائج

تُظهر البيانات مزايا واضحة لكل عائلة نماذج اعتمادًا على قيود النشر. يُظهر YOLOv7 كفاءة استثنائية في الفئة عالية الأداء. على سبيل المثال، يحقق YOLOv7l قيمة 51.4% mAP مع 36.9 مليون معامل فقط، متفوقًا على YOLOXx (51.1% mAP، 99.1 مليون معامل) مع استخدام موارد حسابية أقل بكثير. هذا يجعل YOLOv7 مرشحًا قويًا للسيناريوهات التي تكون فيها كفاءة وحدة معالجة الرسومات (GPU) أمرًا بالغ الأهمية ولكن الذاكرة محدودة.

على العكس من ذلك، يتألق YOLOX في فئة الوزن الخفيف. يقدم نموذج YOLOX-Nano (0.91 مليون معلمة) حلاً قابلاً للتطبيق للأجهزة الطرفية منخفضة الطاقة للغاية حيث قد تكون حتى أصغر نماذج YOLO القياسية ثقيلة جدًا. تسمح مضاعفات عمق العرض القابلة للتطوير بضبط دقيق عبر مجموعة واسعة من ملفات تعريف الأجهزة.

YOLOv7: حقيبة التحسينات المجانية المحسّنة

قدم YOLOv7، الذي تم إصداره في يوليو 2022، العديد من الابتكارات المعمارية المصممة لتحسين عملية التدريب دون تكبد تكاليف الاستدلال.

  • المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
  • المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
  • التاريخ: 2022-07-06
  • ورقة بحثية:رابط Arxiv
  • GitHub:YOLOv7 Repository

تعرف على المزيد حول YOLOv7

أبرز الملامح المعمارية

يركز YOLOv7 على "حقيبة التدريب المجانية" - طرق التحسين التي تحسن الدقة أثناء التدريب ولكن يتم إزالتها أو دمجها أثناء الاستدلال. تشمل الميزات الرئيسية ما يلي:

  1. E-ELAN (شبكة تجميع الطبقات الفعالة الممتدة): هيكل أساسي مُحسَّن يعزز قدرة النموذج على تعلم الميزات المتنوعة عن طريق التحكم في أقصر وأطول مسارات التدرج.
  2. توسيع النموذج: بدلاً من مجرد توسيع العمق أو العرض، يستخدم YOLOv7 طريقة توسيع مركبة للنماذج القائمة على التسلسل، مع الحفاظ على الهيكل الأمثل أثناء التوسيع.
  3. رأس إضافي من التقريبي إلى الدقيق: يتم استخدام رأس خسارة إضافي أثناء التدريب للمساعدة في الإشراف، والذي يتم إعادة تحديده بعد ذلك في الرأس الرئيسي للاستدلال.

إعادة المعلمات

يستخدم YOLOv7 إعادة تحديد المعلمات المخطط لها، حيث يتم دمج وحدات التدريب المتميزة رياضيًا في طبقة التفافية واحدة للاستدلال. هذا يقلل من زمن انتقال الاستدلال بشكل كبير دون التضحية بقدرة تعلم الميزات المكتسبة أثناء التدريب.

YOLOX: تطور خالٍ من الـ Anchor

يمثل YOLOX، الذي تم إصداره في عام 2021، تحولًا في نموذج YOLO من خلال الابتعاد عن مربعات المرساة نحو آلية خالية من المرساة، على غرار مناهج تقسيم الدلالات.

  • المؤلفون: تشنغ قه، سونغتاو ليو، فنغ وانغ، زيمينغ لي، وجيان صن
  • المنظمة: Megvii
  • التاريخ: 2021-07-18
  • ورقة بحثية:رابط Arxiv
  • GitHub:YOLOX Repository

تعرف على المزيد حول مقارنة YOLOX

أبرز الملامح المعمارية

قامت YOLOX بتبسيط مسار الاكتشاف عن طريق إزالة الحاجة إلى الضبط اليدوي لمربع المرساة، والذي كان يمثل نقطة ضعف شائعة في الإصدارات السابقة مثل YOLOv4 و YOLOv5.

  1. آلية خالية من المرتكزات (Anchor-Free Mechanism): من خلال التنبؤ بمركز الكائنات مباشرةً، يلغي YOLOX المعلمات الفائقة المعقدة المرتبطة بالمرتكزات، مما يحسن التعميم على مجموعات البيانات المتنوعة.
  2. رأس غير مقترن: على عكس إصدارات YOLO السابقة التي جمعت بين التصنيف والتوطين في رأس واحد، يفصل YOLOX بينهما. هذا يؤدي إلى تقارب أسرع ودقة أفضل.
  3. SimOTA: استراتيجية متقدمة لتعيين التسميات تقوم بتعيين عينات إيجابية ديناميكيًا للحقيقة الأرضية بأقل تكلفة، مما يوازن بين خسائر التصنيف والانحدار بفعالية.

لماذا نماذج Ultralytics هي الخيار المفضل

في حين أن YOLOv7 و YOLOX يختلفان في البنية، إلا أن كلاهما يتجاوزان في سهولة الاستخدام ودعم النظام البيئي من خلال نماذج Ultralytics YOLO الحديثة. بالنسبة للمطورين الذين يبحثون عن حل قوي ومقاوم للمستقبل، فإن الانتقال إلى YOLO11 يوفر مزايا واضحة.

1. نظام بيئي موحد وسهولة الاستخدام

غالبًا ما تتطلب YOLOv7 و YOLOX استنساخ مستودعات GitHub محددة وإدارة متطلبات التبعية المعقدة واستخدام تنسيقات متباينة للبيانات. في المقابل، تقدم Ultralytics حزمة قابلة للتثبيت عبر pip توحد جميع المهام.

from ultralytics import YOLO

# Load a model (YOLO11n recommended for speed)
model = YOLO("yolo11n.pt")

# Train on a custom dataset with a single line
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

2. توازن الأداء المتفوق

كما هو موضح في المعايير، تحقق نماذج Ultralytics الحديثة توازنًا أفضل بين السرعة والدقة. تستخدم YOLO11 بنية مُحسَّنة خالية من المرساة تتعلم من التطورات في كل من YOLOX (تصميم خالٍ من المرساة) و YOLOv7 (تحسين مسار التدرج). ينتج عن هذا نماذج ليست أسرع فقط على استدلال وحدة المعالجة المركزية (CPU) ولكنها تتطلب أيضًا ذاكرة CUDA أقل أثناء التدريب، مما يجعلها في متناول مجموعة واسعة من الأجهزة.

3. تعدد الاستخدامات عبر المهام

تم تصميم YOLOv7 و YOLOX بشكل أساسي لاكتشاف الكائنات. تعمل نماذج Ultralytics على توسيع هذه الإمكانية أصلاً لتشمل مجموعة من مهام رؤية الكمبيوتر دون تغيير واجهة برمجة التطبيقات:

4. نشر سلس وعمليات تعلم الآلة (MLOps)

يعد نقل نموذج من البحث إلى الإنتاج أمرًا صعبًا باستخدام الأطر القديمة. يشتمل نظام Ultralytics البيئي على أوضاع تصدير مدمجة لـ ONNX و TensorRT و CoreML و OpenVINO، مما يبسط نشر النموذج. علاوة على ذلك، تتيح عمليات التكامل مع Ultralytics HUB إدارة مجموعات البيانات المستندة إلى الويب والتدريب عن بُعد والنشر بنقرة واحدة على الأجهزة الطرفية.

تعرف على المزيد حول YOLO11

الخلاصة

قدم كل من YOLOv7 و YOLOX مساهمات كبيرة في مجال رؤية الكمبيوتر. قام YOLOv7 بتحسين البنية لتحقيق ذروة الأداء على أجهزة GPU، مما يزيد من كفاءة نهج "حقيبة الهدايا المجانية". نجح YOLOX في إثبات جدوى الكشف الخالي من المرساة، وتبسيط خط الأنابيب وتحسين التعميم.

ومع ذلك، بالنسبة لسير عمل التطوير الحديث، يبرز Ultralytics YOLO11 باعتباره الخيار الأفضل. فهو يجمع بين نقاط القوة المعمارية لأسلافه مع Python API لا مثيل له، ومتطلبات ذاكرة أقل، ودعم لمجموعة شاملة من مهام الرؤية. سواء كنت تقوم بالنشر على جهاز طرفي أو خادم سحابي، فإن المجتمع النشط والوثائق الشاملة للنظام البيئي Ultralytics تضمن مسارًا أكثر سلاسة للوصول إلى مرحلة الإنتاج.

استكشف نماذج أخرى

إذا كنت مهتمًا بإجراء المزيد من المقارنات التقنية، فاستكشف هذه الموارد:


تعليقات