YOLOv6-3.0 ضد EfficientDet: الموازنة بين السرعة والدقة في الكشف عن الكائنات
في المشهد المتطور بسرعة لرؤية الحاسوب، يعد اختيار بنية اكتشاف الكائنات الصحيحة أمرًا بالغ الأهمية لنجاح مشروعك. تتعمق هذه المقارنة في YOLOv6-3.0 و EfficientDet، وهما نموذجان بارزان يتعاملان مع تحدي التعرف البصري من زوايا مختلفة. في حين تركز EfficientDet على كفاءة المعلمات وقابلية التوسع، فإن YOLOv6-3.0 مصمم خصيصًا للتطبيقات الصناعية حيث يكون زمن انتقال الاستدلال والسرعة في الوقت الفعلي غير قابلين للتفاوض.
مقاييس الأداء والتحليل الفني
يكمن الاختلاف الأساسي بين هذين الهيكلين في فلسفة تصميمهما. يعتمد EfficientDet على آلية متطورة لدمج الميزات تُعرف باسم BiFPN، والتي تعمل على تحسين الدقة ولكن غالبًا ما يكون ذلك على حساب السرعة الحسابية على وحدات معالجة الرسوميات (GPU). وعلى العكس من ذلك، يتبنى YOLOv6-3.0 تصميمًا مدركًا للأجهزة، ويستخدم إعادة المعلمات لتبسيط العمليات أثناء الاستدلال، مما يؤدي إلى FPS (إطارات في الثانية) أعلى بشكل ملحوظ.
يوضح الجدول أدناه هذه المفاضلة. في حين أن EfficientDet-d7 يحقق معدل mAP عاليًا، إلا أن زمن الوصول كبير. في المقابل، يقدم YOLOv6-3.0l دقة مماثلة مع أوقات استدلال مخفضة بشكل كبير، مما يجعله أكثر ملاءمة لسيناريوهات الاستدلال في الوقت الفعلي.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
تحسين الأداء
بالنسبة لعمليات النشر الصناعية، يمكن أن يؤدي الجمع بين YOLOv6-3.0 و TensorRT إلى تحسينات كبيرة في السرعة. تسمح البساطة المعمارية لـ YOLOv6 برسم خرائط بكفاءة عالية جدًا لتعليمات أجهزة GPU مقارنة بشبكات هرم الميزات المعقدة الموجودة في النماذج القديمة.
YOLOv6-3.0: مصمم للصناعة
إن YOLOv6-3.0 عبارة عن كاشف للأجسام من مرحلة واحدة مصمم لسد الفجوة بين البحث الأكاديمي والمتطلبات الصناعية. إنه يعطي الأولوية للسرعة دون التضحية بالدقة اللازمة لمهام مثل فحص الجودة.
المؤلفون: تشوي لي، لولو لي، ييفي جينغ، هونغليانغ جيانغ، مينغ تشنغ، بو تشانغ، زيدان كه، شياومينغ شو، و شيانغشيانغ تشو
المنظمة:Meituan
التاريخ: 2023-01-13
Arxiv:YOLOv6 v3.0: إعادة تحميل كاملة النطاق
GitHub:meituan/YOLOv6
المستندات:توثيق YOLOv6
الهيكلة ونقاط القوة
يكمن جوهر YOLOv6-3.0 في العمود الفقري الفعال وتصميم "RepOpt". من خلال استخدام إعادة المعلمات، يفصل النموذج هياكل الفروع المتعددة في وقت التدريب عن هياكل الفرع الواحد في وقت الاستدلال. ينتج عن هذا نموذج سهل التدريب مع تدرجات غنية ولكنه سريع التنفيذ للغاية.
- التقطير الذاتي: تستخدم استراتيجية التدريب التقطير الذاتي، حيث يعمل تنبؤ النموذج نفسه كعلامة ناعمة لتوجيه التعلم، مما يعزز الدقة دون بيانات إضافية.
- Quantization Support: تم تصميمه مع الأخذ في الاعتبار تكميم النموذج، مما يقلل من انخفاضات الدقة عند التحويل إلى INT8 للنشر على الحافة.
- التركيز الصناعي: مثالي للذكاء الاصطناعي في التصنيع والروبوتات حيث تُحتسب زمن الوصول بالمللي ثانية.
تعرف على المزيد حول YOLOv6-3.0
EfficientDet: دقة قابلة للتطوير
أحدثت EfficientDet ثورة في هذا المجال من خلال تقديم مفهوم التوسع المركب لاكتشاف الأجسام. إنها تعمل على تحسين عمق الشبكة وعرضها ودقتها في وقت واحد لتحقيق أداء ممتاز لكل معلمة.
المؤلفون: مينغشينغ تان، رومينغ بانغ، و كوك ف. لي
المنظمة:Google
التاريخ: 2019-11-20
Arxiv:EfficientDet: اكتشاف الكائنات القابل للتطوير والفعال
GitHub:google/automl/efficientdet
الهيكلة ونقاط القوة
تعتمد EfficientDet على EfficientNet backbone وتقدم شبكة Bi-directional Feature Pyramid Network (BiFPN). يسمح هيكل العنق المعقد هذا بدمج الميزات متعددة المقاييس بسهولة وسرعة.
- BiFPN: على عكس شبكات FPN التقليدية، تسمح BiFPN بتدفق المعلومات من أعلى إلى أسفل ومن أسفل إلى أعلى، وتطبيق الأوزان على ميزات الإدخال المختلفة للتأكيد على أهميتها.
- التحجيم المركب: يسمح معامل بسيط $\phi$ للمستخدمين بتوسيع نطاق النموذج (من d0 إلى d7) اعتمادًا على الموارد المتاحة، مما يوفر منحنى دقة-حساب يمكن التنبؤ به.
- كفاءة المعلمات: المتغيرات الأصغر (d0-d2) خفيفة الوزن للغاية من حيث حجم القرص و FLOPs، مما يجعلها مفيدة للبيئات المقيدة بالتخزين.
التعقيد المعماري
في حين أن BiFPN فعال للغاية لتحقيق الدقة، إلا أن أنماط الوصول غير المنتظمة للذاكرة يمكن أن تجعله أبطأ على وحدات معالجة الرسوميات (GPUs) مقارنة بكتل الالتفاف الكثيفة والمنتظمة المستخدمة في بنى YOLO. هذا هو السبب في أن EfficientDet غالبًا ما يتم قياسه بزمن وصول الاستدلال أعلى على الرغم من وجود عدد أقل من المعلمات.
تعرف على المزيد حول EfficientDet
حالات الاستخدام في العالم الحقيقي
غالبًا ما يعتمد الاختيار بين هذه النماذج على القيود المحددة لبيئة النشر.
السيناريوهات المثالية لـ YOLOv6-3.0
- تصنيع عالي السرعة: اكتشاف العيوب على أحزمة النقل سريعة الحركة حيث يلزم FPS عالي لتتبع كل عنصر.
- الملاحة الذاتية: تمكين الروبوتات من التنقل في البيئات الديناميكية عن طريق معالجة مقاطع الفيديو في الوقت الفعلي.
- الحوسبة الطرفية: النشر على أجهزة مثل NVIDIA Jetson حيث يجب زيادة موارد GPU إلى أقصى حد لتحقيق الإنتاجية.
السيناريوهات المثالية لـ EfficientDet
- التحليل الطبي: تحليل الصور الثابتة عالية الدقة، مثل detect الأورام في الأشعة السينية، حيث يكون وقت المعالجة أقل أهمية من الدقة.
- الاستشعار عن بعد: معالجة صور الأقمار الصناعية في وضع عدم الاتصال لتحديد التغيرات البيئية أو التنمية الحضرية.
- إنترنت الأشياء منخفض التخزين: الأجهزة ذات سعة التخزين المحدودة للغاية التي تتطلب حجم ملف نموذج صغير (مثل EfficientDet-d0).
ميزة Ultralytics: لماذا تختار YOLO11؟
في حين أن YOLOv6-3.0 و EfficientDet هما نموذجان قادران، فإن Ultralytics YOLO11 يمثل أحدث ما توصلت إليه تكنولوجيا رؤية الكمبيوتر. تعمل YOLO11 على تحسين أفضل سمات أجيال YOLO السابقة ودمجها في نظام بيئي سلس وسهل الاستخدام.
المزايا الرئيسية لـ YOLO11
- سهولة الاستخدام: تعطي Ultralytics الأولوية لتجربة المطور. باستخدام Pythonic API، يمكنك تدريب النماذج والتحقق من صحتها ونشرها ببضعة أسطر فقط من التعليمات البرمجية، على عكس ملفات التكوين المعقدة المطلوبة غالبًا لـ EfficientDet.
- تعدد الاستخدامات: على عكس YOLOv6 و EfficientDet اللذين يعتبران في الأساس نموذجين لـ object detection، يدعم YOLO11 أصلاً مهام متعددة بما في ذلك instance segmentation و pose estimation و oriented bounding boxes (OBB) و classification.
- موازنة الأداء: يحقق YOLO11 توازنًا حديثًا بين السرعة والدقة. إنه يتفوق باستمرار على البنى القديمة على مجموعة بيانات COCO مع الحفاظ على زمن انتقال منخفض.
- نظام بيئي مُدار بشكل جيد: يتم دعم نماذج Ultralytics من قبل مجتمع نشط وتحديثات متكررة. يمكنك الوصول إلى وثائق شاملة وبرامج تعليمية وعمليات تكامل سلسة مع أدوات مثل Ultralytics HUB للتدريب السحابي وإدارة مجموعات البيانات.
- كفاءة التدريب: تم تصميم YOLO11 ليكون فعالاً من حيث الموارد أثناء التدريب، وغالبًا ما يتقارب بشكل أسرع ويتطلب ذاكرة GPU أقل من النماذج المعقدة القائمة على المحولات أو البنى القديمة.
from ultralytics import YOLO
# Load the YOLO11 model (recommended over older versions)
model = YOLO("yolo11n.pt")
# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display results
results[0].show()
استكشف نماذج أخرى
إذا كنت تقوم بتقييم خيارات خط أنابيب رؤية الكمبيوتر الخاص بك، ففكر في استكشاف نماذج أخرى في كتالوج Ultralytics. يوفر YOLOv8 أداءً قويًا لمجموعة واسعة من المهام، بينما يوفر RT-DETR القائم على المحولات بديلاً للسيناريوهات التي تتطلب وعيًا بالسياق العالمي. بالنسبة للتطبيقات الخاصة بالهاتف المحمول، يجدر أيضًا التحقق من YOLOv10. يمكن أن تساعد مقارنة هذه النماذج بـ EfficientDet في تحسين اختيارك لمتطلبات الأجهزة والدقة المحددة.