تخطي إلى المحتوى

EfficientDet مقابل YOLOv8: مقارنة تقنية بين عمالقة الكشف عن الأجسام

في المشهد سريع التطور للرؤية الحاسوبية، يعد اختيار البنية الصحيحة أمرًا محوريًا لنجاح المشروع. يقارن هذا التحليل بين نموذجين مؤثرين: EfficientDet، وهو معلم بحثي بارز من Google يركز على كفاءة المعلمات، و YOLOv8وهو نموذج متطور من Ultralytics مصمم للتطبيقات في الوقت الفعلي وسهولة الاستخدام.

بينما قدمت EfficientDet مفاهيم رائدة في توسيع نطاق النموذج، فإن البنى الأحدث مثل YOLOv8 والبنية المتطورة YOLO11 المتطورة التي أعادت منذ ذلك الحين تعريف معايير السرعة والدقة وتعدد الاستخدامات.

مقاييس الأداء: السرعة، والدقة، والكفاءة

عند اختيار نموذج للإنتاج، يجب على المطوّرين أن يوازنوا بين زمن الاستنتاج ودقة الكشف. يقدم الجدول أدناه مقارنة مباشرة لمقاييس الأداء على مجموعة بياناتCOCO .

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

تحليل البيانات

تسلط المقاييس الضوء على اختلاف واضح في فلسفة التصميم. يقلل EfficientDet من عمليات النقطة العائمة ( FLOPs )، والتي ترتبط تاريخيًا بالكفاءة النظرية. ومع ذلك، في سيناريوهات الاستدلال في الوقت الحقيقي العملية - خاصةً على وحدات معالجة الرسومات - يُظهر YOLOv8 8 ميزة كبيرة.

  • كمونGPU : YOLOv8n أسرع بحوالي 2.6 مرة من EfficientDet-d0 على GPU معالجة GPU T4 مع TensorRTعلى الرغم من وجود عمليات FLOP أعلى قليلاً. ويرجع ذلك إلى أن بنية YOLOv8 مُحسّنة لتوازي الأجهزة، في حين أن التلافيف القابلة للفصل من حيث العمق في EfficientDet يمكن أن تكون مرتبطة بالذاكرة على المسرعات.
  • الدقة على نطاق واسع: عند الحد الأعلى، يحقق YOLOv8x دقة فائقة في mAP تبلغ 53.9 مع سرعة استدلال تبلغ 14.37 مللي ثانية، متفوقًا بشكل كبير على EfficientDet-d7، الذي يتخلف بسرعة 128.07 مللي ثانية لدقة مماثلة.
  • حجم النموذج: يتطلب YOLOv8n معلمات أقل (3.2M) من أصغر طراز EfficientDet (3.9M)، مما يجعله عالي الكفاءة في التخزين للتطبيقات المحمولة.

الكفاءة مقابل الكمون

لا يعني انخفاض عدد العمليات الحسابية FLOP دائمًا التنفيذ السريع. إن EfficientDet مُحسَّن للغاية من حيث التكلفة الحسابية النظرية، ولكن YOLOv8 يستغل قدرات المعالجة المتوازية لوحدات معالجة الرسومات الحديثة (مثل NVIDIA T4/A100) بشكل أكثر فعالية، مما يؤدي إلى زمن انتقال أقل في العالم الحقيقي.

فلسفة العمارة والتصميم

يفسر فهم الفروق الدقيقة في الهندسة المعمارية الاختلافات في الأداء الملحوظة أعلاه.

تفاصيل EfficientDet

تم بناء EfficientDet على مبدأ التحجيم المركب، الذي يقيس دقة الشبكة وعمقها وعرضها بشكل موحد. وهو يستخدم العمود الفقري لشبكة EfficientNet ويقدم شبكة BiFPPN (شبكة هرم السمات ثنائية الاتجاه). تسمح شبكة BiFPPN بدمج الميزات المرجحة، وتعلم الميزات الأكثر أهمية. وعلى الرغم من أن هذا يؤدي إلى كفاءة عالية في المعاملات، إلا أن التوصيلات المعقدة غير المنتظمة لشبكة BiFPPN يمكن أن تكون مكلفة حسابيًا لتنفيذها على الأجهزة التي تفضل أنماط الوصول المنتظم إلى الذاكرة.

تعرف على المزيد حول EfficientDet

تفاصيل YOLOv8

  • المؤلفون: Glenn Jocher و Ayush Chaurasia و Jing Qiu
  • المنظمةUltralytics
  • التاريخ: كانون الثاني/يناير 2023
  • المستودع:Ultralytics GitHub

يمثّل YOLOv8 تحولًا إلى آلية كشف خالية من المرساة، مما يبسّط عملية التدريب من خلال إزالة الحاجة إلى حساب صندوق الارتكاز يدويًا. وهو يتميز بعمود فقري لشبكة CSPDarknet معدّل بوحدات C2f، مما يحسّن تدفق التدرج وثراء الميزات مقارنةً بالإصدارات السابقة. يستخدم الرأس هيكلًا منفصلًا، ويعالج مهام التصنيف والانحدار بشكل مستقل، ويستخدم تعيين المهام المتوائمة لتعيين التسمية الديناميكية. تم تصميم هذه البنية خصيصًا لزيادة الإنتاجية إلى أقصى حد على أجهزة GPU .

تعرف على المزيد حول YOLOv8

ميزة Ultralytics

في حين أن EfficientDet يعد إنجازًا أكاديميًا رائعًا، إلا أن نظام Ultralytics البيئي المحيط بـ YOLOv8 و YOLO11 يقدم مزايا ملموسة للمطورين الذين يركزون على تسليم المنتجات وعمليات التشغيل الآلي.

1. سهولة الاستخدام والتنفيذ

غالباً ما يتطلب تنفيذ EfficientDet التنقل بين ملفات التكوين المعقدة والتبعيات داخل نظام TensorFlow البيئي. في المقابل، تعطي نماذج Ultralytics الأولوية لتجربة المطورين. يمكن تحميل النموذج وتدريبه ونشره في بضعة أسطر من Python.

from ultralytics import YOLO

# Load a pre-trained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
detection = model("https://ultralytics.com/images/bus.jpg")

2. تعدد الاستخدامات عبر المهام

EfficientDet هو في المقام الأول بنية للكشف عن الكائنات. يتوسع Ultralytics YOLOv8 إلى ما هو أبعد من مجرد المربعات المحدودة البسيطة. ضمن نفس الإطار، يمكن للمستخدمين القيام بـ

3. التدريب وكفاءة الذاكرة

قد يستهلك تدريب المحولات الحديثة أو البنى المعقدة متعددة النطاقات موارد كثيرة. تشتهر نماذج Ultralytics YOLO بكفاءة ذاكرتها.

  • استخدام أقل لذاكرة التخزين الافتراضية: تسمح وحدات C2f الفعّالة ووظائف الخسارة المحسّنة ل YOLOv8 بالتدريب على وحدات معالجة الرسومات من فئة المستهلكين حيث قد تواجه النماذج الأخرى أخطاءً في الذاكرة (OOM).
  • التقارب السريع: تعمل تقنيات التعزيز المتقدمة مثل Mosaic على تسريع عملية التعلم، مما يقلل من عدد الحلقات اللازمة للوصول إلى دقة عالية.

النظام البيئي المتكامل

تتكامل نماذج Ultralytics بسلاسة مع أدوات مثل Weights & Biases, Cometو ClearML لتتبع التجارب، بالإضافة إلى Roboflow لإدارة مجموعة البيانات.

تطبيقات عملية في أرض الواقع

وغالباً ما يحدد الاختيار بين هذه النماذج جدوى النشر في بيئات محددة.

  • حالات استخدام EfficientDet: إن كفاءته العالية في المعلمات تجعله مثيرًا للاهتمام في البحث الأكاديمي حول قوانين التوسع أو الأنظمة القديمة CPU بشكل صارم حيث تكون وحدات FLOP هي القيد الصعب، على الرغم من أن زمن الاستجابة قد يظل أعلى من YOLOv8n.
  • حالات استخدام YOLOv8 :
    • الأنظمة المستقلة: تجعل FPS (الإطارات في الثانية) العالية (الإطارات في الثانية) على أجهزة الذكاء الاصطناعي المتطورة مثل NVIDIA Jetson من YOLOv8 مثاليًا للطائرات بدون طيار والروبوتات.
    • التصنيع: يُستخدم للكشف عن العيوب في الوقت الحقيقي على خطوط التجميع حيث يتم حساب أجزاء من الثانية.
    • البيع بالتجزئة الذكي: تتيح إمكانيات مثل عد الكائنات وتتبعها إمكانية إجراء تحليلات متقدمة لتخطيطات المتاجر وإدارة قوائم الانتظار.

الخلاصة

تظل EfficientDet مساهمة مهمة في مجال التعلّم العميق، حيث أثبتت أن القياس الذكي يمكن أن ينتج نماذج مدمجة. ومع ذلك، بالنسبة للغالبية العظمى من التطبيقات العملية اليوم, Ultralytics YOLOv8 (والأحدث YOLO11) حلًا متفوقًا.

إن الجمع بين سرعات الاستدلال فائقة السرعة على الأجهزة الحديثة، ومجموعة أدوات تطوير البرمجيات الشاملة Python والقدرة على التعامل مع مهام الرؤية المتعددة، يجعل نماذج Ultralytics الخيار الموصى به للمطورين. سواءً كنت تقوم ببناء نظام إنذار أمني أو تحليل صور الأقمار الصناعية، يوفر نظام Ultralytics البيئي الأدوات اللازمة لنقل مشروعك من مرحلة المفهوم إلى مرحلة الإنتاج بكفاءة.

استكشف نماذج أخرى

للحصول على منظور أوسع لخيارات الكشف عن الأجسام، انظر إلى هذه المقارنات:


تعليقات