تخطي إلى المحتوى

EfficientDet مقابل YOLOv7: تطور الكشف عن الكائنات في الوقت الفعلي

لقد تشكلت رؤية الكمبيوتر من خلال السعي المستمر لتحقيق التوازن بين الدقة والكفاءة الحسابية. وهناك فلسفتان متميزتان في هذه التطورات تتمثلان في EfficientDet، وهي مجموعة من النماذج التي تركز على الكفاءة القابلة للتطوير، و YOLOv7، التي أعطت الأولوية لسرعة الاستدلال في الوقت الفعلي من خلال تحسين البنية.

تستكشف هذه المقارنة المواصفات الفنية والاختلافات المعمارية ومقاييس الأداء لهذين النموذجين المؤثرين، مع تسليط الضوء على الأسباب التي جعلت الحلول الحديثة مثل YOLO26 المعيار الجديد للمطورين.

EfficientDet: كفاءة قابلة للتطوير

تم إصدار EfficientDet في أواخر عام 2019، وقد تم تصميمه لمعالجة أوجه القصور في أجهزة الكشف السابقة حيث كان التوسع يتم غالبًا يدويًا أو بشكل غير موحد. وقد أدخل طريقة منهجية لتوسيع الدقة والعمق والعرض في وقت واحد.

نظرة عامة تقنية

البنية والميزات الرئيسية

يستخدم EfficientDet شبكة EfficientNet الأساسية مقترنة بشبكة هرمية ثنائية الاتجاه مرجحة (BiFPN). تسمح شبكة BiFPN بدمج الميزات متعددة المستويات بسهولة وسرعة، وتصحيح عدم التوازن حيث تساهم الميزات المدخلة المختلفة بشكل غير متساوٍ في الناتج.

يستخدم النموذج مقياس مركب، والذي يستخدم معامل بسيط لتوسيع شبكة العمود الفقري، BiFPN، شبكة الفئة/الصندوق، والدقة. في حين أن هذا النهج ينتج دقة عالية لعدد معين من المعلمات (FLOPs)، فإن الترابطات المعقدة في طبقات BiFPN يمكن أن تؤدي إلى زمن استدلال أعلى على الأجهزة التي لم يتم تحسينها خصيصًا لمثل هذه الأنماط غير المنتظمة للوصول إلى الذاكرة.

YOLOv7: قوة "حقيبة التحسينات المجانية"

أطلق YOLOv7 في يوليو 2022، YOLOv7 قفزة كبيرة في عائلة YOLO You Only Look Once). على عكس تركيز EfficientDet على كفاءة المعلمات، YOLOv7 على سرعة الاستدلال، مما دفع حدود ما كان ممكنًا للكشف عن الكائنات في الوقت الفعلي على GPU القياسية.

نظرة عامة تقنية

البنية والميزات الرئيسية

YOLOv7 شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN). تتحكم هذه البنية في أقصر وأطول مسارات التدرج لتسمح للشبكة بتعلم ميزات أكثر تنوعًا دون تدمير مسار التدرج الأصلي.

أحد المفاهيم الأساسية لـ YOLOv7 "trainable bag-of-freebies" — طرق التحسين التي تعمل على تحسين الدقة أثناء التدريب دون زيادة تكلفة الاستدلال. ويشمل ذلك تقنيات مثل إعادة تحديد معلمات النموذج، حيث يتم تبسيط بنية التدريب المعقدة إلى مجموعة مبسطة من التلافيف للنشر. وهذا يضمن أن عملية التدريب تكون قوية، في حين أن النموذج النهائي المنشور يكون سريعًا للغاية.

تعرف على المزيد حول YOLOv7

مقارنة الأداء

يُقارن الجدول التالي أداء YOLOv7 EfficientDet و YOLOv7 المختلفة. في حين تُظهر نماذج EfficientDet (d0-d7) كفاءة جيدة في المعلمات، فإن زمن الاستجابة على الأجهزة القياسية أعلى بكثير من YOLOv7 التي تم تحسينها GPU عالية السرعة.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

تحليل المقاييس

تسلط البيانات الضوء على فرق مهم: زمن الاستجابة مقابل FLOPs. على الرغم من أن EfficientDet-d7 يحقق معدل mAP مرتفعًا يبلغ 53.7٪، إلا أنه يحقق ذلك بزمن استجابة يزيد عن 128 مللي ثانية على GPU T4. في المقابل، يحقق YOLOv7x معدل mAP متوسط mAP مماثل يبلغ 53.1٪، ولكنه يعمل بزمن استجابة يبلغ 11.57 مللي ثانيةفقط، أي أسرع بأكثر من 10 مرات. بالنسبة للتطبيقات الواقعية مثل المركبات ذاتية القيادة أو تحليلات الفيديو، غالبًا ما تكون ميزة السرعة هذه هي العامل الحاسم.

أهمية زمن الاستجابة

في حين أن FLOPs (عمليات النقطة العائمة) هي مقياس نظري جيد للتعقيد، إلا أنها لا ترتبط دائمًا بشكل خطي بسرعة الاستدلال. يمكن أن تتطلب البنى مثل BiFPN تكاليف وصول عالية للذاكرة مما يؤدي إلى إبطاء وقت التشغيل الفعلي، في حين أن هياكل CNN البسيطة YOLO مُحسّنة بشكل كبير GPU .

ميزة Ultralytics: النظام البيئي وسهولة الاستخدام

غالبًا ما يعتمد اختيار النموذج على نظام البرمجيات بقدر ما يعتمد على المقاييس الأولية. وهنا تكمن المزايا الكبيرة التي يوفرها الانتقال إلى Ultralytics مقارنة بالمستودعات القديمة.

تجربة مستخدم مبسطة

يعتمد EfficientDet على TensorFlow القديمة التي قد يكون من الصعب دمجها في PyTorch . في المقابل، Ultralytics Python موحدة تعامل تدريب النماذج والتحقق من صحتها ونشرها على أنها مهام بسيطة وموحدة.

كفاءة التدريب والذاكرة

تتمثل إحدى المزايا الرئيسيةYOLO Ultralytics YOLO في متطلباتها من الذاكرة. بفضل محملات البيانات المُحسّنة والتصميم المعماري الفعال، تستهلك YOLO عادةً CUDA أقل أثناء التدريب مقارنةً بالشبكات المعقدة متعددة الفروع. وهذا يتيح للمطورين استخدام أحجام دفعات أكبر، مما يؤدي إلى استقرار التدريب وتسريع التقارب.

from ultralytics import YOLO

# Load a model (YOLOv7 or newer)
model = YOLO("yolov7.pt")

# Train the model with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

تنوع لا يمكن اكتشافه

في حين أن EfficientDet هو في المقام الأول أداة للكشف عن الكائنات، فإن Ultralytics يدعم مجموعة واسعة من المهام بما في ذلك تقسيم الحالات وتقدير الوضع ومربعات الحدود الموجهة (OBB). هذه المرونة تعني أن الفرق يمكنها استخدام إطار عمل واحد لمواجهة تحديات الرؤية الحاسوبية المتنوعة.

المعيار الجديد: YOLO26

في حين أن YOLOv7 ذروة التكنولوجيا في عام 2022، إلا أن هذا المجال يتطور بسرعة. بالنسبة للمشاريع الجديدة، نوصي باستخدام YOLO26، الذي تم إصداره في يناير 2026. وهو يعتمد على نقاط القوة في الأجيال السابقة مع إدخال تغييرات أساسية في البنية.

  • تصميم شامل NMS: على عكس YOLOv7 EfficientDet، اللذين يتطلبان معالجة لاحقة لـ Non-Maximum Suppression (NMS)، فإن YOLO26 شامل بطبيعته. وهذا يزيل اختناقات التأخير ويبسط منطق النشر، وهو إنجاز رائد في YOLOv10.
  • MuSGD Optimizer: مستوحى من Kimi K2 من Moonshot AI، يجمع هذا المحسّن SGD استقرار SGD وسرعة Muon، مما يجلب ابتكارات تدريب LLM إلى مهام الرؤية.
  • أداء محسّن على الحافة: بفضل إزالة فقدان التركيز التوزيعي (DFL) والتحسينات المحددة، أصبح YOLO26 أسرع بنسبة تصل إلى 43٪ على CPU، مما يجعله متفوقًا بكثير على EfficientDet للأجهزة الطرفية مثل Raspberry Pi أو الهواتف المحمولة.
  • ProgLoss + STAL: تعمل وظائف الخسارة الجديدة على تحسين التعرف على الأجسام الصغيرة بشكل كبير، مما يعالج نقطة الضعف الشائعة في أجهزة الكشف أحادية المرحلة السابقة.

تعرف على المزيد حول YOLO26

تطبيقات عملية في أرض الواقع

متى تختار EfficientDet

يظل EfficientDet مناسبًا للأنظمة القديمة المتكاملة بشكل عميق مع نظامTensorFlow أو الأبحاث الأكاديمية المحددة في مجال التوسع المركب. كما أن متغيراته الأصغر (d0-d2) مفيدة أيضًا عندما يكون تخزين القرص (حجم وزن النموذج بالميغابايت) هو القيد الأساسي، بدلاً من سرعة وقت التشغيل.

متى تختار YOLOv7

YOLOv7 خيارًا ممتازًا لخطوط الإنتاج الحالية التي تتطلب ما يلي:

  • تحليلات الفيديو: معالجة تدفقات عالية الإطارات في الثانية (FPS) للحصول على رؤى أمنية أو تجارية.
  • الروبوتات:دمج الرؤية الحاسوبية في الروبوتات حيث يكون زمن الاستجابة المنخفض أمرًا بالغ الأهمية للتنقل.
  • الكشف العام: السيناريوهات التي تتطلب بنية ناضجة ومدعومة على نطاق واسع.

متى يجب الترقية إلى YOLO26

يعد YOLO26 الخيار المثالي لجميع عمليات النشر الجديدة تقريبًا، حيث يوفر:

  • الحوسبة الطرفية: CPU فائقة لتطبيقات إنترنت الأشياء والتطبيقات المحمولة.
  • المهام المعقدة: دعم أصلي للتجزئة والوضع و OBB.
  • عمليات مبسطة: يزيل التصميم NMS أحد أكبر الصعوبات في مرحلة ما بعد المعالجة والتصدير، مما يضمن أن ما تراه أثناء التدريب هو بالضبط ما تحصل عليه عند النشر.

بالنسبة للباحثين والمطورين الذين يسعون إلى البقاء في طليعة التكنولوجيا، فإن الانتقال إلى Ultralytics مع YOLO26 يضمن الوصول إلى أحدث التطورات في استقرار التدريب وكفاءة النماذج وتنوع الاستخدامات.


تعليقات