مقارنة تقنية شاملة بين EfficientDet و YOLOv7: مقارنة تقنية شاملة
في المشهد سريع التطور في مجال الرؤية الحاسوبية، يعد اختيار البنية الصحيحة لاكتشاف الأجسام أمرًا محوريًا لنجاح المشروع. يقارن هذا التحليل بين EfficientDet، وهي بنية قابلة للتطوير تركز على الكفاءة، و YOLOv7وهو كاشف في الوقت الحقيقي مصمم للسرعة والدقة على أجهزة GPU . في حين أن كلا النموذجين يمثلان أحدث أداء في الإصدار الخاص بكل منهما، فإن فهم الفروق الفنية الدقيقة بينهما يساعد المطورين على اتخاذ قرارات مستنيرة لعمليات النشر الحديثة.
مقاييس الأداء والتحليل
يعرض الجدول التالي مقارنة مفصّلة لمقاييس الأداء الرئيسية، بما في ذلك متوسط الدقةmAP)، وسرعة الاستدلال على أجهزة مختلفة، والتعقيد الحسابي (المعلمات وعمليات التشغيل من العمليات الحسابية).
| النموذج | الحجم (بالبكسل) | mAPفال 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
النقاط الرئيسية
- الكفاءة مقابل الكمون: يحقق EfficientDet كفاءة ملحوظة في المعلمات (حجم نموذج منخفض) بفضل تحجيمه المركب. ومع ذلك، على أجهزة GPU (T4 TensorRT), YOLOv7 وقت استجابة متفوق. على سبيل المثال، يحقق YOLOv7l نسبة 51.4% mAP مع زمن انتقال يبلغ 6.84 مللي ثانية فقط، بينما يتطلب EfficientDet-d5 67.86 مللي ثانية للحصول على mAP مماثل بنسبة 51.5%.
- تأثير البنية: تقلل عمليات التلافيف العميقة القابلة للفصل المستخدمة في EfficientDet من عدد وحدات معالجة الرسومات (FLOP) ولكن يمكن تحسينها بشكل أقل على وحدات معالجة الرسومات مقارنةً بالتلافيف الكثيفة في YOLOv7 مما يؤدي إلى التباينات الملحوظة في السرعة.
نظرة عامة على EfficientDet
أحدثت EfficientDet نقلة نوعية في عام 2019 من خلال اقتراح بنية قابلة للتطوير تعمل على تحسين الدقة والكفاءة في آن واحد. وهي تعتمد على العمود الفقري لشبكة EfficientNet وتقدم شبكة BiFPPN (شبكة هرم الميزات ثنائية الاتجاه).
تفاصيل EfficientDet:
المؤلفون: مينغشينغ تان ورومينغ بانغ وكوك ف. لي
المؤسسة: Google
التاريخ: 2019-11-20
اركسيف: https://arxiv.org/abs/1911.09070
جيثب: https:google
أبرز الملامح المعمارية
يتمثل الابتكار الأساسي في EfficientDet في الشبكة الثنائية لملامح السمة (BiFPPN)، والتي تسمح بدمج الميزات متعددة النطاقات بسهولة وسرعة. وخلافًا لشبكات FPN التقليدية، تستخدم BiFPPN دمج الميزات الموزونة لمعرفة أهمية ميزات المدخلات المختلفة. وبالاقتران مع المقياس المركب، الذي يقيس الدقة والعمق والعرض بشكل موحد، تقدم EfficientDet مجموعة من النماذج (من D0 إلى D7) التي تلبي مختلف قيود الموارد.
تعرف على المزيد حول EfficientDet
نظرة عامة على YOLOv7
دفع YOLOv7 الذي صدر في عام 2022، حدود الكشف عن الأجسام في الوقت الحقيقي من خلال التركيز على تحسين عملية التدريب والبنية لسرعة الاستدلال. وهو يقدّم العديد من "حقيبة الأجسام المجانية" التي تعمل على تحسين الدقة دون زيادة تكلفة الاستدلال.
تفاصيلYOLOv7 :
المؤلفون: تشين ياو وانغ، وأليكسي بوشكوفسكي، وهونغ يوان مارك لياو
المنظمة: معهد علوم المعلومات، الأكاديميا سينيكا، تايوان
التاريخ: 2022-07-06
اركسيف: https://arxiv.org/abs/2207.02696
جيثب: https://github.com/WongKinYiu/yolov7
أبرز الملامح المعمارية
يستخدم YOLOv7 شبكة تجميع الطبقات الموسّعة الفعّالة E-ELAN، والتي تتحكم في أقصر وأطول مسارات التدرج للسماح للشبكة بتعلم ميزات أكثر تنوعًا. كما أنها تستخدم أيضًا تحجيم النموذج للنماذج القائمة على التسلسل، مما يسمح لها بالحفاظ على البنية المثلى عبر أحجام مختلفة. تم ضبط الهندسة المعمارية خصيصاً لتحقيق كفاءة GPU وتجنب العمليات التي لها تكاليف وصول عالية إلى الذاكرة على الرغم من انخفاض عدد عمليات FLOP.
حالات الاستخدام المثالية
يعتمد الاختيار بين هذه البنى بشكل كبير على أجهزة النشر ومتطلبات التطبيق المحددة.
متى تختار EfficientDet
يعد EfficientDet مثاليًا للبيئاتCPU أو الأجهزة الطرفية حيث يكون عرض النطاق الترددي للذاكرة والتخزين محدودًا للغاية. إن عدد معلماتها المنخفض يجعلها مناسبة لـ:
- تطبيقات الهاتف المحمول: تطبيقات iOS حيث يمثل حجم التطبيق (حجم APK) قيدًا حاسمًا.
- الأنظمة المدمجة: أجهزة مثل Raspberry Pi (الأجيال الأقدم) التي تعمل على CPU.
- البحث الأكاديمي: دراسة تأثيرات تقنيات القياس المركب ودمج السمات.
متى تختار YOLOv7
تتفوق YOLOv7 في بيئات GPU عالية الأداء حيث يكون زمن الوصول المنخفض غير قابل للتفاوض. إنه الخيار المفضل لـ
- المراقبة في الوقت الحقيقي: معالجة تدفقات الفيديو المتعددة في وقت واحد على خوادم الحافة.
- القيادة الذاتية: حيث يمكن أن يؤثر التأخير بالمللي ثانية على السلامة.
- الروبوتات: للكشف السريع عن الأجسام والتفاعل السريع في البيئات الديناميكية.
البدائل الحديثة
على الرغم من قوة EfficientDet و YOLOv7 إلا أن المجال قد تقدم. للمشاريع الجديدة YOLO11 بشكل عام. فهو يجمع بين مفاهيم الكفاءة في العمود الفقري الحديث والسرعة في الوقت الحقيقي لعائلة YOLO وغالبًا ما يتفوق على كلا النظامين السابقين في الدقة وسهولة النشر.
لماذا تختار نماذج Ultralytics YOLO؟
في حين أن EfficientDet و YOLOv7 يظلان مساهمتين مهمتين في مجال الرؤية الحاسوبية، فإن نظام Ultralytics البيئي الذي يضم نماذج مثل YOLOv8 والنموذج المتطور YOLO11المتطورة - يقدم مزايا مميزة للمطورين والباحثين.
سهولة الاستخدام والنظام البيئي
غالبًا ما تتطلب النماذج القديمة خطوات تثبيت معقدة، أو إصدارات محددة CUDA أو قواعد رموز مجزأة. في المقابل، تركز Ultralytics على تجربة مستخدم موحدة ومبسطة. وبفضل بساطة pip install ultralyticsيحصل المستخدمون على إمكانية الوصول إلى واجهة برمجة تطبيقات Python API قوية و أوامر CLI توحيد التدريب والتحقق من الصحة والنشر. و نظام بيئي جيد الصيانة يضمن تحديثات متكررة ودعمًا واسعًا للأجهزة وتكاملًا مع أدوات مثل Ultralytics HUB لعمليات التشغيل الآلي السلس.
توازن الأداء وكفاءة الذاكرة
تم تصميم نماذج Ultralytics لتحقيق التوازن الأمثل للأداء. فهي توفر دقة فائقة مع الحفاظ على سرعات استدلال استثنائية، مما يجعلها مناسبة لسيناريوهات متنوعة من النشر على الحافة إلى واجهات برمجة التطبيقات السحابية. علاوة على ذلك، غالبًا ما تكون متطلبات الذاكرة لتدريب نماذج Ultralytics YOLO أقل من تلك الخاصة بالبنى القائمة على المحولات أو شبكات ConvNets الأقدم، مما يسمح بالتدريب الفعال على وحدات معالجة الرسومات من فئة المستهلك.
تعدد الاستخدامات وكفاءة التدريب
على عكس العديد من أجهزة الكشف المحددة، فإن نماذج Ultralytics متعددة الاستخدامات للغاية. يدعم إطار عمل واحد:
هذا التنوع في الاستخدام، بالإضافة إلى كفاءة التدريب - بفضلأدوات تحميل البيانات المحسّنة والأوزان المتاحة مسبقًا والمتوفرة بسهولة على COCO-تقلل بشكل كبير من الوقت اللازم لوصول حلول الذكاء الاصطناعي إلى السوق.
مثال: تشغيل نموذج YOLO الحديث
فيما يلي مثال على مدى سهولة استخدام نموذج Ultralytics الحديث للاستدلال، وهو ما يتناقض بشكل صارخ مع البنى النمطية التي غالباً ما تكون مطلوبة في البنى القديمة.
from ultralytics import YOLO
# Load the latest YOLO11 model (pre-trained on COCO)
model = YOLO("yolo11n.pt")
# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Process results
for result in results:
result.save() # Save the annotated image to disk
print(f"Detected {len(result.boxes)} objects.")
الخلاصة
يمثل EfficientDet و YOLOv7 فلسفتين مختلفتين في تاريخ الرؤية الحاسوبية: إحداهما تعمل على تحسين الكفاءة النظرية (FLOPs/Params) والأخرى على تحسين الكمون العملي للأجهزة. لا يزال EfficientDet مرجعًا قويًا لتطبيقات CPU المقيدة بالمعاملات، بينما يخدم YOLOv7 أعباء عمل GPU عالية السرعة بشكل جيد.
ومع ذلك، بالنسبة للمطورين الذين يبحثون عن أفضل ما في العالمين - السرعة والدقة وتجربة تطوير خالية من الاحتكاك - فإن نماذج Ultralytics مثل YOLO11 هي الخيار الأفضل. فهي تبسّط عملية التدريب والنشر المعقدة مع تقديم أداء يلبي المتطلبات الصارمة لتطبيقات الرؤية الحاسوبية الحديثة.
مقارنات النماذج الأخرى
استكشف المزيد من المقارنات الفنية للعثور على أفضل طراز يناسب احتياجاتك الخاصة:
- EfficientDet مقابل YOLOv8
- YOLOv7 مقابل YOLOv8
- EfficientDet مقابل YOLOv5
- YOLOv6 مقابل YOLOv7
- RT-DETR ضد YOLOv7
- YOLO مقابل EfficientDet