EfficientDet مقابل YOLOv5: مقارنة تقنية شاملة
يعد اختيار بنية الشبكة العصبية المثلى خطوة حاسمة في أي مبادرة تتعلق بالرؤية الحاسوبية. إن التوازن بين زمن الاستدلال وكفاءة المعلمات ودقة الكشف يحدد مدى جودة أداء النموذج في العالم الواقعي. يقدم هذا الدليل التقني الشامل تحليلاً متعمقاً لاثنين من أطر عمل الكشف عن الكائنات ذات التأثير الكبير: EfficientDet Google و Ultralytics YOLOv5.
من خلال مقارنة ابتكاراتهم المعمارية ومنهجيات التدريب وقدرات النشر، يمكن للمطورين اتخاذ قرارات مستنيرة بشأن بيئات النشر الخاصة بهم، سواء كان ذلك على نطاق خوادم السحابة أو على أجهزة حافة محدودة.
EfficientDet: بنية قابلة للتطوير مع BiFPN
تم تقديم EfficientDet من قبل Google وقد تم تصميمه لتوسيع نطاق كل من الشبكة الأساسية وشبكة الميزات بشكل منهجي لتحقيق دقة عالية باستخدام معلمات أقل من النماذج الحديثة السابقة.
تفاصيل النموذج
- المؤلفون: مينغشينغ تان، رومينغ بانغ، وكوك ف. لي
- المؤسسة:Google Research
- التاريخ: 20 نوفمبر 2019
- Arxiv:EfficientDet: كشف الأجسام القابل للتطوير والفعال
- GitHub:google/automl/efficientdet
الابتكارات المعمارية
يستفيد EfficientDet من نموذج تصنيف EfficientNet كأساس له، باستخدام طريقة قياس مركبة تقيس عرض الشبكة وعمقها ودقتها بشكل موحد. وأبرز مساهمته في اكتشاف الكائنات هو إدخال شبكة هرم الميزات ثنائية الاتجاه (BiFPN). على عكس شبكات هرم الميزات القياسية التي تجمع الميزات من أعلى إلى أسفل، تسمح BiFPN بإجراء اتصالات معقدة ثنائية الاتجاه عبر المقاييس وتقدم أوزانًا قابلة للتعلم لتحديد أهمية ميزات الإدخال المختلفة.
على الرغم من دقته العالية، يعتمد EfficientDet بشكل كبير على TensorFlow ومكتبات AutoML المحددة. قد تؤدي هذه التبعية في بعض الأحيان إلى صعوبة دمجها في خطوط أنابيب أو بيئات نشر مخصصة وخفيفة الوزن تفضل الرسوم البيانية الحسابية الديناميكية.
تعرف على المزيد حول EfficientDet
Ultralytics YOLOv5: إتاحة الذكاء الاصطناعي في الوقت الفعلي للجميع
صدر بعد فترة وجيزة من EfficientDet، Ultralytics YOLOv5 ثورة في الصناعة من خلال تقديم PyTorch أصلي وسهل الاستخدام للغاية YOLO . وقد وضع معيارًا جديدًا لتجربة المطورين وكفاءة التدريب ومرونة النشر في الوقت الفعلي.
تفاصيل النموذج
- المؤلفون: Glenn Jocher
- المؤسسة:Ultralytics
- التاريخ: 26 يونيو 2020
- GitHub:ultralytics/yolov5
- الوثائق:وثائق YOLOv5
الابتكارات المعمارية
YOLOv5 تحسينات كبيرة مقارنة بسابقيه، باستخدام شبكة CSPDarknet (Cross-Stage Partial) التي تعزز تدفق التدرج بشكل كبير مع تقليل العدد الإجمالي للمعلمات. علاوة على ذلك، YOLOv5 مربعات ربط التعلم التلقائي، التي تحسب تلقائيًا المربعات المحيطة المثلى بناءً على بيانات التدريب المخصصة الخاصة بك، مما يلغي الحاجة إلى ضبط المعلمات الفائقة يدويًا.
يستخدم YOLOv5 بشكل مكثف تقنية Mosaic Data Augmentation، التي تمزج أربع صور متباينة في مربع تدريب واحد. وهذا يحسن بشكل كبير من قدرة النموذج على detect الأجسام detect ويعمم الفهم السياقي، مما يجعله قويًا للغاية في بيئات متنوعة.
الأداء والمعايير
يعد تقييم النماذج على معايير قياسية مثل COCO أمرًا بالغ الأهمية لفهم المفاضلة بين الدقة والسرعة. يوضح الجدول أدناه YOLOv5 EfficientDet و YOLOv5 بأحجام مختلفة في ظل ظروف قياسية.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
تحليل المقايضات
بينما يصل EfficientDet-d7 إلى ذروة mAP مذهلة mAP 53.7، إلا أنه يعاني من تأخر كبير في الاستدلال على GPU مقارنة YOLO . على العكس من ذلك، YOLOv5 في تسريع الأجهزة. يحقق متغير YOLOv5n وقت استدلال سريعًا بشكل مذهل يبلغ 1.12 مللي ثانية على GPU T4 GPU NVIDIA TensorRT، مما يجعله متفوقًا بشكل كبير في التطبيقات في الوقت الفعلي مثل القيادة الذاتية أو خطوط التصنيع عالية السرعة.
بالإضافة إلى ذلك، تظهر YOLOv5 متطلبات CUDA أقل بكثير أثناء التدريب مقارنة بالشبكات المركبة المعقدة أو نماذج المحولات الكبيرة. هذا الملف الشخصي للذاكرة الخفيفة يتيح الوصول إلى أحدث تقنيات الذكاء الاصطناعي، مما يسمح للباحثين بتدريب نماذج قوية على أجهزة المستهلكين القياسية.
تعظيم كفاءة الأجهزة
لاستخراج أقصى عدد من الإطارات في الثانية (FPS) من YOLOv5 على الأجهزة الطرفية، قم بتصدير PyTorch إلى TensorRT NVIDIA أو OpenVINOIntel . غالبًا ما تؤدي هذه الخطوة إلى مضاعفة سرعة الاستدلال.
نظام التدريب وتجربة المطورين
تكمن الميزة الحقيقية Ultralytics في تجربة المستخدم المبسطة. في حين يتطلب EfficientDet معرفة عميقة بواجهة برمجة TensorFlow لاكتشاف TensorFlow YOLOv5 Python متسقة وبسيطة.
يضمن Ultralytics الذي يتم صيانته جيدًا حصول المطورين على تحديثات متكررة ودعم نشط من المجتمع وتكامل سلس مع أدوات تتبع التجارب مثل Weights & Biases ClearML.
مثال على التعليمات البرمجية: البدء في استخدام YOLOv5
يتطلب تشغيل الاستدلال باستخدام YOLOv5 المدرب مسبقًا بضع أسطر فقط من التعليمات البرمجية عبر PyTorch :
from ultralytics import YOLO
# Load the highly efficient YOLOv5s model
model = YOLO("yolov5su.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Display the detected bounding boxes
results[0].show()
تعدد الاستخدامات والتطبيقات الواقعية
EfficientDet هو إطار عمل مخصص حصريًا لاكتشاف الأجسام، مما يحد من فائدته في خطوط الرؤية المعقدة. من ناحية أخرى، YOLOv5 دعم مهام الرؤية الحاسوبية المتعددة. تدعم الإصدارات الحديثة من النموذج تقسيم المثيلات وتصنيف الصور بدقة عالية، مما يتيح للمطورين دمج مجموعات التعلم الآلي الخاصة بهم.
حالات الاستخدام المثالية
- EfficientDet: الأنسب للمعالجة دون اتصال بالإنترنت، والبحوث الأكاديمية، والتحليلات المستندة إلى السحابة حيث تُعطى الأولوية للدقة القصوى على حساب زمن الاستجابة، وحيث تتوفر وحدات معالجة TPU من فئة الخوادم أو وحدات معالجة GPU ذات ذاكرة عالية.
- YOLOv5: الخيار الأمثل لنشر الذكاء الاصطناعي المتطور. بفضل الجمع بين زمن الاستجابة المنخفض، والمساحة الصغيرة للمعلمات، والدقة العالية، فإنه يعتبر مثالياً لتحليلات الطائرات بدون طيار، وأتمتة البيع بالتجزئة في الوقت الفعلي، والتطبيقات المحمولة عبر CoreML أو TFLite.
الجيل القادم: الترقية إلى YOLO26
بينما YOLOv5 نموذجًا قويًا ومستخدمًا على نطاق واسع، فإن مجال الذكاء الاصطناعي يتطور بسرعة. بالنسبة للفرق التي تبدأ مشاريع جديدة أو تسعى إلى تحقيق أعلى مستويات الأداء الحديثة، Ultralytics نموذج YOLO26، الذي تم إصداره في يناير 2026.
يعيد YOLO26 تعريف حدود باريتو للسرعة والدقة، حيث يقدم تغييرات معمارية رائدة تجعل النشر أسهل والاستدلال أسرع.
التطورات الرئيسية في YOLO26
- تصميم شامل NMS: يزيل YOLO26 بشكل أساسي المعالجة اللاحقة لـ Non-Maximum Suppression. وهذا يبسط بشكل كبير منطق النشر ويقلل من تباين زمن الاستجابة، وهو نهج ثوري تم تحسينه من التجارب المبكرة في YOLOv10.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : مصمم خصيصًا لأجهزة الحوسبة الطرفية وأجهزة إنترنت الأشياء منخفضة الطاقة التي تعمل بدون وحدات معالجة رسومات مخصصة.
- MuSGD Optimizer: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (مثل Kimi K2 من Moonshot AI)، يجلب هذا المزيج من SGD Muon ابتكارات LLM إلى الرؤية الحاسوبية، مما يتيح تقاربًا أسرع وديناميكيات تدريب عالية الاستقرار.
- ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية بالنسبة للصور الجوية والروبوتات.
- إزالة DFL: من خلال إزالة فقدان بؤرة التوزيع (Distribution Focal Loss)، يتم تبسيط رأس النموذج بشكل كبير، مما يؤدي إلى تحسين التوافق عند التصدير إلى أجهزة قديمة أو أجهزة حديثة ذات قيود شديدة.
بالنسبة للفرق التي تنشر خطوط أنابيب متعددة المهام، يقدم YOLO26 أيضًا ترقيات خاصة بالمهام، مثل البروتو متعدد المقاييس للتجزئة وفقدان الزاوية المتخصص للمربعات المحددة الاتجاه (OBB). لاستكشاف البدائل الحديثة الأخرى داخل النظام البيئي، يمكنك أيضًا مراجعة YOLO11 أو YOLOv8 .
الخلاصة
YOLOv5 الاختيار بين EfficientDet و YOLOv5 بشكل كبير على هدف النشر الخاص بك. يقدم EfficientDet نهجًا رياضيًا أنيقًا للتوسع مناسبًا للاستدلال السحابي المكثف. ومع ذلك، فإن تجربة المطورين الفائقة YOLOv5 وحلقات PyTorch السريعة للغاية PyTorch وقدرات النشر المتطورة للغاية تجعله الخيار المفضل للغالبية العظمى من التطبيقات الواقعية في الوقت الفعلي. من خلال الاستفادة من الأدوات الشاملة التي توفرها Ultralytics يمكن للفرق تسريع وقت طرح منتجاتها في السوق وبناء أنظمة ذكاء اصطناعي عالية الاستجابة.