EfficientDet مقابل YOLOv5: مقارنة تقنية شاملة
يعد اختيار بنية الشبكة العصبية المثلى خطوة حاسمة في أي مبادرة تتعلق بالرؤية الحاسوبية. إن التوازن بين زمن الاستدلال وكفاءة المعلمات ودقة الكشف يحدد مدى جودة أداء النموذج في العالم الواقعي. يقدم هذا الدليل التقني الشامل تحليلاً متعمقاً لاثنين من أطر عمل الكشف عن الكائنات ذات التأثير الكبير: EfficientDet Google و Ultralytics YOLOv5.
من خلال مقارنة ابتكاراتها المعمارية ومنهجيات التدريب وقدرات النشر، يمكن للمطورين اتخاذ قرارات مستنيرة لبيئات النشر الخاصة بهم، سواء كان ذلك بالتوسع عبر خوادم السحابة أو التشغيل على الأجهزة الطرفية محدودة الموارد.
EfficientDet: بنية قابلة للتطوير مع BiFPN
تم تقديم EfficientDet من قبل Google وقد تم تصميمه لتوسيع نطاق كل من الشبكة الأساسية وشبكة الميزات بشكل منهجي لتحقيق دقة عالية باستخدام معلمات أقل من النماذج الحديثة السابقة.
تفاصيل النموذج
- المؤلفون: مينغشينغ تان، رومينغ بانغ، وكوك ف. لي
- المؤسسة:Google Research
- التاريخ: 20 نوفمبر 2019
- Arxiv:EfficientDet: كشف الأجسام القابل للتطوير والفعال
- GitHub:google/automl/efficientdet
الابتكارات المعمارية
يستفيد EfficientDet من نموذج تصنيف EfficientNet كأساس له، باستخدام طريقة قياس مركبة تقيس عرض الشبكة وعمقها ودقتها بشكل موحد. وأبرز مساهمته في اكتشاف الكائنات هو إدخال شبكة هرم الميزات ثنائية الاتجاه (BiFPN). على عكس شبكات هرم الميزات القياسية التي تجمع الميزات من أعلى إلى أسفل، تسمح BiFPN بإجراء اتصالات معقدة ثنائية الاتجاه عبر المقاييس وتقدم أوزانًا قابلة للتعلم لتحديد أهمية ميزات الإدخال المختلفة.
على الرغم من دقته العالية، يعتمد EfficientDet بشكل كبير على TensorFlow ومكتبات AutoML المحددة. قد تؤدي هذه التبعية في بعض الأحيان إلى صعوبة دمجها في خطوط أنابيب أو بيئات نشر مخصصة وخفيفة الوزن تفضل الرسوم البيانية الحسابية الديناميكية.
تعرف على المزيد حول EfficientDet
Ultralytics YOLOv5: إتاحة الذكاء الاصطناعي في الوقت الفعلي للجميع
صدر بعد فترة وجيزة من EfficientDet، Ultralytics YOLOv5 ثورة في الصناعة من خلال تقديم PyTorch أصلي وسهل الاستخدام للغاية YOLO . وقد وضع معيارًا جديدًا لتجربة المطورين وكفاءة التدريب ومرونة النشر في الوقت الفعلي.
تفاصيل النموذج
- المؤلفون: Glenn Jocher
- المؤسسة:Ultralytics
- التاريخ: 26 يونيو 2020
- GitHub:ultralytics/yolov5
- الوثائق:وثائق YOLOv5
الابتكارات المعمارية
YOLOv5 تحسينات كبيرة مقارنة بسابقيه، باستخدام شبكة CSPDarknet (Cross-Stage Partial) التي تعزز تدفق التدرج بشكل كبير مع تقليل العدد الإجمالي للمعلمات. علاوة على ذلك، YOLOv5 مربعات ربط التعلم التلقائي، التي تحسب تلقائيًا المربعات المحيطة المثلى بناءً على بيانات التدريب المخصصة الخاصة بك، مما يلغي الحاجة إلى ضبط المعلمات الفائقة يدويًا.
يستخدم YOLOv5 بشكل مكثف تقنية Mosaic Data Augmentation، التي تمزج أربع صور متباينة في مربع تدريب واحد. وهذا يحسن بشكل كبير من قدرة النموذج على detect الأجسام detect ويعمم الفهم السياقي، مما يجعله قويًا للغاية في بيئات متنوعة.
الأداء والمعايير
يعد تقييم النماذج على معايير قياسية مثل COCO أمرًا بالغ الأهمية لفهم المفاضلة بين الدقة والسرعة. يوضح الجدول أدناه YOLOv5 EfficientDet و YOLOv5 بأحجام مختلفة في ظل ظروف قياسية.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
تحليل المفاضلات
بينما يصل EfficientDet-d7 إلى ذروة mAP مذهلة mAP 53.7، إلا أنه يعاني من تأخر كبير في الاستدلال على GPU مقارنة YOLO . على العكس من ذلك، YOLOv5 في تسريع الأجهزة. يحقق متغير YOLOv5n وقت استدلال سريعًا بشكل مذهل يبلغ 1.12 مللي ثانية على GPU T4 GPU NVIDIA TensorRT، مما يجعله متفوقًا بشكل كبير في التطبيقات في الوقت الفعلي مثل القيادة الذاتية أو خطوط التصنيع عالية السرعة.
بالإضافة إلى ذلك، تُظهر نماذج YOLOv5 متطلبات ذاكرة CUDA أقل بكثير أثناء التدريب مقارنة بالشبكات المعقدة ذات القياس المركب أو نماذج المحولات الكبيرة. يتيح هذا الملف الشخصي للذاكرة المحدود الوصول إلى أحدث تقنيات الذكاء الاصطناعي، مما يسمح للباحثين بتدريب نماذج قوية على أجهزة المستهلك القياسية.
تعظيم كفاءة الأجهزة
لاستخراج أقصى عدد من الإطارات في الثانية (FPS) من YOLOv5 على الأجهزة الطرفية، قم بتصدير PyTorch إلى TensorRT NVIDIA أو OpenVINOIntel . غالبًا ما تؤدي هذه الخطوة إلى مضاعفة سرعة الاستدلال.
نظام التدريب وتجربة المطورين
تكمن الميزة الحقيقية Ultralytics في تجربة المستخدم المبسطة. في حين يتطلب EfficientDet معرفة عميقة بواجهة برمجة TensorFlow لاكتشاف TensorFlow YOLOv5 Python متسقة وبسيطة.
يضمن Ultralytics الذي يتم صيانته جيدًا حصول المطورين على تحديثات متكررة ودعم نشط من المجتمع وتكامل سلس مع أدوات تتبع التجارب مثل Weights & Biases ClearML.
مثال على التعليمات البرمجية: البدء في استخدام YOLOv5
يتطلب تشغيل الاستدلال باستخدام YOLOv5 المدرب مسبقًا بضع أسطر فقط من التعليمات البرمجية عبر PyTorch :
from ultralytics import YOLO
# Load the highly efficient YOLOv5s model
model = YOLO("yolov5su.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Display the detected bounding boxes
results[0].show()
تعدد الاستخدامات والتطبيقات الواقعية
EfficientDet هو إطار عمل مخصص حصريًا لاكتشاف الأجسام، مما يحد من فائدته في خطوط الرؤية المعقدة. من ناحية أخرى، YOLOv5 دعم مهام الرؤية الحاسوبية المتعددة. تدعم الإصدارات الحديثة من النموذج تقسيم المثيلات وتصنيف الصور بدقة عالية، مما يتيح للمطورين دمج مجموعات التعلم الآلي الخاصة بهم.
حالات الاستخدام المثالية
- EfficientDet: الأنسب للمعالجة دون اتصال بالإنترنت، والبحث الأكاديمي، والتحليلات المستندة إلى السحابة حيث تُعطى الأولوية للدقة القصوى على زمن الاستجابة، وحيث تتوفر وحدات TPU من فئة الخوادم أو وحدات GPU ذات الذاكرة العالية.
- YOLOv5: الخيار الأمثل لـ عمليات نشر الذكاء الاصطناعي الطرفية. مزيجه من زمن الانتقال المنخفض، وبصمة المعلمات الصغيرة، والدقة العالية يجعله مثاليًا لتحليلات الطائرات بدون طيار، وأتمتة التجزئة في الوقت الفعلي، وتطبيقات الهاتف المحمول عبر CoreML أو TFLite.
الجيل القادم: الترقية إلى YOLO26
بينما YOLOv5 نموذجًا قويًا ومستخدمًا على نطاق واسع، فإن مجال الذكاء الاصطناعي يتطور بسرعة. بالنسبة للفرق التي تبدأ مشاريع جديدة أو تسعى إلى تحقيق أعلى مستويات الأداء الحديثة، Ultralytics نموذج YOLO26، الذي تم إصداره في يناير 2026.
يعيد YOLO26 تعريف حدود باريتو للسرعة والدقة، حيث يقدم تغييرات معمارية رائدة تجعل النشر أسهل والاستدلال أسرع.
التطورات الرئيسية في YOLO26
- تصميم شامل بدون NMS: يلغي YOLO26 بطبيعته المعالجة اللاحقة لـ Non-Maximum Suppression. وهذا يبسط منطق النشر بشكل كبير ويقلل من تباين زمن الاستجابة، وهو نهج رائد تم تحسينه من التجارب المبكرة في YOLOv10.
- استدلال أسرع على CPU بنسبة تصل إلى 43%: مصمم خصيصًا للحوسبة الطرفية وأجهزة إنترنت الأشياء منخفضة الطاقة التي تعمل بدون وحدات GPU مخصصة.
- مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (مثل Kimi K2 من Moonshot AI)، يجلب هذا المزيج من SGD و Muon ابتكارات نماذج اللغة الكبيرة (LLM) إلى الرؤية الحاسوبية، مما يتيح تقاربًا أسرع وديناميكيات تدريب مستقرة للغاية.
- ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية للتصوير الجوي والروبوتات.
- إزالة DFL: بإزالة خسارة التركيز التوزيعي، يتم تبسيط رأس النموذج بشكل كبير، مما يؤدي إلى توافق أفضل عند التصدير إلى الأجهزة الطرفية القديمة أو شديدة التقييد.
بالنسبة للفرق التي تنشر خطوط أنابيب متعددة المهام، يقدم YOLO26 أيضًا ترقيات خاصة بالمهام، مثل البروتو متعدد المقاييس للتجزئة وفقدان الزاوية المتخصص للمربعات المحددة الاتجاه (OBB). لاستكشاف البدائل الحديثة الأخرى داخل النظام البيئي، يمكنك أيضًا مراجعة YOLO11 أو YOLOv8 .
الخلاصة
يعتمد الاختيار بين EfficientDet وYOLOv5 بشكل كبير على هدف النشر الخاص بك. يقدم EfficientDet نهج توسيع نطاق أنيق رياضيًا ومناسبًا للاستدلال المعتمد بشكل كبير على السحابة. ومع ذلك، فإن تجربة المطور المتفوقة لـ YOLOv5، وحلقات تدريب PyTorch فائقة السرعة، وقدرات النشر المحسّنة للغاية على الأجهزة الطرفية تجعله الخيار المفضل للغالبية العظمى من التطبيقات الواقعية وفي الوقت الفعلي. من خلال الاستفادة من الأدوات الشاملة التي توفرها Ultralytics، يمكن للفرق تسريع وقت طرح منتجاتها في السوق وبناء أنظمة ذكاء اصطناعي عالية الاستجابة.