EfficientDet مقابل YOLOv5: مقارنة تقنية شاملة
يعد اختيار بنية الشبكة العصبية المثالية خطوة حاسمة في أي مبادرة متعلقة بـ الرؤية الحاسوبية. إن التوازن بين زمن استجابة الاستدلال، وكفاءة المعلمات، ودقة الكشف يحدد مدى جودة أداء النموذج في العالم الحقيقي. يقدم هذا الدليل التقني الشامل تحليلاً متعمقاً لاثنين من أطر عمل اكتشاف الكائنات الأكثر تأثيراً: EfficientDet من Google وUltralytics YOLOv5.
من خلال مقارنة ابتكاراتهما المعمارية ومنهجيات التدريب وقدرات النشر، يمكن للمطورين اتخاذ قرارات مستنيرة لبيئات النشر الخاصة بهم، سواء كانوا يتوسعون عبر خوادم سحابية أو يعملون على أجهزة طرفية مقيدة الموارد.
EfficientDet: بنية قابلة للتوسع مع BiFPN
تم تصميم EfficientDet من قبل Google Research لتوسيع نطاق كل من العمود الفقري (backbone) وشبكة الميزات بشكل منهجي، وذلك لتحقيق دقة عالية باستخدام معلمات أقل من نماذج الحالة الراهنة السابقة.
تفاصيل النموذج
- المؤلفون: Mingxing Tan, Ruoming Pang, and Quoc V. Le
- المنظمة: Google Research
- التاريخ: 20 نوفمبر 2019
- Arxiv: EfficientDet: Scalable and Efficient Object Detection
- GitHub: google/automl/efficientdet
الابتكارات المعمارية
تستفيد EfficientDet من نموذج تصنيف EfficientNet كعمود فقري لها، وتستخدم طريقة توسيع مركبة تقوم بتوسيع عرض الشبكة وعمقها ودقتها بشكل موحد. مساهمتها الأكثر بروزاً في اكتشاف الكائنات هي تقديم شبكة هرم الميزات ثنائية الاتجاه (BiFPN). وخلافاً لشبكات هرم الميزات القياسية التي تكتفي بتجميع الميزات من الأعلى إلى الأسفل، تسمح BiFPN باتصالات معقدة وثنائية الاتجاه عبر المقاييس وتدخل أوزاناً قابلة للتعلم لتحديد أهمية ميزات الإدخال المختلفة.
على الرغم من دقتها العالية، تعتمد EfficientDet بشكل كبير على نظام TensorFlow ومكتبات AutoML محددة. قد يجعل هذا الاعتماد من الصعب أحياناً دمجها في خطوط أنابيب نشر مخصصة وخفيفة الوزن أو في البيئات التي تفضل الرسوم البيانية الحسابية الديناميكية.
تعرف على المزيد حول EfficientDet
Ultralytics YOLOv5: إضفاء الطابع الديمقراطي على الذكاء الاصطناعي في الوقت الفعلي
بعد فترة وجيزة من إصدار EfficientDet، أحدث Ultralytics YOLOv5 ثورة في الصناعة من خلال تقديم تنفيذ PyTorch أصلي وسهل الوصول إليه بشكل لا يصدق لبنية YOLO. وقد وضع معياراً جديداً لتجربة المطورين، وكفاءة التدريب، ومرونة النشر في الوقت الفعلي.
تفاصيل النموذج
- المؤلفون: Glenn Jocher
- المنظمة: Ultralytics
- التاريخ: 26 يونيو 2020
- GitHub: ultralytics/yolov5
- المستندات: YOLOv5 Documentation
الابتكارات المعمارية
قدمت YOLOv5 ترقيات كبيرة مقارنة بأسلافها، مستخدمة عموداً فقرياً من نوع CSPDarknet (Cross-Stage Partial) الذي يعزز تدفق التدرج بشكل كبير مع تقليل إجمالي عدد المعلمات. علاوة على ذلك، تدمج YOLOv5 صناديق تثبيت ذاتية التعلم (Auto-Learning Anchor Boxes)، والتي تحسب تلقائياً أولويات صناديق الإحاطة المثالية بناءً على بيانات التدريب المخصصة الخاصة بك، مما يلغي الحاجة إلى ضبط المعلمات الفائقة يدوياً.
تستخدم YOLOv5 أيضاً بكثافة Mosaic Data Augmentation، حيث تدمج أربع صور متباينة في مربع تدريب واحد. هذا يحسن بشكل كبير قدرة النموذج على اكتشاف الكائنات الصغيرة ويعمم الفهم السياقي، مما يجعله قوياً للغاية في بيئات متنوعة.
الأداء والمعايير
يعد تقييم النماذج على معايير قياسية مثل مجموعة بيانات COCO أمراً بالغ الأهمية لفهم المقايضات بين الدقة والسرعة. يوضح الجدول أدناه كيفية أداء أحجام مختلفة من EfficientDet وYOLOv5 في ظل ظروف موحدة.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ملي ثانية) | السرعة T4 TensorRT10 (ملي ثانية) | المعلمات (مليون) | FLOPs (مليار) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
تحليل المقايضات
بينما يصل EfficientDet-d7 إلى ذروة mAP مثيرة للإعجاب تبلغ 53.7، إلا أنه يعاني من زمن استجابة استدلال كبير على أجهزة GPU مقارنة ببنيات YOLO. في المقابل، تتفوق YOLOv5 في تسريع الأجهزة. يحقق متغير YOLOv5n زمن استدلال سريع للغاية يبلغ 1.12 مللي ثانية على T4 GPU باستخدام NVIDIA TensorRT، مما يجعله متفوقاً بشكل كبير للتطبيقات التي تتطلب وقتاً فعلياً مثل القيادة الذاتية أو خطوط التصنيع عالية السرعة.
بالإضافة إلى ذلك، تظهر نماذج YOLOv5 متطلبات ذاكرة CUDA أقل بكثير أثناء التدريب مقارنة بالشبكات ذات النطاق المركب المعقد أو نماذج Transformer الكبيرة. يعمل ملف تعريف الذاكرة الخفيف هذا على إضفاء الطابع الديمقراطي على الوصول إلى الذكاء الاصطناعي المتقدم، مما يسمح للباحثين بتدريب نماذج قوية على الأجهزة الاستهلاكية القياسية.
للحصول على أقصى عدد من الإطارات في الثانية (FPS) من نموذج YOLOv5 الخاص بك على الأجهزة الطرفية، قم بتصدير أوزان PyTorch الخاصة بك إلى TensorRT لوحدات معالجة الرسومات NVIDIA أو OpenVINO لمعالجات Intel. يمكن لهذه الخطوة غالباً مضاعفة سرعة الاستدلال لديك.
نظام التدريب وتجربة المطورين
تكمن الميزة الحقيقية لنظام Ultralytics في تجربة المستخدم المبسطة. بينما تتطلب EfficientDet معرفة عميقة بواجهة برمجة تطبيقات اكتشاف الكائنات في TensorFlow، توفر YOLOv5 واجهة برمجة تطبيقات Python متسقة وبسيطة.
يضمن نظام Ultralytics الذي يتم صيانته جيداً حصول المطورين على تحديثات متكررة، ودعم مجتمعي نشط، وتكامل سلس مع أدوات تتبع التجارب مثل Weights & Biases وClearML.
مثال كود: البدء مع YOLOv5
يتطلب تشغيل الاستدلال باستخدام نموذج YOLOv5 مدرب مسبقاً بضعة أسطر فقط من الكود عبر PyTorch Hub:
from ultralytics import YOLO
# Load the highly efficient YOLOv5s model
model = YOLO("yolov5su.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Display the detected bounding boxes
results[0].show()تعدد الاستخدامات والتطبيقات في العالم الحقيقي
تعد EfficientDet إطار عمل لاكتشاف الكائنات بدقة، مما يحد من فائدتها في خطوط أنابيب الرؤية المعقدة. من ناحية أخرى، تطورت YOLOv5 لدعم مهام رؤية حاسوبية متعددة. تدعم الإصدارات الحديثة من النموذج تجزئة الكائنات وتصنيف الصور بدقة عالية، مما يسمح للمطورين بدمج حزمة تعلم الآلة الخاصة بهم.
حالات الاستخدام المثالية
- EfficientDet: الأنسب للمعالجة دون اتصال بالإنترنت، والبحث الأكاديمي، والتحليلات القائمة على السحابة حيث يتم إعطاء الأولوية للدقة القصوى على زمن الاستجابة، وحيث تتوفر وحدات TPU من فئة الخادم أو وحدات GPU ذات ذاكرة عالية.
- YOLOv5: الخيار الحاسم لـ نشر الذكاء الاصطناعي على الحافة. إن مزيجها من زمن الاستجابة المنخفض، وبصمة المعلمات الصغيرة، والدقة العالية يجعلها مثالية لتحليلات الطائرات بدون طيار، وأتمتة البيع بالتجزئة في الوقت الفعلي، وتطبيقات الهاتف المحمول عبر CoreML أو TFLite.
الجيل القادم: الترقية إلى YOLO26
على الرغم من أن YOLOv5 لا تزال نموذجاً قوياً ومنتشراً على نطاق واسع، إلا أن مجال الذكاء الاصطناعي يتحرك بسرعة. بالنسبة للفرق التي تبدأ مشاريع جديدة أو تسعى للحصول على أقصى أداء حديث، قدمت Ultralytics YOLO26، الذي تم إصداره في يناير 2026.
يعيد YOLO26 تعريف حدود Pareto للسرعة والدقة، مقدماً تحولات معمارية رائدة تجعل النشر أسهل والاستدلال أسرع.
تقدمات YOLO26 الرئيسية
- تصميم كامل من البداية إلى النهاية بدون NMS: يلغي YOLO26 أصلاً معالجة ما بعد الإلغاء غير الأقصى (Non-Maximum Suppression). هذا يبسط منطق النشر بشكل كبير ويقلل من تباين زمن الاستجابة، وهو نهج اختراقي تم صقله من التجارب المبكرة في YOLOv10.
- سرعة استدلال تصل إلى 43% أسرع على CPU: مصمم خصيصاً للحوسبة الطرفية وأجهزة إنترنت الأشياء منخفضة الطاقة التي تعمل بدون وحدات معالجة رسومات مخصصة.
- مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغات الكبيرة (مثل Kimi K2 من Moonshot AI)، يجلب هذا الهجين من SGD وMuon ابتكارات LLM إلى الرؤية الحاسوبية، مما يتيح تقارباً أسرع وديناميكيات تدريب مستقرة للغاية.
- ProgLoss + STAL: تحقق وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية للتصوير الجوي والروبوتات.
- إزالة DFL: من خلال إزالة Distribution Focal Loss، يتم تبسيط رأس النموذج بشكل كبير، مما يؤدي إلى توافق أفضل عند التصدير إلى الأجهزة الطرفية القديمة أو المقيدة للغاية.
بالنسبة للفرق التي تنشر خطوط أنابيب متعددة المهام، يقدم YOLO26 أيضاً ترقيات خاصة بالمهام، مثل multi-scale proto للتجزئة وفقدان الزاوية المتخصص لـ صناديق الإحاطة الموجهة (OBB). لاستكشاف بدائل حديثة أخرى داخل النظام البيئي، يمكنك أيضاً مراجعة YOLO11 أو بنية YOLOv8.
خاتمة
يعتمد الاختيار بين EfficientDet وYOLOv5 بشكل كبير على هدف النشر الخاص بك. توفر EfficientDet نهج توسيع أنيق رياضياً ومناسب للاستدلال المكثف على السحابة. ومع ذلك، فإن تجربة المطورين المتفوقة لـ YOLOv5، وحلقات تدريب PyTorch السريعة للغاية، وقدرات النشر على الحافة المحسنة للغاية تجعلها الخيار المفضل للغالبية العظمى من تطبيقات العالم الحقيقي في الوقت الفعلي. من خلال الاستفادة من الأدوات الشاملة التي توفرها Ultralytics، يمكن للفرق تسريع وقت طرح منتجاتها في السوق وبناء أنظمة ذكاء اصطناعي عالية الاستجابة.