EfficientDet مقابلYOLO: مقارنة تقنية بين هياكل الكشف عن الكائنات
عند إنشاء خطوط أنابيب قابلة للتطوير للرؤية الحاسوبية، يعد اختيار بنية النموذج المناسبة قرارًا حاسمًا يؤثر على كل من جدوى النشر ودقة الكشف. يقدم هذا الدليل مقارنة تقنية متعمقة بين بنيتين معروفتين في مجال التعرف البصري: EfficientDet وYOLO.
في حين أن كلا النموذجين قد أحدثا ابتكارات مهمة في مجال الكشف عن الأشياء، فإن التقدم السريع في مجال الذكاء الاصطناعي للرؤية قد مهد الطريق لمزيد من النظم البيئية المتكاملة. خلال هذا التحليل، سوف نستكشف الآليات الأساسية لهذه الشبكات القديمة مع توضيح الأسباب التي جعلت الحلول الحديثة مثل Ultralytics و Ultralytics معيارًا صناعيًا لبيئات الإنتاج.
EfficientDet: كشف الكائنات بكفاءة وقابلية للتوسع
تم تقديم EfficientDet من قبل باحثين في Google وقد تم تصميمه لتوسيع نطاق بنية النموذج بشكل منهجي مع الحفاظ على كفاءة عالية. وقد حقق ذلك من خلال الاستفادة من التوسع المركب عبر عمق الشبكة وعرضها ودقة الإدخال.
تفاصيل EfficientDet:
المؤلفون: Mingxing Tan و Ruoming Pang و Quoc V. Le
المنظمة: Google
التاريخ: 2019-11-20
Arxiv: 1911.09070
GitHub: google
الابتكارات المعمارية
المساهمة الرئيسية لـ EfficientDet هي شبكة هرم الميزات ثنائية الاتجاه (BiFPN). على عكس شبكات FPN التقليدية، تتيح BiFPN دمج الميزات متعددة المقاييس بسهولة وسرعة من خلال استخدام أوزان قابلة للتعلم لفهم أهمية الميزات المختلفة المدخلة. ويتم دمج ذلك مع العمود الفقري EfficientNet، مما ينتج عنه مجموعة من النماذج (من D0 إلى D7) التي يمكن توسيعها بشكل متوقع.
نقاط القوة والضعف
تكمن القوة الرئيسية لـ EfficientDet في كفاءة معلماته. بالنسبة للمهام التي تتطلب تعظيم متوسط الدقة (mAP) في بيئات السحابة شديدة التقييد، فإن طريقة القياس المركبة الخاصة به قابلة للتنبؤ بدرجة عالية. ومع ذلك، فإن EfficientDet معروف بتعقيده في التدريب من الصفر وغالبًا ما يتطلب ضبطًا كبيرًا للمعلمات الفائقة. علاوة على ذلك، فإن اعتماده الكبير على TensorFlow المحددة يجعل الانتقال إلى عمليات النشر المتطورة عبر ONNX TensorRT تعقيدًا مقارنة بقدرات التصدير المبسطة الموجودة في YOLO الحديثة.
تعرف على المزيد حول EfficientDet
YOLO: البحث الآلي عن الهندسة المعمارية في العمل
YOLO نهجًا متميزًا، حيث يستخدم البحث في البنية العصبية (NAS) لتصميم هياكل شبكات مثالية تلقائيًا للاستدلال في الوقت الفعلي.
YOLO :
المؤلفون: Xianzhe Xu، Yiqi Jiang، Weihua Chen، Yilun Huang، Yuan Zhang، و Xiuyu Sun
المنظمة: Alibaba Group
التاريخ: 2022-11-23
Arxiv: 2211.15444v2
GitHub: YOLO
الابتكارات المعمارية
YOLO عدة تقنيات جديدة. فهو يستخدم شبكة أساسية مولدة بواسطة NAS تسمى MAE-NAS، وشبكة RepGFPN فعالة لرقبته، وتصميم ZeroHead الذي يقلل بشكل كبير من التكلفة الحسابية لرأس الكشف. علاوة على ذلك، يستخدم AlignedOTA لتعيين التسميات ويعتمد بشكل كبير على تحسين تقطير المعرفة لتعزيز أداء متغيراته الأصغر حجماً.
نقاط القوة والضعف
YOLO بسرعات GPU ، وهي مصممة خصيصًا للنشر على NVIDIA باستخدام TensorRT. من خلال التخلص من الهياكل الثقيلة، يقدم النموذج تنبؤات منخفضة الكمون. على العكس من ذلك، يمكن أن يؤدي البحث الآلي عن البنية إلى جعل بنية النموذج غير شفافة ويصعب تصحيحها يدويًا أو ضبطها بدقة للأجهزة الطرفية المخصصة. على عكس Ultralytics YOLO11،YOLO بشكل أساسي على الكشف القياسي عن المربعات المحددة، ويفتقر إلى الدعم الأصلي للمهام المتقدمة مثل تقدير الوضع أو الكشف عن المربعات المحددة الموجهة (OBB) بشكل فوري.
مقارنة الأداء
فهم المفاضلات التجريبية أمر ضروري لاختيار النموذج. يقارن الجدول أدناه عائلة EfficientDetYOLO عبر مقاييس الأداء الحاسمة.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
تحليل البيانات
يحقق EfficientDet-d7 أعلى دقة نظرية ولكنه يتطلب قوة حوسبة هائلة، مما يجعله غير مناسب للذكاء الاصطناعي المتطور.YOLO TensorRT استثنائية، على الرغم من أنه يتطلب عمومًا معلمات أكثر من نماذج EfficientDet الأقل مستوى لتحقيق دقة مماثلة.
حالات الاستخدام والتوصيات
YOLO الاختيار بين EfficientDet وYOLO على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار EfficientDet
يعد EfficientDet خيارًا قويًا لـ:
- Google و TPU : أنظمة متكاملة بشكل عميق مع واجهات برمجة تطبيقات Google Vision أو TPU حيث يتمتع EfficientDet بتحسين أصلي.
- أبحاث التوسع المركب: مقارنة أكاديمية تركز على دراسة آثار التوازن بين عمق الشبكة وعرضها وتوسع الدقة.
- النشر عبر الأجهزة المحمولة باستخدام TFLite: المشاريع التي تتطلب بشكل خاص تصدير TensorFlow لأجهزة Android أجهزة Linux المدمجة.
متى تختار DAMO-YOLO
YOLO في الحالات التالية:
- تحليلات الفيديو عالية الإنتاجية: معالجة تدفقات الفيديو عالية معدل الإطارات في الثانية علىGPU NVIDIA GPU الثابتة حيث يكون إنتاجية الدفعة 1 هو المقياس الأساسي.
- خطوط التصنيع الصناعي: سيناريوهات ذات قيود صارمة GPU على الأجهزة المخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
- أبحاث البحث عن البنية العصبية: دراسة تأثيرات البحث الآلي عن البنية (MAE-NAS) والبنى الأساسية المعاد معايرتها بكفاءة على أداء الكشف.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
- كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.
Ultralytics : تجاوز النماذج القديمة
في حينYOLO EfficientDet وYOLO رؤى أكاديمية قيّمة، يحتاج المطورون المعاصرون إلى أطر عمل توازن بين الأداء المتطور وراحة المطورين. وهنا تكمن تفوق Ultralytics .
سهولة استخدام ونظام بيئي لا مثيل لهما
غالبًا ما يؤدي نشر النماذج من مستودعات بحثية منفصلة ومخصصة بشكل كبير إلى كوابيس التكامل. Ultralytics نظامًا بيئيًا موحدًا ومُحافظًا عليه جيدًا مع وثائق شاملة وواجهة برمجة تطبيقات بيثونية. سواء كنت تستخدم Google للتدريب أو التصدير إلى CoreML للاستدلال على الأجهزة المحمولة، لا يتطلب خط الأنابيب سوى بضع أسطر من التعليمات البرمجية.
from ultralytics import YOLO
# Load the highly recommended YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX for production
model.export(format="onnx")
ثورة YOLO26
بالنسبة للمطورين الذين يقيّمون EfficientDet أوYOLO، يمثل Ultralytics الخطوة التطورية النهائية. تم إصداره في أوائل عام 2026، ويقدم قدرات تغير النموذج:
- تصميم شامل NMS: ابتكرته لأول مرة YOLOv10، يلغي YOLO26 بشكل أساسي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يترجم إلى بنى نشر أبسط بكثير ووقت استجابة ثابت عبر أجهزة متنوعة.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : بالنسبة لعمليات النشر المتطورة التي تفتقر إلى وحدات معالجة رسومات قوية — وهي السيناريوهات التيYOLO — تم تحسين YOLO26 بشكل كبير، مما يوفر سرعة هائلة على وحدات المعالجة المركزية القياسية.
- محسّن MuSGD: لسد الفجوة بين ابتكارات LLM والرؤية الحاسوبية، يدمج YOLO26 محسّن MuSGD (المستوحى من Moonshot AI)، مما يضمن تدريبًا مستقرًا للغاية وتقاربًا سريعًا مقارنةً بدورات التدريب الهشة في EfficientDet.
- إزالة DFL: تعمل إزالة فقدان بؤرة التوزيع على تبسيط عملية التصدير، مما يضمن توافقًا فائقًا مع وحدات التحكم الدقيقة منخفضة الطاقة وأجهزة Raspberry Pi.
- ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات كبيرة في التعرف على الأجسام الصغيرة، وهو مجال كانت فيه البنى القديمة تفشل عادةً.
كفاءة الذاكرة وتنوع المهام
على عكس نماذج المحولات أو شبكات NAS ذات الاندماج الكثيف، تتميز Ultralytics بكفاءة ذاكرة صارمة. فهي تستهلك CUDA أقل بشكل ملحوظ أثناء التدريب، مما يتيح التكرار السريع على الأجهزة الاستهلاكية.
علاوة على ذلك، في حين أن EfficientDet وYOLO بشكل صارم بمربعات الحدود، Ultralytics يدعم Ultralytics تقسيم المثيلات وتصنيف الصور ضمن نفس الإطار البديهي بالضبط. بالنسبة للمستخدمين الذين يحتفظون بمشاريع قديمة، Ultralytics YOLOv8 بديلاً قويًا وواسع الانتشار يستحق الاستكشاف.
الخلاصة
يتطلب اختيار بنية الرؤية المناسبة موازنة الأداء النظري الخام مع واقع النشر. تقدم EfficientDet نهجًا رياضيًا أنيقًا للتوسع، بينماYOLO GPU أولية مذهلة. ومع ذلك، بالنسبة للفرق التي تعطي الأولوية للتطوير السريع والنشر الموثوق والميزات المتطورة، فإن Ultralytics تتفوق بوضوح. من خلال الجمع بين ابتكارات مثل الاستدلال NMS وتحسين MuSGD، تضمن YOLO26 أن مشاريع الرؤية الحاسوبية الخاصة بك مبنية على الأساس الأكثر قدرة وقابلية للصيانة وكفاءة المتاح اليوم.