EfficientDet مقابل DAMO-YOLO: مقارنة تقنية لبنيات اكتشاف الكائنات
عند بناء خطوط أنابيب رؤية حاسوبية قابلة للتوسع، يُعد اختيار بنية النموذج الصحيحة قراراً حاسماً يؤثر على كل من جدوى النشر ودقة الاكتشاف. يقدم هذا الدليل مقارنة تقنية متعمقة بين اثنتين من البنيات المعروفة في مجال التعرف البصري: EfficientDet وDAMO-YOLO.
على الرغم من أن كلا النموذجين قدما ابتكارات مهمة في مجال اكتشاف الكائنات، فإن التطور السريع في الذكاء الاصطناعي البصري مهد الطريق أمام أنظمة بيئية أكثر تكاملاً. طوال هذا التحليل، سنستكشف الآليات الأساسية لهذه الشبكات القديمة مع توضيح سبب كون الحلول الحديثة مثل منصة Ultralytics وUltralytics YOLO26 قد أصبحت المعيار الصناعي لبيئات الإنتاج.
EfficientDet: اكتشاف كائنات قابل للتوسع وفعال
تم تصميم EfficientDet، الذي قدمه باحثون في Google، لتوسيع بنية النموذج بشكل منهجي مع الحفاظ على كفاءة عالية. وقد حقق ذلك من خلال الاستفادة من التحجيم المركب عبر عمق الشبكة، وعرضها، ودقة الإدخال.
تفاصيل EfficientDet:
المؤلفون: Mingxing Tan، وRuoming Pang، وQuoc V. Le
المؤسسة: Google Brain
التاريخ: 2019-11-20
Arxiv: 1911.09070
GitHub: google/automl
الابتكارات المعمارية
تتمثل المساهمة الأساسية لـ EfficientDet في شبكة الهرم الميزات ثنائية الاتجاه (BiFPN). على عكس شبكات FPN التقليدية، تسمح BiFPN بدمج ميزات متعددة المقاييس بسهولة وسرعة من خلال استخدام أوزان قابلة للتعلم لفهم أهمية ميزات الإدخال المختلفة. ويقترن هذا بـ العمود الفقري الخاص بـ EfficientNet، مما ينتج عنه عائلة من النماذج (من D0 إلى D7) التي تتوسع بشكل يمكن التنبؤ به.
نقاط القوة والضعف
تكمن القوة الرئيسية لـ EfficientDet في كفاءة معاملاتها. بالنسبة للمهام التي تتطلب زيادة متوسط الدقة (mAP) إلى الحد الأقصى في بيئات سحابية مقيدة للغاية، فإن طريقة التحجيم المركب الخاصة بها يمكن التنبؤ بها بشكل كبير. ومع ذلك، فإن EfficientDet معقدة للغاية عند التدريب من الصفر وغالباً ما تتطلب قدراً كبيراً من ضبط المعلمات الفائقة. علاوة على ذلك، فإن اعتمادها الكبير على عمليات TensorFlow المحددة يجعل الانتقال إلى عمليات النشر على الحافة عبر ONNX أو TensorRT أكثر صعوبة مقارنة بـ قدرات التصدير المبسطة الموجودة في نماذج YOLO الحديثة.
تعرف على المزيد حول EfficientDet
DAMO-YOLO: البحث التلقائي عن البنية في العمل
يمثل DAMO-YOLO نهجاً متميزاً، حيث يستخدم البحث عن بنية الشبكة العصبية (NAS) لتصميم هياكل شبكة مثالية تلقائياً للاستدلال في الوقت الفعلي.
تفاصيل DAMO-YOLO:
المؤلفون: Xianzhe Xu، وYiqi Jiang، وWeihua Chen، وYilun Huang، وYuan Zhang، وXiuyu Sun
المؤسسة: Alibaba Group
التاريخ: 2022-11-23
Arxiv: 2211.15444v2
GitHub: tinyvision/DAMO-YOLO
الابتكارات المعمارية
يقدم DAMO-YOLO العديد من التقنيات الجديدة. فهو يستخدم عموداً فقرياً تم إنشاؤه بواسطة NAS يسمى MAE-NAS، وشبكة RepGFPN فعالة للرقبة، وتصميماً من نوع ZeroHead يقلل بشكل كبير من التكلفة الحسابية لـ رأس الاكتشاف. علاوة على ذلك، فإنه يستخدم AlignedOTA لتعيين التسميات ويعتمد بشكل كبير على تعزيز تقطير المعرفة لرفع أداء متغيراته الأصغر.
نقاط القوة والضعف
يتألق DAMO-YOLO في سرعات استدلال GPU، وهو مصمم خصيصاً للنشر على بنى NVIDIA باستخدام TensorRT. من خلال إزالة هياكل الرأس الثقيلة، يقدم النموذج تنبؤات ذات زمن انتقال منخفض. وعلى العكس من ذلك، يمكن للبحث التلقائي عن البنية أن يجعل هيكل النموذج غامضاً ويصعب تصحيحه أو ضبطه يدوياً لأجهزة الحافة المخصصة. وعلى عكس Ultralytics YOLO11 متعدد الاستخدامات، يركز DAMO-YOLO بشكل أساسي على اكتشاف صناديق الإحاطة القياسية، ويفتقر إلى الدعم الأصلي للمهام المتقدمة مثل تقدير الوضعية أو اكتشاف صناديق الإحاطة الموجهة (OBB) بشكل جاهز.
مقارنة الأداء
يعد فهم المقايضات التجريبية أمراً ضرورياً لاختيار النموذج. يقارن الجدول أدناه عائلة EfficientDet بسلسلة DAMO-YOLO عبر مقاييس الأداء الحاسمة.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ملي ثانية) | السرعة T4 TensorRT10 (ملي ثانية) | المعلمات (مليون) | FLOPs (مليار) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
EfficientDet-d7 achieves the highest theoretical accuracy but requires immense compute power, making it unsuitable for edge AI. DAMO-YOLO offers exceptional TensorRT speeds, though it generally requires more parameters than the lower-tier EfficientDet models to achieve comparable accuracy.
حالات الاستخدام والتوصيات
يعتمد الاختيار بين EfficientDet وDAMO-YOLO على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
متى تختار EfficientDet
تعد EfficientDet خياراً قوياً لـ:
- خطوط أنابيب Google Cloud وTPU: الأنظمة المتكاملة بعمق مع واجهات برمجة تطبيقات Google Cloud Vision أو البنية التحتية لـ TPU حيث يتمتع EfficientDet بتحسين أصلي.
- أبحاث التحجيم المركب: قياس الأداء الأكاديمي الذي يركز على دراسة تأثيرات التوازن في عمق الشبكة، وعرضها، وتحجيم الدقة.
- النشر على الأجهزة المحمولة عبر TFLite: المشاريع التي تتطلب بشكل خاص تصدير TensorFlow Lite لأجهزة Android أو أجهزة Linux المدمجة.
متى تختار DAMO-YOLO
يُنصح بـ DAMO-YOLO من أجل:
- تحليلات الفيديو عالية الإنتاجية: معالجة تدفقات الفيديو عالية معدل الإطارات على بنية تحتية ثابتة لـ NVIDIA GPU حيث تعد إنتاجية الدفعة 1 المقياس الأساسي.
- خطوط التصنيع الصناعية: سيناريوهات ذات قيود زمن انتقال صارمة لوحدة معالجة الرسومات على أجهزة مخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
- أبحاث البحث عن البنية العصبية: دراسة تأثيرات البحث المؤتمت عن البنية (MAE-NAS) والهياكل الأساسية المعاد معلمات ذات الكفاءة على أداء الكشف.
متى تختار Ultralytics (YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطورين:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استدلالاً ثابتاً ومنخفض التأخير دون تعقيد المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئات تعتمد فقط على CPU: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث توفر سرعة استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
ميزة Ultralytics: التقدم إلى ما بعد النماذج القديمة
بينما توفر EfficientDet وDAMO-YOLO رؤى أكاديمية قيمة، يحتاج المطورون المعاصرون إلى أطر عمل توازن بين أداء الحالة الراهنة وبيئة العمل الخاصة بالمطور. وهنا تبرز نظام Ultralytics البيئي.
سهولة استخدام لا مثيل لها ونظام بيئي متكامل
غالباً ما يؤدي نشر النماذج من مستودعات أبحاث منفصلة ومخصصة بشكل كبير إلى كوابيس في التكامل. توفر Ultralytics نظاماً بيئياً موحداً ومُداراً بشكل جيد مع وثائق واسعة النطاق وواجهة برمجة تطبيقات (API) برمجية بلغة Python. سواء كنت تستخدم Google Colab للتدريب أو تصدر النتائج إلى CoreML للاستدلال على الهاتف المحمول، يتطلب خط الأنابيب بضعة أسطر فقط من التعليمات البرمجية.
from ultralytics import YOLO
# Load the highly recommended YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX for production
model.export(format="onnx")ثورة YOLO26
بالنسبة للمطورين الذين يقيمون EfficientDet أو DAMO-YOLO، يمثل Ultralytics YOLO26 الخطوة التطورية النهائية. تم إصداره في أوائل عام 2026، ويقدم قدرات تغير النموذج الفكري:
- تصميم من طرف إلى طرف خالٍ من NMS: كان YOLOv10 رائداً فيه، ويقوم YOLO26 أصلاً بإلغاء الحاجة إلى معالجة ما بعد Non-Maximum Suppression (NMS). يترجم هذا إلى بنيات نشر أبسط بكثير وزمن انتقال ثابت عبر الأجهزة المتنوعة.
- سرعة استدلال CPU تصل إلى 43%: بالنسبة لعمليات النشر على الحافة التي تفتقر إلى وحدات GPU قوية—وهي سيناريوهات يعاني فيها DAMO-YOLO—يتم تحسين YOLO26 بشكل كبير، مما يوفر سرعات هائلة على وحدات CPU القياسية.
- محسن MuSGD: لسد الفجوة بين ابتكارات النماذج اللغوية الكبيرة (LLM) والرؤية الحاسوبية، يدمج YOLO26 محسن MuSGD (المستوحى من Moonshot AI)، مما يضمن تدريباً مستقراً بشكل لا يصدق وتقارباً سريعاً مقارنة بدورات التدريب الهشة لـ EfficientDet.
- إزالة DFL: تبسط إزالة Distribution Focal Loss عملية التصدير، مما يضمن توافقاً فائقاً مع المتحكمات الدقيقة منخفضة الطاقة وأجهزة Raspberry Pi.
- ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات درامية في التعرف على الكائنات الصغيرة، وهي منطقة تفشل فيها البنيات الأقدم تقليدياً.
كفاءة الذاكرة وتعدد استخدامات المهام
Unlike transformer models or heavily fused NAS networks, Ultralytics models are characterized by their stringent memory efficiency. They consume remarkably lower CUDA memory during training, enabling rapid iteration on consumer-grade hardware.
علاوة على ذلك، في حين أن EfficientDet وDAMO-YOLO مقيدان بصرامة بصناديق الإحاطة، فإن Ultralytics تدعم أصلاً تجزئة الكائنات وتصنيف الصور داخل نفس إطار العمل البديهي. للمستخدمين الذين يحتفظون بمشاريع أقدم، يظل Ultralytics YOLOv8 بديلاً قوياً ومُنشرًا على نطاق واسع يستحق الاستكشاف.
خاتمة
يتضمن اختيار بنية الرؤية الصحيحة موازنة الأداء النظري الخام مقابل واقع النشر. يقدم EfficientDet نهج تحجيم رياضياً أنيقاً، ويقدم DAMO-YOLO سرعات GPU خام مقنعة. ومع ذلك، بالنسبة للفرق التي تعطي الأولوية للتطوير السريع، وعمليات النشر الموثوقة، والميزات المتطورة، تبرز نماذج Ultralytics بوضوح في المقدمة. من خلال الجمع بين ابتكارات مثل الاستدلال الخالي من NMS وتحسين MuSGD، يضمن YOLO26 بناء مشاريع الرؤية الحاسوبية الخاصة بك على أكثر الأسس قدرة وقابلية للصيانة وفعالية المتاحة اليوم.