تخطي إلى المحتوى

EfficientDet مقابلYOLO: مقارنة تقنية بين هياكل الكشف عن الكائنات

عند إنشاء خطوط أنابيب قابلة للتطوير للرؤية الحاسوبية، يعد اختيار بنية النموذج المناسبة قرارًا حاسمًا يؤثر على كل من جدوى النشر ودقة الكشف. يقدم هذا الدليل مقارنة تقنية متعمقة بين بنيتين معروفتين في مجال التعرف البصري: EfficientDet وYOLO.

في حين أن كلا النموذجين قد أحدثا ابتكارات مهمة في مجال الكشف عن الأشياء، فإن التقدم السريع في مجال الذكاء الاصطناعي للرؤية قد مهد الطريق لمزيد من النظم البيئية المتكاملة. خلال هذا التحليل، سوف نستكشف الآليات الأساسية لهذه الشبكات القديمة مع توضيح الأسباب التي جعلت الحلول الحديثة مثل Ultralytics و Ultralytics معيارًا صناعيًا لبيئات الإنتاج.

EfficientDet: كشف الكائنات بكفاءة وقابلية للتوسع

تم تقديم EfficientDet من قبل باحثين في Google وقد تم تصميمه لتوسيع نطاق بنية النموذج بشكل منهجي مع الحفاظ على كفاءة عالية. وقد حقق ذلك من خلال الاستفادة من التوسع المركب عبر عمق الشبكة وعرضها ودقة الإدخال.

تفاصيل EfficientDet: المؤلفون: Mingxing Tan, Ruoming Pang, and Quoc V. Le
المنظمة: Google Brain
التاريخ: 2019-11-20
أرشيف: 1911.09070
GitHub: google/automl

الابتكارات المعمارية

المساهمة الرئيسية لـ EfficientDet هي شبكة هرم الميزات ثنائية الاتجاه (BiFPN). على عكس شبكات FPN التقليدية، تتيح BiFPN دمج الميزات متعددة المقاييس بسهولة وسرعة من خلال استخدام أوزان قابلة للتعلم لفهم أهمية الميزات المختلفة المدخلة. ويتم دمج ذلك مع العمود الفقري EfficientNet، مما ينتج عنه مجموعة من النماذج (من D0 إلى D7) التي يمكن توسيعها بشكل متوقع.

نقاط القوة والضعف

تكمن القوة الرئيسية لـ EfficientDet في كفاءة معلماته. بالنسبة للمهام التي تتطلب تعظيم متوسط الدقة (mAP) في بيئات السحابة شديدة التقييد، فإن طريقة القياس المركبة الخاصة به قابلة للتنبؤ بدرجة عالية. ومع ذلك، فإن EfficientDet معروف بتعقيده في التدريب من الصفر وغالبًا ما يتطلب ضبطًا كبيرًا للمعلمات الفائقة. علاوة على ذلك، فإن اعتماده الكبير على TensorFlow المحددة يجعل الانتقال إلى عمليات النشر المتطورة عبر ONNX TensorRT تعقيدًا مقارنة بقدرات التصدير المبسطة الموجودة في YOLO الحديثة.

تعرف على المزيد حول EfficientDet

DAMO-YOLO: البحث الآلي عن البنية قيد التنفيذ

يمثل DAMO-YOLO نهجًا مميزًا، حيث يستخدم البحث عن البنية العصبية (NAS) لتصميم هياكل شبكة مثلى تلقائيًا للاستدلال في الوقت الفعلي.

تفاصيل DAMO-YOLO: المؤلفون: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
المنظمة: مجموعة Alibaba
التاريخ: 2022-11-23
Arxiv: 2211.15444v2
GitHub: tinyvision/DAMO-YOLO

الابتكارات المعمارية

يقدم DAMO-YOLO العديد من التقنيات الجديدة. يستخدم عمودًا فقريًا تم إنشاؤه بواسطة NAS يسمى MAE-NAS، وشبكة RepGFPN فعالة لرقبته، وتصميم ZeroHead يقلل بشكل كبير من التكلفة الحسابية لـ رأس الكشف. علاوة على ذلك، يستخدم AlignedOTA لتعيين التسميات ويعتمد بشكل كبير على تعزيز تقطير المعرفة لزيادة أداء متغيراته الأصغر.

نقاط القوة والضعف

يتألق DAMO-YOLO في سرعات استدلاله على GPU، وهو مصمم خصيصًا للنشر على بنيات NVIDIA باستخدام TensorRT. فمن خلال التخلص من هياكل الرأس الثقيلة، يقدم النموذج تنبؤات بزمن استجابة منخفض. على العكس من ذلك، يمكن أن يجعل البحث التلقائي عن البنية هيكل النموذج غير شفاف ويصعب تصحيح الأخطاء يدويًا أو ضبطه بدقة لأجهزة الحافة المخصصة. على عكس Ultralytics YOLO11 متعدد الاستخدامات للغاية، يركز DAMO-YOLO بشكل أساسي على الكشف القياسي عن صناديق الإحاطة، ويفتقر إلى الدعم الأصلي للمهام المتقدمة مثل تقدير الوضعيات أو الكشف عن صناديق الإحاطة الموجهة (OBB) جاهزًا للاستخدام.

تعرف على المزيد حول DAMO-YOLO

مقارنة الأداء

فهم المفاضلات التجريبية أمر ضروري لاختيار النموذج. يقارن الجدول أدناه عائلة EfficientDetYOLO عبر مقاييس الأداء الحاسمة.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

تحليل البيانات

يحقق EfficientDet-d7 أعلى دقة نظرية ولكنه يتطلب قوة حوسبة هائلة، مما يجعله غير مناسب للذكاء الاصطناعي المتطور.YOLO TensorRT استثنائية، على الرغم من أنه يتطلب عمومًا معلمات أكثر من نماذج EfficientDet الأقل مستوى لتحقيق دقة مماثلة.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين EfficientDet وDAMO-YOLO على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار EfficientDet

يعد EfficientDet خيارًا قويًا لـ:

  • خطوط أنابيب Google Cloud و TPU: الأنظمة المدمجة بعمق مع واجهات برمجة تطبيقات Google Cloud Vision أو بنية TPU التحتية حيث يتمتع EfficientDet بتحسين أصلي.
  • بحث التحجيم المركب: قياس الأداء الأكاديمي الذي يركز على دراسة تأثيرات تحجيم عمق الشبكة وعرضها ودقتها المتوازن.
  • النشر على الأجهزة المحمولة عبر TFLite: المشاريع التي تتطلب بشكل خاص تصدير TensorFlow Lite لأجهزة Android أو أجهزة Linux المدمجة.

متى تختار DAMO-YOLO

يوصى بـ DAMO-YOLO لـ:

  • تحليلات الفيديو عالية الإنتاجية: معالجة تدفقات الفيديو عالية معدل الإطارات (FPS) على بنية تحتية ثابتة لوحدات معالجة الرسوميات (GPU) من NVIDIA حيث يكون معدل نقل الدفعة الواحدة هو المقياس الأساسي.
  • خطوط التصنيع الصناعية: سيناريوهات ذات قيود صارمة على زمن استجابة GPU على الأجهزة المخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
  • بحث في بحث البنية العصبية: دراسة تأثيرات البحث التلقائي عن البنية (MAE-NAS) والهياكل الخلفية المُعاد تحديد معلماتها بكفاءة على أداء detect.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
  • بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.

Ultralytics : تجاوز النماذج القديمة

في حينYOLO EfficientDet وYOLO رؤى أكاديمية قيّمة، يحتاج المطورون المعاصرون إلى أطر عمل توازن بين الأداء المتطور وراحة المطورين. وهنا تكمن تفوق Ultralytics .

سهولة استخدام ونظام بيئي لا مثيل لهما

غالبًا ما يؤدي نشر النماذج من مستودعات بحثية منفصلة ومخصصة بشكل كبير إلى كوابيس التكامل. توفر Ultralytics نظامًا بيئيًا موحدًا ومصانًا جيدًا بعمق مع وثائق شاملة وواجهة برمجة تطبيقات (API) بايثونية. سواء كنت تستخدم Google Colab للتدريب أو تقوم بالتصدير إلى CoreML للاستدلال على الأجهزة المحمولة، فإن مسار العمل يتطلب بضعة أسطر فقط من التعليمات البرمجية.

from ultralytics import YOLO

# Load the highly recommended YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Export the trained model to ONNX for production
model.export(format="onnx")

ثورة YOLO26

بالنسبة للمطورين الذين يقيّمون EfficientDet أوYOLO، يمثل Ultralytics الخطوة التطورية النهائية. تم إصداره في أوائل عام 2026، ويقدم قدرات تغير النموذج:

  • تصميم خالٍ من NMS وشامل: تم ابتكاره لأول مرة بواسطة YOLOv10، يلغي YOLO26 بشكل طبيعي الحاجة إلى معالجة قمع غير الحد الأقصى (NMS) اللاحقة. هذا يترجم إلى بنى نشر أبسط بكثير وزمن انتقال متسق عبر الأجهزة المتنوعة.
  • سرعة استدلال أسرع بنسبة تصل إلى 43% على الـ CPU: لعمليات النشر الطرفية التي تفتقر إلى وحدات GPU قوية—وهي سيناريوهات تعاني فيها DAMO-YOLO—تم تحسين YOLO26 بشكل كبير، مما يوفر تسريعًا هائلاً على وحدات CPU القياسية.
  • مُحسِّن MuSGD: لسد الفجوة بين ابتكارات نماذج اللغات الكبيرة (LLM) والرؤية الحاسوبية، يدمج YOLO26 مُحسِّن MuSGD (المستوحى من Moonshot AI)، مما يضمن تدريبًا مستقرًا بشكل لا يصدق وتقاربًا سريعًا مقارنةً بحلقات التدريب الهشة لـ EfficientDet.
  • إزالة DFL: تبسط إزالة Distribution Focal Loss عملية التصدير، مما يضمن توافقاً فائقاً مع وحدات التحكم الدقيقة منخفضة الطاقة وأجهزة Raspberry Pi.
  • ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات كبيرة في التعرف على الأجسام الصغيرة، وهو مجال تفشل فيه البنى القديمة تقليديًا.

كفاءة الذاكرة وتنوع المهام

على عكس نماذج المحولات أو شبكات NAS ذات الاندماج الكثيف، تتميز Ultralytics بكفاءة ذاكرة صارمة. فهي تستهلك CUDA أقل بشكل ملحوظ أثناء التدريب، مما يتيح التكرار السريع على الأجهزة الاستهلاكية.

علاوة على ذلك، في حين أن EfficientDet وYOLO بشكل صارم بمربعات الحدود، Ultralytics يدعم Ultralytics تقسيم المثيلات وتصنيف الصور ضمن نفس الإطار البديهي بالضبط. بالنسبة للمستخدمين الذين يحتفظون بمشاريع قديمة، Ultralytics YOLOv8 بديلاً قويًا وواسع الانتشار يستحق الاستكشاف.

الخلاصة

يتضمن اختيار بنية الرؤية الصحيحة الموازنة بين الأداء النظري الخام وواقع النشر. يقدم EfficientDet نهجًا رياضيًا أنيقًا للتحجيم، و DAMO-YOLO يوفر سرعات GPU خام مقنعة. ومع ذلك، بالنسبة للفرق التي تعطي الأولوية للتطوير السريع وعمليات النشر الموثوقة والميزات المتطورة، تتفوق نماذج Ultralytics بوضوح. من خلال الجمع بين الابتكارات مثل الاستدلال الخالي من NMS وتحسين MuSGD، تضمن YOLO26 أن مشاريع رؤية الكمبيوتر الخاصة بك مبنية على الأساس الأكثر قدرة وقابلية للصيانة وكفاءة المتاح اليوم.


تعليقات