تخطي إلى المحتوى

EfficientDet مقابل YOLOv10: تحليل تطور نماذج الكشف عن الأجسام

في مجال الرؤية الحاسوبية سريع التطور، يعد اختيار بنية الكشف عن الأجسام المناسبة أمراً بالغ الأهمية لتحقيق التوازن بين الدقة والكمون والكفاءة الحسابية. يقارن هذا الدليل التقني الشامل بين نموذجين مؤثرين للغاية: EfficientDet Google و YOLOv10من جامعة تسينغهوا. ورغم أن كلا النموذجين يمثلان قفزات كبيرة في مجال اكتشاف الأجسام، إلا أنهما يتعاملان مع تصميم البنية وتحسين النموذج من زوايا مختلفة تمامًا.

سنستكشف هياكلها الأساسية، ونراجع معايير الأداء على مجموعات البيانات القياسية مثل COCO ونناقش كيفية دمجها في خطوط إنتاج التعلم الآلي الحديثة، مع التركيز بشكل خاص على مزايا Ultralytics الشامل Ultralytics .

EfficientDet: رائد التدرج المركب

تم طرح EfficientDet في أواخر عام 2019، ووضع معيارًا جديدًا للكشف عن الكائنات القابل للتطوير والدقيق للغاية من خلال تقديم نهج مبدئي لتوسيع أبعاد الشبكة.

الابتكارات الرئيسية والهندسة المعمارية

تم بناء EfficientDet على أساس EfficientNet، مستفيدًا من شبكة هرمية ثنائية الاتجاه (BiFPN) مبتكرة. على عكس الشبكات الهرمية التقليدية (FPN) التي تجمع الميزات دون تمييز أهميتها، تستخدم BiFPN أوزانًا قابلة للتعلم لدمج الميزات متعددة المقاييس. وهذا يسمح للشبكة بالتعلم الفعال للميزات التي تساهم بشكل أكبر في التنبؤ النهائي. علاوة على ذلك، يستخدم EfficientDet طريقة قياس مركبة تقيس الدقة والعمق والعرض بشكل موحد للبنية الأساسية وشبكة الميزات وشبكات التنبؤ بالصندوق/الفئة في وقت واحد.

في حين أن EfficientDet لا يزال خيارًا قويًا للأنظمة القديمة المدمجة بعمق مع TensorFlow القديمة، إلا أنه يتطلب قدرًا كبيرًا من الذاكرة أثناء التدريب ويعتمد على نظام بيئي قديم قد يكون مرهقًا مقارنة بالأطر الحديثة والديناميكية.

تعرف على المزيد حول EfficientDet

YOLOv10: المبتكر NMS

صدر YOLOv10 في منتصف عام 2024، وأحدث تغييرًا YOLOv10 في نموذج الكشف عن الكائنات في الوقت الفعلي من خلال التخلص من الحاجة إلى تقنية Non-Maximum Suppression (NMS) أثناء المعالجة اللاحقة، مما أدى إلى تقليل زمن الاستدلال بشكل كبير.

الابتكارات الرئيسية والهندسة المعمارية

YOLOv10 استراتيجية مزدوجة التخصيص متسقة للتدريب NMS. من خلال استخدام تخصيصات التسميات من واحد إلى العديد ومن واحد إلى واحد أثناء التدريب، تتعلم الشبكة إنتاج مربعات حدودية متطابقة بشكل فريد دون الاعتماد على NMS التكرارات. يقلل تصميم النموذج الشامل الذي يحركه الكفاءة والدقة من التكرار الحسابي، مما يجعله مرشحًا ممتازًا لتطبيقات الحوسبة المتطورة وتدفق الفيديو منخفض التأخير. ويندمج بسلاسة في Ultralytics ، مما يمنح المطورين إمكانية الوصول إلى Python بسيطة للغاية.

تعرف على المزيد حول YOLOv10

تأثير NMS

بإزالة خطوة NMS، تضمن YOLOv10 سرعات استدلال متسقة بغض النظر عن عدد الكائنات التي يتم detect ها في المشهد، مما يلغي ارتفاعات زمن الوصول التي غالبًا ما تُرى في تطبيقات رؤية الكمبيوتر المزدحمة.

مقارنة الأداء: الدقة والسرعة والكفاءة

عند نشر النماذج في سيناريوهات واقعية، يجب على المطورين الموازنة بين متوسط الدقة (mAP) وعدد المعلمات والعمليات الحسابية (FLOPs). يوضح الجدول أدناه هذه المقاييس بالتفصيل عبر متغيرات التوسع لكلا النموذجين.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

ملاحظة: يتطلب متغير YOLOv10n عددًا أقل بكثير من المعلمات (2.3 مليون) ويحقق TensorRT أعلى بكثير (1.56 مللي ثانية) مقارنةً بالإصدارات السابقة من EfficientDet، مما يجعله أكثر ملاءمة للاستدلال في الوقت الفعلي في الإنتاج.

لماذا تختار Ultralytics النماذج؟

على الرغم من أن كلا النموذجين لهما أهمية تاريخية وهيكلية، إلا أن دمجهما في خطوط الأنابيب الحديثة قد يمثل تحديًا. وهنا تبرز أهمية Ultralytics . من خلال توفير نظام بيئي موحد، Ultralytics دورة الحياة بأكملها — من تعليق البيانات إلى النشر.

  1. سهولة الاستخدام: تقدم حزمة Ultralytics Python واجهة واحدة لـ تدريب النماذج والتحقق منها وتصديرها، مستبدلةً مئات الأسطر من التعليمات البرمجية المتكررة بأوامر موجزة.
  2. النظام البيئي والتنوع: بينما يتخصص EfficientDet بشكل كبير في الكشف، تمتد نماذج Ultralytics YOLO بشكل طبيعي إلى تجزئة الكائنات، وتقدير الوضعيات، وصناديق الإحاطة الموجهة (OBB)، والتصنيف.
  3. كفاءة التدريب: بالاستفادة من التقنيات المتطورة مثل التجميع التلقائي والتدريب الموزع، تتدرب نماذج Ultralytics بشكل أسرع وتستهلك ذاكرة CUDA أقل بكثير من معماريات المحولات الثقيلة أو معماريات TF متعددة الفروع الأقدم.

مثال برمجي: تدريب YOLOv10

يعد نشر YOLOv10 باستخدام Ultralytics أمرًا مباشرًا للغاية. يوضح مقتطف التعليمات البرمجية التالي كيفية تهيئة وتدريب وتقييم شبكة YOLOv10 بالكامل ضمن واجهة برمجة تطبيقات Python.

from ultralytics import YOLO

# Load a pre-trained YOLOv10 model (nano variant for edge speed)
model = YOLO("yolov10n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, batch=16)

# Evaluate the model on the validation set
metrics = model.val()

# Export the model to ONNX for production deployment
model.export(format="onnx")

حالات الاستخدام والتوصيات

يعتمد الاختيار بين EfficientDet وYOLOv10 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار EfficientDet

يعد EfficientDet خيارًا قويًا لـ:

  • خطوط أنابيب Google Cloud و TPU: الأنظمة المدمجة بعمق مع واجهات برمجة تطبيقات Google Cloud Vision أو بنية TPU التحتية حيث يتمتع EfficientDet بتحسين أصلي.
  • بحث التحجيم المركب: قياس الأداء الأكاديمي الذي يركز على دراسة تأثيرات تحجيم عمق الشبكة وعرضها ودقتها المتوازن.
  • النشر على الأجهزة المحمولة عبر TFLite: المشاريع التي تتطلب بشكل خاص تصدير TensorFlow Lite لأجهزة Android أو أجهزة Linux المدمجة.

متى تختار YOLOv10

يوصى YOLOv10 في الحالات التالية:

  • detect في الوقت الفعلي خالٍ من NMS: التطبيقات التي تستفيد من detect الشامل دون التثبيط غير الأقصى، مما يقلل من تعقيد النشر.
  • مقايضات متوازنة بين السرعة والدقة: المشاريع التي تتطلب توازنًا قويًا بين سرعة الاستدلال ودقة الكشف عبر مقاييس النماذج المختلفة.
  • تطبيقات زمن الاستجابة المتسق: سيناريوهات النشر التي تكون فيها أوقات الاستدلال المتوقعة حاسمة، مثل الروبوتات أو الأنظمة المستقلة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
  • بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.

المستقبل هنا: أدخل Ultralytics

بينما YOLOv10 التصميم الثوري NMS، تطورت هذه التكنولوجيا. تم إصدار Ultralytics في يناير 2026، وهو يمثل أحدث ما توصلت إليه تكنولوجيا الذكاء الاصطناعي في مجال الرؤية. فهو يجمع بين أفضل جوانب البنى السابقة، مثل YOLO11 و RT-DETR — في قوة فريدة ومحسّنة للغاية.

ميزة YOLO26

إذا كنت تبدأ مشروعًا جديدًا، فإننا نوصي بشدة بالترقية إلى YOLO26. فهو يوفر مرونة لا مثيل لها وسهولة في الاستخدام عبر Ultralytics .

أهم الإنجازات في YOLO26:

  • تصميم خالٍ من NMS وشامل: استنادًا إلى الأسس التي وضعها YOLOv10، فإن YOLO26 شامل بطبيعته، مما يبسط منطق النشر إلى الحد الأدنى.
  • استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): مع إزالة Distribution Focal Loss (DFL)، يقلل YOLO26 بشكل كبير من الحمل الحسابي، مما يجعله الملك بلا منازع لـأجهزة الذكاء الاصطناعي الحافي.
  • مُحسِّن MuSGD: يستعير YOLO26 ابتكارات من تدريب نماذج اللغة الكبيرة (LLM). بدمج استقرار SGD مع سرعة Muon، يتقارب بشكل أسرع وأكثر موثوقية من أي سلف.
  • ProgLoss + STAL: صيغ خسارة متفوقة تحل بفعالية المشكلات طويلة الأمد المتعلقة بـ detect الأجسام الصغيرة، وهو مجال عانى فيه EfficientDet تقليديًا.

تعرف على المزيد حول YOLO26

الخلاصة: مطابقة النماذج لحالات الاستخدام

يعتمد الاختيار بين هذه الشبكات في النهاية على قيود النشر الخاصة بك:

  • EfficientDet لا يزال موضوع اهتمام أكاديمي فيما يتعلق بالتحجيم المركب وهو مناسب للباحثين الذين يديرون أنظمة TensorFlow الحالية حيث يكون حجم وزن النموذج (على القرص) أكثر أهمية من سرعة التشغيل.
  • YOLOv10 يعد استثنائيًا للتطبيقات التي تتطلب زمن انتقال منخفض للغاية، مثل تتبع الكائنات المتعددة عالي السرعة ومراقبة حركة المرور، وذلك بفضل بنيته الرائدة الخالية من NMS.
  • YOLO26، مع ذلك، هو التوصية النهائية لمشاريع رؤية الكمبيوتر الحديثة، حيث يقدم أعلى توازن أداء مطلق من حيث الدقة، وبصمة ذاكرة ضئيلة، وتعدد استخدامات المهام، مدعومًا بالنظام البيئي القوي لـ Ultralytics.

تعليقات