EfficientDet مقابل YOLOv10: تحليل تطور نماذج الكشف عن الأجسام
في مجال الرؤية الحاسوبية سريع التطور، يعد اختيار بنية الكشف عن الأجسام المناسبة أمراً بالغ الأهمية لتحقيق التوازن بين الدقة والكمون والكفاءة الحسابية. يقارن هذا الدليل التقني الشامل بين نموذجين مؤثرين للغاية: EfficientDet Google و YOLOv10من جامعة تسينغهوا. ورغم أن كلا النموذجين يمثلان قفزات كبيرة في مجال اكتشاف الأجسام، إلا أنهما يتعاملان مع تصميم البنية وتحسين النموذج من زوايا مختلفة تمامًا.
سنستكشف هياكلها الأساسية، ونراجع معايير الأداء على مجموعات البيانات القياسية مثل COCO ونناقش كيفية دمجها في خطوط إنتاج التعلم الآلي الحديثة، مع التركيز بشكل خاص على مزايا Ultralytics الشامل Ultralytics .
EfficientDet: رائد التدرج المركب
تم طرح EfficientDet في أواخر عام 2019، ووضع معيارًا جديدًا للكشف عن الكائنات القابل للتطوير والدقيق للغاية من خلال تقديم نهج مبدئي لتوسيع أبعاد الشبكة.
الابتكارات الرئيسية والهندسة المعمارية
- المؤلفون: مينغشينغ تان، رومينغ بانغ، وكوك ف. لي
- المؤسسة:Google Brain
- التاريخ: 2019-11-20
- أرشيف:https://arxiv.org/abs/1911.09070
- GitHub:مستودع EfficientDet
تم بناء EfficientDet على أساس EfficientNet، مستفيدًا من شبكة هرمية ثنائية الاتجاه (BiFPN) مبتكرة. على عكس الشبكات الهرمية التقليدية (FPN) التي تجمع الميزات دون تمييز أهميتها، تستخدم BiFPN أوزانًا قابلة للتعلم لدمج الميزات متعددة المقاييس. وهذا يسمح للشبكة بالتعلم الفعال للميزات التي تساهم بشكل أكبر في التنبؤ النهائي. علاوة على ذلك، يستخدم EfficientDet طريقة قياس مركبة تقيس الدقة والعمق والعرض بشكل موحد للبنية الأساسية وشبكة الميزات وشبكات التنبؤ بالصندوق/الفئة في وقت واحد.
في حين أن EfficientDet لا يزال خيارًا قويًا للأنظمة القديمة المدمجة بعمق مع TensorFlow القديمة، إلا أنه يتطلب قدرًا كبيرًا من الذاكرة أثناء التدريب ويعتمد على نظام بيئي قديم قد يكون مرهقًا مقارنة بالأطر الحديثة والديناميكية.
تعرف على المزيد حول EfficientDet
YOLOv10: المبتكر NMS
صدر YOLOv10 في منتصف عام 2024، وأحدث تغييرًا YOLOv10 في نموذج الكشف عن الكائنات في الوقت الفعلي من خلال التخلص من الحاجة إلى تقنية Non-Maximum Suppression (NMS) أثناء المعالجة اللاحقة، مما أدى إلى تقليل زمن الاستدلال بشكل كبير.
الابتكارات الرئيسية والهندسة المعمارية
- المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
- المؤسسة:جامعة تسينغ - هوا
- التاريخ: 2024-05-23
- أرشيف:https://arxiv.org/abs/2405.14458
- GitHub:مستودع YOLOv10
YOLOv10 استراتيجية مزدوجة التخصيص متسقة للتدريب NMS. من خلال استخدام تخصيصات التسميات من واحد إلى العديد ومن واحد إلى واحد أثناء التدريب، تتعلم الشبكة إنتاج مربعات حدودية متطابقة بشكل فريد دون الاعتماد على NMS التكرارات. يقلل تصميم النموذج الشامل الذي يحركه الكفاءة والدقة من التكرار الحسابي، مما يجعله مرشحًا ممتازًا لتطبيقات الحوسبة المتطورة وتدفق الفيديو منخفض التأخير. ويندمج بسلاسة في Ultralytics ، مما يمنح المطورين إمكانية الوصول إلى Python بسيطة للغاية.
تأثير NMS
من خلال إزالة NMS YOLOv10 سرعات استدلال متسقة بغض النظر عن عدد الكائنات المكتشفة في المشهد، مما يزيل ارتفاعات زمن الاستجابة التي غالبًا ما تظهر في تطبيقات الرؤية الحاسوبية المزدحمة.
مقارنة الأداء: الدقة والسرعة والكفاءة
عند نشر النماذج في سيناريوهات واقعية، يجب على المطورين الموازنة بين متوسط الدقة (mAP) وعدد المعلمات والعمليات الحسابية (FLOPs). يوضح الجدول أدناه هذه المقاييس بالتفصيل عبر متغيرات التوسع لكلا النموذجين.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
ملاحظة: يتطلب متغير YOLOv10n عددًا أقل بكثير من المعلمات (2.3 مليون) ويحقق TensorRT أعلى بكثير (1.56 مللي ثانية) مقارنةً بالإصدارات السابقة من EfficientDet، مما يجعله أكثر ملاءمة للاستدلال في الوقت الفعلي في الإنتاج.
لماذا تختار Ultralytics النماذج؟
على الرغم من أن كلا النموذجين لهما أهمية تاريخية وهيكلية، إلا أن دمجهما في خطوط الأنابيب الحديثة قد يمثل تحديًا. وهنا تبرز أهمية Ultralytics . من خلال توفير نظام بيئي موحد، Ultralytics دورة الحياة بأكملها — من تعليق البيانات إلى النشر.
- سهولة الاستخدام: توفرPython Ultralytics Python واجهة واحدة لتدريب النماذج والتحقق من صحتها وتصديرها، لتحل محل مئات الأسطر من التعليمات البرمجية النمطية بأوامر موجزة.
- النظام البيئي والتنوع: في حين أن EfficientDet متخصص بشكل كبير في الكشف، فإنYOLO Ultralytics YOLO تمتد بشكل طبيعي إلى تقسيم الحالات، وتقدير الوضع، والمربعات المحددة الاتجاه (OBB)، والتصنيف.
- كفاءة التدريب: من خلال الاستفادة من التقنيات المتطورة مثل التجميع التلقائي والتدريب الموزع، يتم تدريب Ultralytics بشكل أسرع وتستهلك CUDA أقل بكثير من المحولات الثقيلة أو TF متعددة الفروع القديمة.
مثال على الكود: تدريب YOLOv10
Ultralytics نشر YOLOv10 Ultralytics في غاية السهولة. يوضح مقتطف الشفرة التالي كيفية تهيئة YOLOv10 وتدريبها وتقييمها بالكامل داخل Python .
from ultralytics import YOLO
# Load a pre-trained YOLOv10 model (nano variant for edge speed)
model = YOLO("yolov10n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, batch=16)
# Evaluate the model on the validation set
metrics = model.val()
# Export the model to ONNX for production deployment
model.export(format="onnx")
حالات الاستخدام والتوصيات
YOLOv10 الاختيار بين EfficientDet و YOLOv10 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار EfficientDet
يعد EfficientDet خيارًا قويًا لـ:
- Google و TPU : أنظمة متكاملة بشكل عميق مع واجهات برمجة تطبيقات Google Vision أو TPU حيث يتمتع EfficientDet بتحسين أصلي.
- أبحاث التوسع المركب: مقارنة أكاديمية تركز على دراسة آثار التوازن بين عمق الشبكة وعرضها وتوسع الدقة.
- النشر عبر الأجهزة المحمولة باستخدام TFLite: المشاريع التي تتطلب بشكل خاص تصدير TensorFlow لأجهزة Android أجهزة Linux المدمجة.
متى تختار YOLOv10
يوصى YOLOv10 في الحالات التالية:
- الكشف في الوقت الفعليNMS: تطبيقات تستفيد من الكشف الشامل بدون قمع غير أقصى، مما يقلل من تعقيد النشر.
- التوازن بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر نماذج مختلفة.
- تطبيقات ذات زمن انتقال ثابت: سيناريوهات النشر التي يكون فيها زمن الاستدلال المتوقع أمرًا بالغ الأهمية، مثل الروبوتات أو الأنظمة المستقلة.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
- كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.
المستقبل هنا: أدخل Ultralytics
بينما YOLOv10 التصميم الثوري NMS، تطورت هذه التكنولوجيا. تم إصدار Ultralytics في يناير 2026، وهو يمثل أحدث ما توصلت إليه تكنولوجيا الذكاء الاصطناعي في مجال الرؤية. فهو يجمع بين أفضل جوانب البنى السابقة، مثل YOLO11 و RT-DETR — في قوة فريدة ومحسّنة للغاية.
ميزة YOLO26
إذا كنت تبدأ مشروعًا جديدًا، فإننا نوصي بشدة بالترقية إلى YOLO26. فهو يوفر مرونة لا مثيل لها وسهولة في الاستخدام عبر Ultralytics .
أهم الإنجازات في YOLO26:
- تصميم شامل NMS: بناءً على الأسس التي أرساها YOLOv10، يتميز YOLO26 بطبيعته الشاملة، مما يبسط منطق النشر إلى الحد الأدنى.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : مع إزالة Distribution Focal Loss (DFL)، يقلل YOLO26 بشكل كبير من الأعباء الحسابية، مما يجعله الملك بلا منازع لأجهزة الذكاء الاصطناعي المتطورة.
- MuSGD Optimizer: يستعير YOLO26 الابتكارات من تدريب نموذج اللغة الكبيرة (LLM). من خلال دمج استقرار SGD سرعة Muon، فإنه يتقارب بشكل أسرع وأكثر موثوقية من أي سابق له.
- ProgLoss + STAL: تعمل تركيبات الخسارة الفائقة على حل المشكلات طويلة الأمد المتعلقة باكتشاف الأجسام الصغيرة، وهو مجال كان EfficientDet يعاني فيه تقليديًا.
الخلاصة: مطابقة النماذج مع حالات الاستخدام
يعتمد الاختيار بين هذه الشبكات في النهاية على قيود النشر لديك:
- يظل EfficientDet موضوعًا مهمًا من الناحية الأكاديمية فيما يتعلق بتحجيم المركبات، وهو مناسب للباحثين الذين يحافظون على TensorFlow الحالية حيث يكون حجم وزن النموذج (على القرص) أكثر أهمية من سرعة وقت التشغيل.
- YOLOv10 رائع للتطبيقات التي تتطلب زمن انتقال منخفض للغاية، مثل تتبع الأجسام المتعددة بسرعة عالية ومراقبة حركة المرور، وذلك بفضل بنيته الرائدة NMS.
- ومع ذلك، فإن YOLO26 هو الخيار الأمثل لمشاريع الرؤية الحاسوبية الحديثة، حيث يوفر أعلى مستوى من التوازن بين الأداء والدقة، وأقل استهلاك للذاكرة، وتعدد المهام المدعوم Ultralytics القوي.