EfficientDet مقابل YOLOv6.0: دليل شامل لاكتشاف الأجسام الصناعية
يعد اختيار بنية الشبكة العصبية المناسبة حجر الزاوية لأي مبادرة ناجحة في مجال الرؤية الحاسوبية. يقدم هذا التحليل المتعمق مقارنة تقنية عالية المستوى بين نموذجين محوريين في مجال اكتشاف الأجسام: EfficientDet Google و YOLOv6. YOLOv6 من Meituan.
في حين أن كلا البنيتين شكلتا قفزة كبيرة إلى الأمام عند إصدارهما، إلا أن التطور السريع للذكاء الاصطناعي أدى إلى ظهور حلول أكثر تنوعًا ومُحسّنة للحافة. فيما يلي، نحلل الأداء ومنهجيات التدريب والفروق الدقيقة في البنية لكل من EfficientDet و YOLOv6. YOLOv6، ونستكشف أسباب توجه المطورين بشكل متزايد إلى النظم البيئية الحديثة مثل Ultralytics من أجل نشر أحدث التقنيات.
EfficientDet: بنية AutoML قابلة للتطوير
طور فريق Google برنامج EfficientDet الذي أحدث تحولاً جذرياً بالاعتماد على التعلم الآلي (AutoML) لتحسين شبكته الأساسية وشبكة ميزاته.
- المؤلفون: مينغشينغ تان، رومينغ بانغ، وكوك ف. لي
- المؤسسة:Google Research
- التاريخ: 2019-11-20
- Arxiv:1911.09070
- GitHub:google/automl
- الوثائق:EfficientDet README
الابتكارات المعمارية
تتمثل الابتكار الأساسي لـ EfficientDet في شبكة BiFPN (شبكة هرمية ثنائية الاتجاه). على عكس شبكات FPN التقليدية التي تكتفي بتجميع الميزات من أعلى إلى أسفل، تتيح شبكة BiFPN إجراء اتصالات معقدة ثنائية الاتجاه عبر المستويات وتستخدم أوزانًا قابلة للتعلم لفهم أهمية الميزات المختلفة المدخلة. ويقترن ذلك بطريقة توسيع نطاق مركبة تعمل على توسيع نطاق الدقة والعمق والعرض للشبكة بشكل موحد في وقت واحد.
نقاط القوة والضعف
يحقق EfficientDet دقة متوسطة ممتازة (mAP) بالنسبة لعدد معلماته، مما يجعله عالي الدقة بالنسبة لوقته. ومع ذلك، فإنه يعتمد بشكل كبير على TensorFlow . غالبًا ما تؤدي هذه التبعية إلى تعديل معقد للمعلمات الفائقة، واستخدام أعلى للذاكرة أثناء التدريب، ووقت استدلال أبطأ على الأجهزة القياسية مقارنةً بأجهزة الكشف الحديثة أحادية المرحلة PyTorch.
تعرف على المزيد حول EfficientDet
YOLOv6.0: بطل الإنتاجية الصناعية
تم إصدار YOLOv6. YOLOv6 لتلبية الاحتياجات المحددة للمعالجة بالجملة، وهو عبارة عن شبكة عصبية تلافيفية (CNN) مصممة من الألف إلى الياء لتعظيم الإنتاجية على مسرعات الأجهزة مثل وحدات معالجة الرسومات NVIDIA و A100.
- المؤلفون: تشوي لي، لولو لي، ييفي جينغ، وآخرون.
- المنظمة:Meituan Vision AI
- التاريخ: 2023-01-13
- أرخايف:2301.05586
- GitHub:meituan/YOLOv6
- الوثائق:وثائق YOLOv6
الابتكارات المعمارية
يستبدل YOLOv6.YOLOv6 الوحدات التقليدية بوحدة التسلسل الثنائي الاتجاه (BiC) في العنق للحفاظ على دقة إشارات تحديد الموقع. علاوة على ذلك، يستخدم استراتيجية التدريب بمساعدة المثبت (AAT). تدمج AAT فرعًا مساعدًا قائمًا على المثبت خلال مرحلة التدريب لتوفير توجيه إضافي للانحدار، والذي يتم التخلص منه بعد ذلك أثناء الاستدلال للحفاظ على ميزة السرعة الخالية من المثبت.
نقاط القوة والضعف
تم تصميم YOLOv6. YOLOv6 على أساس البنية الأساسية EfficientRep الملائمة للأجهزة، YOLOv6 يتفوق في بيئات التصنيع الصناعي عالية السرعة حيث يمكن إجراء المعالجة المجمعة على وحدات معالجة الرسومات المخصصة. ومع ذلك، فإن اعتماده الكبير على عمليات إعادة تحديد المعلمات يمكن أن يؤدي إلى انخفاض كبير في السرعة عند نشره على الأجهزة الطرفية أو البيئات التي تعتمد بشكل صارم على CPU .
تعرف على المزيد حول YOLOv6-3.0
مقارنة الأداء
فهم مقاييس الأداء الأولية أمر أساسي لاختيار نموذج يتوافق مع قيود النشر الخاصة بك. فيما يلي تفصيل دقيق للدقة والسرعة والبصمة الحسابية.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
اعتبارات متعلقة بالأجهزة
بينما يُظهر YOLOv6. YOLOv6 TensorRT فائقة على وحدات معالجة الرسومات T4، سيستفيد المطورون الذين ينشرون على أجهزة طرفية أو وحدات معالجة مركزية محدودة بشكل كبير من البنى المصممة خصيصًا للبيئات منخفضة الطاقة، مثل Ultralytics .
حالات الاستخدام والتوصيات
YOLOv6 الاختيار بين EfficientDet و YOLOv6 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار EfficientDet
يعد EfficientDet خيارًا قويًا لـ:
- Google و TPU : أنظمة متكاملة بشكل عميق مع واجهات برمجة تطبيقات Google Vision أو TPU حيث يتمتع EfficientDet بتحسين أصلي.
- أبحاث التوسع المركب: مقارنة أكاديمية تركز على دراسة آثار التوازن بين عمق الشبكة وعرضها وتوسع الدقة.
- النشر عبر الأجهزة المحمولة باستخدام TFLite: المشاريع التي تتطلب بشكل خاص تصدير TensorFlow لأجهزة Android أجهزة Linux المدمجة.
متى تختار YOLOv6
YOLOv6 في الحالات التالية:
- النشر الصناعي المراعي للأجهزة: سيناريوهات يوفر فيها تصميم النموذج المراعي للأجهزة وإعادة تحديد المعلمات بكفاءة أداءً محسّنًا على أجهزة مستهدفة محددة.
- الكشف السريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الأولي على GPU الفيديو في الوقت الفعلي في البيئات الخاضعة للرقابة.
- تكامل نظام Meituan البيئي: فرق تعمل بالفعل ضمن مجموعة تقنيات Meituan وبنيتها التحتية للنشر.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
- كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.
Ultralytics : لماذا يعد YOLO26 الخيار الأفضل
في حين أن EfficientDet و YOLOv6. YOLOv6 كانا علامتين فارقتين في مجال أبحاث الرؤية، فإن نشرهما في بيئات الإنتاج الحديثة غالبًا ما ينطوي على صعوبات تتعلق بالتبعيات المعقدة وواجهات برمجة التطبيقات غير المترابطة ومتطلبات الذاكرة العالية. يعمل Ultralytics على حل هذه العقبات في سير العمل بشكل أصلي.
بالنسبة للمطورين الذين يبحثون عن أعلى مستويات الأداء وسهولة الاستخدام، يقدم Ultralytics (الذي تم إصداره في يناير 2026) قفزة جيلية إلى الأمام. وهو النموذج الموصى به للعمليات النشر الجديدة، حيث يتفوق على البنى القديمة في جميع المجالات.
YOLO26 ابتكارات ثورية
- تصميم شامل NMS: YOLO26 هو تصميم شامل أصلاً، مما يلغي تماماً الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يقلل بشكل كبير من تباين زمن الاستجابة ويبسط نشر النموذج عبر أجهزة الحافة المتنوعة.
- MuSGD Optimizer: مستوحى من تدريب LLM (مثل Kimi K2 من Moonshot AI)، يستخدم YOLO26 مزيجًا من SGD Muon. وهذا يوفر استقرارًا كبيرًا لنموذج اللغة في الرؤية الحاسوبية، مما يضمن تقاربًا أسرع وعمليات تدريب عالية الكفاءة.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : تم تحسين YOLO26 خصيصًا للحوسبة الطرفية والأجهزة منخفضة الطاقة، ويوفر CPU لا مثيل لها CPU حيث تعاني النماذج الصناعية التقليدية.
- إزالة DFL: تمت إزالة Distribution Focal Loss لتبسيط مخطط التصدير، مما يضمن التوافق السلس مع أوقات تشغيل النشر مثل OpenVINO و CoreML.
- ProgLoss + STAL: توفر وظائف الخسارة المتقدمة تحسينات ملحوظة في التعرف على الأجسام الصغيرة، مما يجعل YOLO26 لا غنى عنه في رسم الخرائط بالطائرات بدون طيار وأجهزة استشعار إنترنت الأشياء والروبوتات.
تنوع لا مثيل له
على عكس EfficientDet، الذي يقتصر على اكتشاف المربعات المحيطة، فإن YOLO26 هو متعلم متعدد المهام بطبيعته. تدعم Python الموحدة نفسها تقسيم المثيلات وتقدير الوضع وتصنيف الصور واكتشاف المربعات المحيطة الموجهة (OBB) بشكل فوري، مع تحسينات خاصة بالمهام مثل فقدان التقسيم الدلالي وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) المدمجة مباشرة في البنية.
تكامل سلس للكود
لم يعد تدريب شبكة عصبية متقدمة يتطلب مئات الأسطر من التعليمات البرمجية النمطية. تتيح Ultralytics للباحثين تحميل نموذج وتدريبه والتحقق من صحته على مجموعات بيانات قياسية مثل COCO بشكل مثالي:
from ultralytics import YOLO
# Initialize the natively end-to-end YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Train the model efficiently with automatic hardware detection
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model's performance
metrics = model.val()
print(f"Achieved mAP50-95: {metrics.box.map:.3f}")
# Export directly to ONNX or TensorRT without NMS overhead
model.export(format="onnx")
نماذج أخرى يجب أخذها في الاعتبار
إذا كان مشروعك يتطلب دعم ملفات تعريف الأجهزة القديمة أو كنت تقوم بصيانة قاعدة بيانات قديمة، فإن Ultralytics الأوسع نطاقًا يوفر لك ما تحتاجه.
- Ultralytics YOLO11: السلف المباشر لـ YOLO26، ويحظى بثقة كبيرة في بيئات المؤسسات التي تتطلب خطوط إنتاج ناضجة وموثقة جيدًا.
- Ultralytics YOLOv8: الرائد الذي أعاد تعريف تجربة المطورين، ولا يزال خيارًا ممتازًا لمهام الرؤية الحاسوبية للأغراض العامة المدمجة بعمق مع أدوات مثل TensorBoard و Weights & Biases.