YOLOv6.0 مقابل EfficientDet: تحقيق التوازن بين السرعة الصناعية والدقة القابلة للتطوير
في عالم الرؤية الحاسوبية المتطور، يعد اختيار بنية الكشف عن الكائنات المناسبة أمراً بالغ الأهمية لنجاح النشر. تستكشف هذه المقارنة نموذجين مؤثرين: YOLOv6.YOLOv6، وهو إطار عمل صناعي يركز على السرعة من Meituan، و EfficientDet، وهي بنية قابلة للتطوير بدرجة عالية طورتها Google . في حين قدم EfficientDet مفاهيم كفاءة رائدة، يعمل YOLOv6. YOLOv6 على تحسين هذه المبادئ GPU الحديثة.
مقارنة مقاييس الأداء
يوضح الجدول التالي المفاضلات في الأداء بين البنيتين. تظهر YOLOv6. YOLOv6 زمن انتقال فائق على GPU بفضل تصميمها المراعي للأجهزة، بينما توفر EfficientDet قابلية توسع دقيقة عبر مجموعة واسعة من القيود.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
YOLOv6-3.0: مسرع السرعة الصناعية
صدر YOLOv6 (الذي يشار إليه غالبًا باسم "YOLOv6 .0") في 13 يناير 2023، من قبل المؤلفين Chuyi Li و Lulu Li وفريق Meituan، وهو يمثل "إعادة تحميل كاملة" للإطار. وقد تم تصميمه خصيصًا للتطبيقات الصناعية التي لا يمكن التنازل فيها عن الإنتاجية العالية والكمون المنخفض على وحدات معالجة الرسومات (GPU).
الابتكارات المعمارية
يدمج YOLOv6.0 شبكة تجميع المسارات ثنائية الاتجاه (Bi-PAN)، والتي تعزز قدرات دمج الميزات مقارنة بهياكل PANet القياسية. والأهم من ذلك، أنه يستخدم كتل من نوع RepVGG، مما يسمح للنموذج بالحصول على طوبولوجيا متعددة الفروع أثناء التدريب من أجل تدفق تدرج أفضل، والتي تنهار بعد ذلك إلى بنية مسار واحد أثناء الاستدلال. تعمل تقنية إعادة المعلمات هذه على زيادة سرعة الاستدلال بشكل كبير على أجهزة مثل NVIDIA T4 و GeForce GPUs.
تشمل الميزات الإضافية ما يلي:
- التدريب بمساعدة المرساة (AAT): استراتيجية هجينة تمزج بين نماذج الكاشفات القائمة على المرساة وتلك الخالية منها من أجل تثبيت التقارب.
- رأس منفصل: يفصل بين فروع التصنيف والانحدار، مما يحسن الدقة من خلال السماح لكل مهمة بتعلم ميزات مستقلة.
EfficientDet: المعيار القابل للتطوير
تم تطوير EfficientDet بواسطة فريق Google (Mingxing Tan و Ruoming Pang و Quoc V. Le) وتم إصداره في 20 نوفمبر 2019، وقد أدخل مفهوم التوسع المركب إلى اكتشاف الكائنات. وهو مبني على أساس EfficientNet ويقدم شبكة هرمية ثنائية الاتجاه (BiFPN).
نقاط القوة المعمارية
الابتكار الأساسي في EfficientDet هو BiFPN، الذي يتيح دمج الميزات متعددة المقاييس بسهولة وسرعة. على عكس FPNs التقليدية، يستخدم BiFPN أوزانًا قابلة للتعلم لفهم أهمية ميزات الإدخال المختلفة. يتم قياس النموذج بشكل أساسي من خلال معامل مركب $\phi$، الذي يقيس الدقة والعمق والعرض بشكل موحد. وهذا يسمح لـ EfficientDet باستهداف قيود موارد محددة للغاية، من الأجهزة المحمولة (d0) إلى مهام الخادم عالية الدقة (d7).
ملاحظة تراثية
بينما يحقق EfficientDet كفاءة عالية في المعلمات (حجم نموذج صغير)، فإن طبقات BiFPN المعقدة ووظائف التنشيط Swish يمكن أن تكون مكلفة من الناحية الحسابية على بعض مسرعات الحافة مقارنة بالتلافيف القياسية 3x3 المستخدمة في YOLO .
المقارنة والتحليل التقنيان
1. الكمون مقابل الكفاءة
يكمن الاختلاف الأكثر وضوحًا في كيفية تعريف "الكفاءة". يعمل EfficientDet على تحسين FLOPs (عمليات النقطة العائمة) وعدد المعلمات، مما يحقق دقة ممتازة مع ملفات نموذج صغيرة جدًا (على سبيل المثال، EfficientDet-d0 لا يتجاوز 3.9 مليون معلمة). ومع ذلك، لا تعني FLOPs المنخفضة دائمًا زمن انتقال منخفض.
يحسن YOLOv6 زمن الاستدلال على وحدات معالجة الرسومات (GPU). كما هو موضح في الجدول، يعمل YOLOv6. YOLOv6 بسرعة 1.17 مللي ثانية على GPU T4، في حين أن EfficientDet-d0 المماثل يستغرق 3.92 مللي ثانية، أي ما يقرب من 3 أضعاف أبطأ على الرغم من احتوائه على معلمات أقل. وهذا يجعل YOLOv6 في تحليلات الفيديو في الوقت الفعلي.
2. نظام التدريب
يعتمد EfficientDet بشكل كبير على TensorFlow ومكتبات AutoML. على الرغم من قوتها، إلا أن دمجها في سير العمل الحديث PyTorch قد يكون أمراً صعباً. YOLOv6، وبالتحديد دمجه في Ultralytics ، يستفيد من PyTorch الأكثر سهولة، مما يجعل من السهل تصحيح الأخطاء وتعديلها ونشرها.
3. تعدد الاستخدامات
تم تصميم EfficientDet في المقام الأول لاكتشاف الصناديق المحددة. في المقابل، Ultralytics YOLO الحديثة المدعومة من Ultralytics لتصبح برامج تعلم متعددة المهام.
ميزة Ultralytics
في حين أن YOLOv6. YOLOv6 و EfficientDet هما نموذجان قويان، فإن Ultralytics يوفر واجهة موحدة تبسط بشكل كبير دورة حياة التعلم الآلي. سواء كنت تستخدم YOLOv8 أو YOLO11 أو YOLO26 المتطور، يستفيد المطورون من:
- سهولة الاستخدام: Python متسقة تتيح لك التبديل بين النماذج عن طريق تغيير سلسلة واحدة.
- توازن الأداء: تم تصميم Ultralytics لتوفير أفضل توازن بين السرعة والدقة المتوسطة (mAP).
- نظام بيئي جيد الصيانة: دعم نشط، تحديثات متكررة، وتكامل سلس مع أدوات مثل Ultralytics لإدارة مجموعات البيانات والتدريب السحابي.
- متطلبات الذاكرة: استخدام أقل بكثير لذاكرة VRAM أثناء التدريب مقارنة بالبنى الهندسية التي تعتمد بشكل كبير على المحولات، مما يتيح الوصول إلى تدريبات الذكاء الاصطناعي المتطورة.
الترقية إلى YOLO26
بالنسبة للمطورين الذين يسعون إلى تحقيق أعلى مستويات الأداء، فإن YOLO26 (الذي تم إصداره في يناير 2026) يوسع الحدود إلى أبعد من ذلك. فهو يقدم تصميمًا شاملاً NMS، مما يلغي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression. وهذا يقلل من تباين زمن الاستجابة ويبسط منطق النشر.
تشمل ابتكارات YOLO26 الرئيسية ما يلي:
- MuSGD Optimizer: مُحسِّن هجين مستوحى من تدريب LLM (Kimi K2 من Moonshot AI) لتحقيق تقارب مستقر.
- إزالة DFL: تعمل إزالة فقدان بؤرة التوزيع على تبسيط رأس الإخراج، مما يعزز التوافق مع الأجهزة الطرفية.
- ProgLoss + STAL: وظائف خسارة متقدمة تعمل على تحسين اكتشاف الأجسام الصغيرة، وهو أمر بالغ الأهمية لتطبيقات الطائرات بدون طيار وإنترنت الأشياء.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : مُحسّن خصيصًا للبيئات التي لا تحتوي على وحدات معالجة رسومات مخصصة.
Python : التدريب باستخدام Ultralytics
يوضح الكود التالي مدى سهولة تدريب نموذج متطور باستخدام Ultralytics . تدعم واجهة برمجة التطبيقات الموحدة هذه YOLOv8 و YOLO11 و YOLO26 بسلاسة.
from ultralytics import YOLO
# Load the cutting-edge YOLO26n model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset for 100 epochs
# The system automatically handles dataset downloading and configuration
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a sample image
results = model("https://ultralytics.com/images/bus.jpg")
توصيات حالات الاستخدام
متى تختار YOLOv6-3.0
- خطوط التصنيع: الكشف عن العيوب بسرعة عالية حيث تتوفر GPU ويجب أن يكون زمن الاستجابة أقل من 5 مللي ثانية.
- تحليلات المدن الذكية: معالجة أعداد هائلة من تدفقات الفيديو على وحدات معالجة الرسومات (GPU) من فئة الخوادم (مثل T4 و A100).
- أتمتة البيع بالتجزئة: التعرف على المنتجات في الوقت الفعلي في أنظمة الدفع الآلي.
متى تختار EfficientDet
- Storage-Constrained Devices: Legacy IoT devices where the model weight file size (e.g., <5MB) is the primary constraint.
- البحوث الأكاديمية: دراسات تركز على شبكات هرم الميزات أو قوانين القياس المركبة.
- TensorFlow : خطوط أنابيب قائمة متجذرة بعمق فيTPU Google.
متى تختار Ultralytics
- الحوسبة الطرفية: النشر على أجهزة CPU مثل Raspberry Pi أو الهواتف المحمولة، والاستفادة من CPU الأسرع بنسبة 43٪.
- الروبوتات: التطبيقات التي تتطلب تقدير الوضع أو الكشف عن الكائنات الموجهة (OBB) إلى جانب الكشف القياسي.
- التطورات الجديدة: المشاريع التي تتطلب صيانة طويلة الأمد، سهولة التصدير إلى TensorRT أو ONNX، ودعم مجتمعي نشط.
الخلاصة
لقد شكل كل من YOLOv6. YOLOv6 و EfficientDet مجال اكتشاف الكائنات. أثبت EfficientDet قيمة التوسع المركب، بينما أظهر YOLOv6. YOLOv6 كيفية تكييف البنية لتحقيق أقصى GPU . ومع ذلك، بالنسبة لمعظم التطبيقات الحديثة، يقدم Ultralytics الحزمة الأكثر جاذبية: كفاءة شاملة، وسرعة فائقة، ونظام بيئي متعدد الاستخدامات ومستقبلي.
قد يرغب المستخدمون المهتمون باستكشاف خيارات أخرى عالية الأداء في النظر أيضًا في YOLOv8و YOLOv9أو YOLO11 حسب احتياجات الدعم القديمة الخاصة بهم.