YOLO26 مقابل EfficientDet: البنية والأداء وحالات الاستخدام
لقد تطور مشهد detect الكائنات بشكل كبير على مدى العقد الماضي. اثنتان من البنى المعمارية البارزة التي شكلت هذا المجال هما Ultralytics YOLO26 و EfficientDet من Google. بينما قدم EfficientDet طريقة قابلة للتطوير وفعالة للتعامل مع الميزات متعددة المقاييس في عام 2019، يمثل YOLO26 أحدث ما توصلت إليه رؤية الكمبيوتر في الوقت الفعلي في عام 2026، حيث يوفر معالجة شاملة وسرعة فائقة على الأجهزة الطرفية.
يقدم هذا الدليل مقارنة تقنية مفصلة لمساعدة المطورين والباحثين والمهندسين على اختيار النموذج المناسب لتطبيقاتهم.
نظرة عامة على النموذج
Ultralytics YOLO26
تم إطلاق YOLO26 في يناير 2026، وهو أحدث تكرار في عائلة YOLO (You Only Look Once) الشهيرة. يقدم بنية شاملة وخالية من NMS بشكل طبيعي تبسط مسارات النشر عن طريق إزالة الحاجة إلى معالجة ما بعد قمع غير الحد الأقصى (NMS). صُمم لتحقيق أقصى درجات الكفاءة، ويتفوق في سيناريوهات الحوسبة الطرفية، مما يوفر تسريعًا كبيرًا على وحدات المعالبة المركزية (CPUs) دون التضحية بالدقة.
المؤلفون الرئيسيون: جلين جوشر وجينغ تشيو
المنظمة:Ultralytics
تاريخ الإصدار: 14-01-2026
الترخيص:AGPL-3.0 (يتوفر إصدار المؤسسات)
Google EfficientDet
تم اقتراح EfficientDet من قبل فريق Google Brain (الآن Google DeepMind) في أواخر عام 2019. يركز على الكفاءة وقابلية التوسع، باستخدام طريقة قياس مركبة تقوم بتوسيع دقة وعمق وعرض الشبكة الأساسية وشبكة الميزات وشبكة التنبؤ بشكل موحد. كان ابتكارها الأساسي هو شبكة الهرم الميزة ثنائية الاتجاه (BiFPN)، التي تسمح بدمج الميزات متعددة المقاييس بسهولة وسرعة.
المؤلفون الرئيسيون: مينغشينغ تان، روومينغ بانغ، وكوك في. لي
المنظمة: Google
تاريخ الإصدار: 20-11-2019
الترخيص: Apache 2.0
مقارنة الأداء
عند مقارنة هاتين البنيتين المعماريتين، يكمن الاختلاف الأكثر وضوحًا في سرعة الاستدلال وتعقيد النشر. بينما وضع EfficientDet معايير الكفاءة في عام 2019، يستفيد YOLO26 من التحسينات الحديثة ليتفوق عليه بشكل كبير، خاصة في الاستدلال المعتمد على وحدة المعالجة المركزية (CPU) وهو أمر بالغ الأهمية للنشر على الحافة.
يبرز الجدول أدناه مقاييس الأداء على مجموعة بيانات COCO. لاحظ ميزة السرعة الكبيرة لسلسلة YOLO26.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
سياق المقارنة المعيارية
يعد مقياس سرعة CPU ONNX مهمًا بشكل خاص للتطبيقات الواقعية على الأجهزة القياسية. يحقق YOLO26n زمن استجابة ملحوظًا يبلغ 38.9 مللي ثانية، مما يجعله قابلاً للتطبيق لمعالجة الفيديو في الوقت الفعلي على الأجهزة غير المسرّعة. على العكس من ذلك، تعاني التكرارات الأعلى من EfficientDet من زمن استجابة عالٍ، مما يجعلها أقل ملاءمة لـ معالجة البث المباشر.
نظرة معمقة على الهيكلة
ابتكارات YOLO26
يمثل YOLO26 تحولًا عن منطق detect التقليدي القائم على المراسٍ الموجود في النماذج السابقة.
- منطق شامل خالٍ من NMS: تتطلب أدوات detect التقليدية مثل EfficientDet عملية Non-Maximum Suppression (NMS) لتصفية مربعات الإحاطة المتداخلة. هذه الخطوة مكلفة حسابيًا ويصعب تحسينها على مسرعات الأجهزة. يلغي YOLO26 هذه العملية بالكامل، ويتنبأ بالمجموعة الدقيقة للكائنات مباشرةً.
- مُحسِّن MuSGD: مستوحى من تدريب نماذج اللغة الكبيرة (LLM)، يستخدم YOLO26 مُحسِّنًا هجينًا يجمع بين SGD و Muon. يؤدي هذا إلى ديناميكيات تدريب أكثر استقرارًا وتقارب أسرع أثناء تدريب النماذج المخصصة.
- إزالة DFL: من خلال إزالة Distribution Focal Loss (DFL)، يتم تبسيط بنية النموذج. يترجم هذا التخفيض في التعقيد مباشرة إلى سرعات استدلال أسرع وتصدير أسهل إلى تنسيقات مثل ONNX و TensorRT.
- ProgLoss + STAL: يعزز إدخال موازنة الخسارة التدريجية وتعيين التسميات المدركة للأهداف الصغيرة الأداء بشكل كبير في detect الكائنات الصغيرة، وهو تحدٍ تاريخي لأدوات detect أحادية المرحلة.
بنية EfficientDet
يعتمد EfficientDet على بنية EfficientNet الأساسية ويقدم BiFPN (شبكة الهرم الميزة ثنائية الاتجاه).
- التحجيم المركب: يقوم EfficientDet بتحجيم الدقة والعرض والعمق في وقت واحد باستخدام معامل مركب (فاي). يتيح هذا للمستخدمين الموازنة بين الدقة والموارد بشكل منهجي من D0 إلى D7.
- BiFPN: على عكس FPN القياسية، يسمح BiFPN بتدفق المعلومات من الأعلى إلى الأسفل ومن الأسفل إلى الأعلى، ويستخدم أوزانًا قابلة للتعلم لتحديد أهمية ميزات الإدخال المختلفة.
- قائم على المراسٍ: يعتمد EfficientDet على مجموعة من مربعات المراسٍ المحددة مسبقًا، مما يتطلب ضبطًا دقيقًا لنسب العرض إلى الارتفاع والمقاييس للحصول على الأداء الأمثل على مجموعات البيانات المخصصة.
سهولة الاستخدام والنظام البيئي
أحد الاختلافات الجوهرية بين استخدام YOLO26 و EfficientDet هو النظام البيئي للبرمجيات المحيط بهما.
تجربة Ultralytics
تعطي Ultralytics الأولوية لسهولة الاستخدام وواجهة برمجة تطبيقات موحدة. سواء كنت تقوم بـ detect الكائنات، أو segment الكائنات، أو تقدير الوضعيات، أو detect الكائنات الموجهة (OBB)، يظل بناء الجملة متسقًا.
- واجهة برمجة تطبيقات python بسيطة: يتطلب تدريب النموذج بضعة أسطر فقط من التعليمات البرمجية.
- تعدد الاستخدامات: يدعم YOLO26 مهامًا متعددة جاهزة للاستخدام. EfficientDet هو في الأساس أداة detect كائنات، على الرغم من أنه يمكن إضافة رؤوس segment بتطبيقات مخصصة.
- جاهز للنشر: يتضمن النظام البيئي لـ Ultralytics دعمًا مدمجًا للتصدير إلى CoreML و TFLite و OpenVINO والمزيد، مما يبسط المسار من البحث إلى الإنتاج.
from ultralytics import YOLO
# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
نظام EfficientDet البيئي
يتم الوصول إلى EfficientDet عادةً عبر واجهة برمجة تطبيقات TensorFlow Object Detection أو تطبيقات PyTorch المختلفة. على الرغم من قوتها، تتطلب هذه الأطر غالبًا المزيد من التعليمات البرمجية المتكررة، وملفات التكوين المعقدة، ومنحنى تعلم أكثر حدة للمبتدئين. يتطلب التدريب الفعال على البيانات المخصصة غالبًا ضبطًا كبيرًا للمعاملات الفائقة مقارنةً بالجاهزية "الخارجية" لنماذج YOLO.
توصيات حالات الاستخدام
متى تختار YOLO26
يعد YOLO26 الخيار الأمثل لمعظم تطبيقات رؤية الكمبيوتر الحديثة، وتحديدًا:
- الحوسبة الطرفية: إذا كنت تقوم بالنشر على Raspberry Pi، أو الأجهزة المحمولة (iOS/Android)، أو NVIDIA Jetson، فإن سرعة استدلال CPU الأسرع بنسبة تصل إلى 43% تجعل YOLO26 متفوقًا.
- الفيديو في الوقت الفعلي: للتطبيقات التي تتطلب معدل إطارات عالٍ (FPS)، مثل القيادة الذاتية أو المراقبة الأمنية، فإن زمن الاستجابة المنخفض لـ YOLO26 أمر بالغ الأهمية.
- المهام المعقدة: إذا كان مشروعك لا يتضمن detect فقط بل أيضًا تقدير الوضعيات أو segment، فإن استخدام إطار عمل موحد واحد يقلل من أعباء التطوير.
- النماذج الأولية السريعة: يتيح المجتمع النشط والوثائق الشاملة للمطورين التكرار بسرعة.
متى يجب التفكير في EfficientDet
على الرغم من أنه أبطأ بشكل عام، لا يزال EfficientDet ذا صلة في سياقات بحثية محددة:
- البحث الأكاديمي: إذا كنت تدرس شبكات الهرم الميزة على وجه التحديد، تظل بنية BiFPN مرجعًا قيمًا.
- الأنظمة القديمة: قد تجد خطوط الأنابيب الحالية المدمجة بشكل كبير مع إصدارات TensorFlow الأقدم أنه من الأسهل الحفاظ على نموذج EfficientDet موجود بدلاً من الترحيل.
الخلاصة
بينما قدم EfficientDet مفاهيم رائدة في دمج الميزات وتحجيم النماذج، يمثل YOLO26 الجيل التالي من الذكاء الاصطناعي للرؤية. بفضل تصميمه الشامل الخالي من NMS، وسرعات الاستدلال الفائقة، ومتطلبات الذاكرة الأقل، يقدم YOLO26 حلاً أكثر عملية وقوة لتحديات الذكاء الاصطناعي اليوم.
للمطورين الذين يتطلعون إلى بناء تطبيقات قوية وفي الوقت الفعلي، فإن سير العمل المبسط وتوازن الأداء في Ultralytics YOLO26 يجعله التوصية الواضحة.
مزيد من القراءة
استكشف نماذج أخرى في وثائق Ultralytics:
- YOLO11: النموذج الرائد من الجيل السابق.
- YOLOv10: الرائد في التدريب الخالي من NMS.
- RT-DETR: محول الكشف في الوقت الفعلي (Real-time DEtection TRansformer)، خيار ممتاز آخر شامل.