YOLO26 مقابل EfficientDet: مقارنة تقنية بين هياكل الكشف عن الكائنات الحديثة
يعد اختيار بنية الشبكة العصبية المناسبة أمرًا بالغ الأهمية لنجاح أي تطبيق للرؤية الحاسوبية. يستكشف هذا الدليل الفني المفاضلات ومقاييس الأداء والابتكارات المعمارية لنموذجين بارزين: Ultralytics المتطور و EfficientDet الراسخ Google.
سواء كان هدف النشر هو خوادم سحابية عالية الإنتاجية أو أجهزة ذكاء اصطناعي طرفية مقيدة بالكمون، فإن فهم الاختلافات بين هذه البنى يضمن تحقيق التوازن الأمثل بين السرعة والدقة والكفاءة.
نظرة عامة على الهندسة المعمارية: YOLO26
المؤلفون: جلين جوشر وجينغ تشيو
المنظمة:Ultralytics
التاريخ: 2026-01-14
GitHub:Ultralytics
الوثائق:YOLO26 الوثائق الرسمية
تم إصدار YOLO26 في أوائل عام 2026، وهو يمثل أحدث تطور في YOLO وقد تم تصميمه خصيصًا لتوفير تجربة مستخدم لا مثيل لها ودقة متوسطة (mAP) من الدرجة الأولى. تم تصميمه من الألف إلى الياء للأجهزة الحديثة، ويوفر تنوعًا استثنائيًا في اكتشاف الكائنات وتقسيم الحالات وتصنيف الصور وتقدير الوضع.
يقدم YOLO26 العديد من الميزات الرائدة التي تحسن بشكل كبير من استقرار التدريب وسرعة الاستدلال:
- تصميم شامل NMS: بناءً على المفاهيم التي ابتكرتها YOLOv10 تتميز YOLO26 بطبيعتها الشاملة، مما يلغي تمامًا الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يؤدي إلى منطق نشر أبسط وتباين أقل بكثير في زمن الاستجابة.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : من خلال تحسينات معمارية عميقة، يحقق النموذج سرعات استنتاج غير مسبوقة على وحدات المعالجة المركزية القياسية، مما يجعله مناسبًا للغاية لبيئات إنترنت الأشياء والبيئات المدمجة.
- إزالة DFL: تمت إزالة Distribution Focal Loss (فقدان بؤرة التوزيع)، مما أدى إلى عملية تصدير أنظف وتحسين التوافق مع الأجهزة الطرفية منخفضة الطاقة باستخدام أدوات مثل ONNX.
- MuSGD Optimizer: مستوحى من روتينات تدريب LLM الخاصة بـ Moonshot AI's Kimi K2، هذا المزيج من SGD Muon يجلب ابتكارات تدريب نماذج اللغة الكبيرة مباشرة إلى الرؤية الحاسوبية، مما يضمن تقاربًا أسرع وأنظمة تدريب أكثر استقرارًا.
- ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو عامل حاسم للتطبيقات التي تتضمن صور الطائرات بدون طيار والروبوتات.
تصدير مبسط
بفضل إزالة DFL والبنية NMS، أصبح من الممكن تصدير نماذج YOLO26 إلى تنسيقات متوافقة مع الحواف مثل NVIDIA TensorRT أو Intel OpenVINO لا يتطلب أي تطوير مخصص للمكونات الإضافية.
نظرة عامة على الهندسة المعمارية: EfficientDet
المؤلفون: Mingxing Tan و Ruoming Pang و Quoc V. Le
المنظمة:Google
التاريخ: 2019-11-20
Arxiv:EfficientDet Paper
GitHub:Google Repository
قدمت Google برنامج EfficientDet الذي يستخدم بشكل مكثف TensorFlow وقد تم تصميمه بناءً على مفهوم التوسع المركب. تعمل بنيته على توسيع شبكة العمود الفقري وشبكة الميزات وشبكات التنبؤ بالصندوق/الفئة في وقت واحد بناءً على قيود الموارد.
تشمل الابتكارات الرئيسية لـ EfficientDet ما يلي:
- BiFPN (شبكة هرمية ثنائية الاتجاه): آلية تسمح بدمج السمات متعددة المقاييس بسهولة وسرعة، مما يمكّن الشبكة من فهم الأجسام ذات الأحجام المختلفة بشكل أفضل.
- التحجيم المركب: طريقة تجريبية لتوسيع الدقة والعمق والعرض بشكل موحد، مما ينتج عنه مجموعة من النماذج من d0 (الأصغر) إلى d7 (الأكبر).
في حين أن EfficientDet لا يزال خيارًا قويًا للكشف الدقيق عن الصناديق المحددة، إلا أنه يفتقر عمومًا إلى التنوع الحديث في المهام المتعددة (مثل مهام OBB الأصلية) والتبسيط والتوحيد. Python الذي يتوقعه المطورون المعاصرون.
تعرف على المزيد حول EfficientDet
مقارنة الأداء والمقاييس
لتحديد حدود باريتو للسرعة والدقة، قمنا بمقارنة كلتا البنيتين في بيئات قياسية باستخدام COCO . يوضح الجدول التالي الاختلافات في أحجام النماذج والدقة والكمون المقاسة على مثيل AWS EC2 P4d.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
كما هو موضح أعلاه، يحقق YOLO26 توازنًا فائقًا في الأداء. يحقق نموذج YOLO26x أعلى دقة (57.5 mAP)، متفوقًا بشكل كبير على EfficientDet-d7 الأثقل. علاوة على ذلك، تتميز نماذج YOLO26 بمتطلبات ذاكرة أقل بكثير وسرعات GPU أسرع بكثير (تصل إلى 1.7 مللي ثانية على TensorRT)، مما يؤكد مزايا التصميم NMS.
كفاءة التدريب وميزة النظام البيئي
يكمن الاختلاف الرئيسي بين هاتين البنيتين في بيئات التطوير الخاصة بهما. EfficientDet مدمج بشكل عميق في TensorFlow Google و TensorFlow والذي على الرغم من قوته، إلا أنه قد يتطلب منحنيات تعلم حادة وتكوينات صارمة لمجموعات البيانات المخصصة مثل DOTAv1.
على العكس من ذلك، Ultralytics نظامًا بيئيًا يتمتع بصيانة فائقة ويستند إلى PyTorch. يتم تحسين استخدام الذاكرة أثناء التدريب بشكل صارم، مما يسمح للمهندسين بتدريب نماذج قوية دون الحاجة إلى تخصيصات VRAM مفرطة شائعة في الشبكات القائمة على المحولات.
تكامل المنصة الموحدة
من خلال Ultralytics يحصل المطورون على إمكانية الوصول إلى سير عمل MLOps شامل. ويشمل ذلك التعليق السلس على البيانات، وضبط المعلمات الفائقة تلقائيًا، والتدريب السحابي بنقرة واحدة، مما يسرع بشكل كبير المسار من النموذج الأولي إلى الإنتاج.
مثال على التنفيذ
سهولة الاستخدام التي توفرها واجهة برمجة Ultralytics تعني أنه يمكنك تدريب وتقييم نموذج YOLO26 المتطور باستخدام بضع أسطر من التعليمات البرمجية فقط.
from ultralytics import YOLO
# Initialize the End-to-End NMS-Free YOLO26 model
model = YOLO("yolo26n.pt")
# Train using the innovative MuSGD optimizer on a custom dataset
train_results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Train on GPU
)
# Export natively to TensorRT for ultra-low latency deployment
model.export(format="engine")
حالات الاستخدام المثالية
متى تستخدم YOLO26:
- الحوسبة الطرفية والأجهزة المحمولة: بفضل CPU الأسرع بنسبة تصل إلى 43٪ وبدون NMS يتفوق YOLO26 على الأجهزة ذات ميزانيات الحوسبة المحدودة للغاية مثل Raspberry Pis أو الهواتف المحمولة.
- تعدد المهام: عندما يتطلب خط أنابيب واحد صناديق حدودية وأقنعة تقسيم وتتبع، فإن تنوع YOLO26 لا مثيل له.
- الصور الملتقطة بواسطة الطائرات بدون طيار والصور الجوية: يساهم الجمع بين ProgLoss و STAL في تحسين عملية الكشف عن الأجسام الصغيرة للغاية من ارتفاعات عالية.
متى تستخدم EfficientDet:
- TensorFlow القديمة: إذا كانت البنية التحتية الخاصة بك مبرمجة بشكل ثابت لدعم TensorFlow فقط أو تتطلب أنابيب TensorFlow محددة، فإن EfficientDet يوفر توافقًا أصليًا.
- وحدات معالجة TPU ذات الموارد المحدودة: تم تحسين EfficientDet بشكل كبير ليتوافق مع وحدات Tensor (TPU) المخصصة Google.
استكشاف البدائل الأخرى
بينما يركز هذا الدليل بشكل كبير على نموذج YOLO26 مقابل EfficientDet، فإن Ultralytics الأوسع نطاقًا يضم هياكل أخرى مذهلة. إذا كان تطبيقك يعتمد بشكل كبير على المحولات، RT-DETR يوفر الكشف في الوقت الفعلي القائم على المحولات. أو إذا كنت تدعم الأنظمة القديمة، فإن YOLO11 يظل مدعومًا بالكامل وفعالًا للغاية. للحصول على نظرة عامة أوسع، تفضل بزيارة مركز مقارناتUltralytics .
في النهاية، بالنسبة لأي خط أنابيب رؤية حاسوبية حديث يتم بناؤه اليوم، فإن السرعة الفائقة وسهولة الاستخدام والدقة المتطورة لـ YOLO26 تجعله الخيار الموصى به بلا منازع للباحثين والمطورين على حد سواء.