EfficientDet مقابل YOLOv7: استكشاف بنى الكشف عن الكائنات في الوقت الفعلي
يعد اختيار بنية الشبكة العصبية الأكثر فعالية أمرًا بالغ الأهمية لنجاح أي مبادرة في مجال الرؤية الحاسوبية. مع تزايد الطلب على حلول الذكاء الاصطناعي عالية الأداء، YOLOv7 مقارنة النماذج الراسخة مثل EfficientDet و YOLOv7 أمرًا ضروريًا للمطورين الذين يهدفون إلى تحسين الدقة والكفاءة الحسابية.
يستكشف هذا التحليل التقني الشامل الفروق الدقيقة في البنية ومقاييس الأداء وسيناريوهات النشر المثالية لكلا النموذجين. بالإضافة إلى ذلك، سنوضح لماذا يوفر النظام البيئي المتكامل الذي توفره Ultralytics— والذي يتوج بأحدث إصدار Ultralytics — بديلاً متميزًا لمهام الرؤية الحاسوبية الحديثة.
فهم EfficientDet
تم تصميم EfficientDet لتحقيق أقصى قدر من الدقة مع إدارة تكاليف الحوسبة بشكل منهجي عبر مختلف قيود الموارد. وقد حقق ذلك من خلال نهج مبتكر للتوسع ودمج الميزات.
تفاصيل EfficientDet:
المؤلفون: Mingxing Tan و Ruoming Pang و Quoc V. Le
المنظمة: Google
التاريخ: 2019-11-20
Arxiv: EfficientDet: Scalable and Efficient Object Detection
GitHub: Google Repository
الهندسة المعمارية والابتكارات
في جوهره، يستخدم EfficientDet شبكة هرمية ثنائية الاتجاه (BiFPN). على عكس شبكات FPN التقليدية، تسمح شبكة BiFPN بدمج الميزات متعددة المقاييس بسهولة وسرعة من خلال إدخال أوزان قابلة للتعلم لتعلم أهمية الميزات المختلفة المدخلة. ويتم دمج ذلك مع طريقة قياس مركبة تقيس بشكل موحد الدقة والعمق والعرض للعمود الفقري وشبكة الميزات وشبكات التنبؤ بالصندوق/الفئة في وقت واحد.
نقاط القوة والضعف
يتميز EfficientDet بقدرته العالية على التوسع. وتتميز نسخه الأصغر حجماً (d0-d2) بكفاءة عالية في المعلمات، مما يجعلها مناسبة للبيئات ذات القيود الصارمة على التخزين. أما النسخ الأكبر حجماً (مثل d7) فتتجاوز حدود متوسط الدقة (mAP) للمعالجة المتطورة في وضع عدم الاتصال.
ومع ذلك، فإن EfficientDet يعتمد بشكل كبير على TensorFlow القديمة وخطوط أنابيب AutoML المعقدة. هذه البنية التحتية القديمة تجعل من الصعب للغاية دمجها في سير العمل الحديث PyTorch. علاوة على ذلك، فإنها تعاني من تأخر كبير في الاستدلال على الأجهزة الطرفية عند التوسع إلى متغيرات أعلى دقة.
تعرف على المزيد حول EfficientDet
فهم YOLOv7
أحدثت YOLOv7، التي تم طرحها في عام 2022، قفزة هائلة في السرعة والدقة للتطبيقات في الوقت الفعلي، مما أرسى أساسًا جديدًا YOLO الشهيرة على نطاق واسع في ذلك الوقت.
YOLOv7 :
المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، أكاديمية سينكا، تايوان
التاريخ: 2022-07-06
Arxiv: YOLOv7: مجموعة bag-of-freebies القابلة للتدريب تضع معيارًا جديدًا لأحدث التقنيات في مجال أجهزة الكشف عن الأجسام في الوقت الفعلي
GitHub: YOLOv7 الرسمي
الهندسة المعمارية والابتكارات
YOLOv7 شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN). يعمل هذا التحسين المعماري على تحسين قدرة الشبكة على التعلم دون تدمير مسار التدرج الأصلي، مما يسمح للنموذج بتعلم ميزات أكثر تنوعًا بكفاءة. بالإضافة إلى ذلك، فإنه ينفذ "حقيبة هدايا قابلة للتدريب"، مستفيدًا من تقنيات مثل إعادة تحديد المعلمات المخطط لها وتعيين التسميات الديناميكية لتعزيز الدقة دون زيادة تكلفة الاستدلال.
نقاط القوة والضعف
YOLOv7 في السيناريوهات في الوقت الفعلي، مثل تحليلات الفيديو والملاحة الروبوتية عالية السرعة. وهو يتكيف بشكل استثنائي مع وحدات معالجة الرسومات (GPU) على مستوى الخادم ويوفر PyTorch محلي، مما يجعله متاحًا للباحثين الأكاديميين.
على الرغم من سرعته المذهلة، YOLOv7 يعتمد على تقنية Non-Maximum Suppression (NMS) للمعالجة اللاحقة، مما قد يؤدي إلى حدوث تأخير متغير في المشاهد المزدحمة. علاوة على ذلك، فإن حجم الذاكرة التي يستهلكها أثناء التدريب أكبر بكثير من الأجيال الأحدث، مما يتطلب أجهزة أكثر قوة للتعامل مع أحجام الدُفعات الكبيرة.
مقارنة الأداء والمقاييس
عند مقارنة هذه النماذج، من الضروري دراسة التوازن بين الدقة وسرعة الاستدلال وحجم المعلمات. فيما يلي تقييم مفصل لمختلف YOLOv7 EfficientDet و YOLOv7 .
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
أداء Takeaway
بينما يحقق EfficientDet-d7 أعلى mAP إلا أنه يتطلب ما يقرب من 128 مللي ثانية على GPU T4. وفي تناقض صارخ، يحقق YOLOv7x معدل mAP مماثل mAP 53.1 mAP 11.57 مللي ثانية بسرعة مذهلة، مما يدل على قفزة جيلية هائلة في كفاءة الحوسبة للنشر في الوقت الفعلي.
حالات الاستخدام والتوصيات
YOLOv7 الاختيار بين EfficientDet و YOLOv7 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار EfficientDet
يعد EfficientDet خيارًا قويًا لـ:
- Google و TPU : أنظمة متكاملة بشكل عميق مع واجهات برمجة تطبيقات Google Vision أو TPU حيث يتمتع EfficientDet بتحسين أصلي.
- أبحاث التوسع المركب: مقارنة أكاديمية تركز على دراسة آثار التوازن بين عمق الشبكة وعرضها وتوسع الدقة.
- النشر عبر الأجهزة المحمولة باستخدام TFLite: المشاريع التي تتطلب بشكل خاص تصدير TensorFlow لأجهزة Android أجهزة Linux المدمجة.
متى تختار YOLOv7
YOLOv7 في الحالات التالية:
- المقارنة الأكاديمية: إعادة إنتاج أحدث النتائج لعام 2022 أو دراسة آثار E-ELAN وتقنيات bag-of-freebies القابلة للتدريب.
- أبحاث إعادة تحديد المعلمات: دراسة التلافيف المخطط لها المعاد تحديد معلماتها واستراتيجيات قياس النماذج المركبة.
- خطوط الأنابيب المخصصة الحالية: مشاريع ذات خطوط أنابيب مخصصة بشكل كبير ومبنية حول بنية YOLOv7 المحددة والتي لا يمكن إعادة هيكلتها بسهولة.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
- كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.
ميزة Ultralytics
اختيار البنية المناسبة يتجاوز مجرد المقاييس الأولية؛ فهو ينطوي على تقييم دورة حياة التعلم الآلي بأكملها. يوفر Ultralytics تجربة مطورين لا مثيل لها، مما يقلل بشكل كبير من عوائق الدخول إلى عمليات نشر الذكاء الاصطناعي القوية.
- سهولة الاستخدام: Ultralytics Python موحدة للغاية. يمكن للمطورين تدريب النماذج والتحقق من صحتها وتصديرها باستخدام بضع أسطر من التعليمات البرمجية فقط، مما يلغي الحاجة إلى إدارة قواعد التعليمات البرمجية المعقدة والمجزأة التي تتميز بها EfficientDet.
- نظام بيئي جيد الصيانة: بفضل التحديثات السريعة والوثائق الشاملة والمجتمع النشط، Ultralytics التوافق مع أحدث أطر النشر مثل TensorRT OpenVINO.
- متطلبات الذاكرة: من خلال استخدام محملات PyTorch عالية التحسين وهياكل شبكات مبسطة، تتطلبYOLO Ultralytics YOLO CUDA أقل بكثير أثناء التدريب مقارنة بالشبكات متعددة الفروع والنماذج الثقيلة المحولة.
- تعدد الاستخدامات: على عكس البنى القديمة المرتبطة بشكل صارم باكتشاف الصناديق المحددة، فإن Ultralytics هي أدوات قوية متعددة المهام تدعم تقسيم الحالات وتقدير الوضع والصناديق المحددة الموجهة (OBB).
كفاءة التدريب مع Ultralytics
يوضح الكود التالي بساطة تدريب نموذج متطور باستخدامPython وهو ما يتناقض تمامًا مع تكوين TensorFlow القديمة.
from ultralytics import YOLO
# Load the highly recommended YOLO26 model
model = YOLO("yolo26s.pt")
# Train the model automatically handling hyperparameter tuning and augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the model to TensorRT for deployment
model.export(format="engine")
المعيار الجديد: YOLO26
بينما أرسى YOLOv7 EfficientDet الأساس للرؤية الحاسوبية الحديثة، تطور المشهد بشكل كبير مع طرح Ultralytics في يناير 2026. صُمم YOLO26 لتحقيق دقة فائقة وأداء لا مثيل له، وهو الخيار الأمثل لجميع مشاريع الرؤية الجديدة.
ابتكارات YOLO26 الرئيسية
- تصميم شامل NMS: بناءً على الأسس التي أرساها YOLOv10، فإن YOLO26 هو تصميم شامل أصلاً. من خلال التخلص تماماً من المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، فإنه يوفر زمن انتقال أقل وأكثر اتساقاً، وهو أمر بالغ الأهمية للأنظمة الحساسة من حيث السلامة مثل القيادة الذاتية.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : بفضل إزالة Distribution Focal Loss (DFL)، يتميز YOLO26 بعملية تصدير مبسطة بشكل كبير وسرعة لا مثيل لها على الأجهزة الطرفية مثل Raspberry Pi، مما يجعله البطل بلا منازع في مجال الحوسبة الطرفية.
- MuSGD Optimizer: يدمج YOLO26 محرك MuSGD Optimizer الثوري — وهو مزيج من SGD Muon مستوحى من ابتكارات تدريب LLM من Moonshot AI. وهذا يؤدي إلى ديناميكيات تدريب مستقرة بشكل ملحوظ ومعدلات تقارب أسرع بكثير.
- ProgLoss + STAL: أدى دمج الخسارة التقدمية والخسارة المستهدفة للمقياس إلى تحسين كبير في قدرة النموذج على detect الأجسام detect ، مما أدى إلى حل مشكلة كبيرة في صور الطائرات بدون طيار وأنظمة الإنذار الأمني.
- تحسينات خاصة بالمهام: YOLO26 ليس مجرد كاشف. فهو يتميز بفقدان التجزئة الدلالية ونموذج متعدد المقاييس لتجزئة لا تشوبها شائبة، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتتبع الوضع بدقة فائقة، وفقدان الزاوية المتخصص لحل غموض حدود OBB.
استكشاف نماذج بديلة
بينما يمثل YOLO26 قمة التكنولوجيا الحالية، يدعم Ultralytics مجموعة متنوعة من النماذج المصممة خصيصًا لحالات استخدام مختلفة.
بالنسبة للمطورين الذين يديرون أنظمة قديمة لا تزال تتطلب التوسع التقليدي بدون ربط، YOLO11 خيارًا قويًا ومدعومًا بشكل كبير ضمن Ultralytics . بالإضافة إلى ذلك، بالنسبة للسيناريوهات التي تتطلب بشكل صريح بنى قائمة على المحولات، RT-DETR يوفر الكشف في الوقت الفعلي باستخدام محولات الرؤية، مما يسد الفجوة بين آليات الانتباه المتطورة وسرعات التنفيذ في الوقت الفعلي.
في الختام، في حين أن EfficientDet يوفر رؤى أكاديمية حول توسيع نطاق المركبات YOLOv7 أداءً قوياً في الوقت الفعلي، فإن الشركات الحديثة تحصل على أفضل الخدمات من خلال اعتماد Ultralytics . من خلال الاستفادة من YOLO26، يمكن للفرق ضمان أقصى أداء وأقل احتكاك في التدريب وتأمين مستقبل عمليات نشر الذكاء الاصطناعي.