تخطي إلى المحتوى

EfficientDet مقابل YOLOv7: استكشاف بنى الكشف عن الكائنات في الوقت الفعلي

يعد اختيار بنية الشبكة العصبية الأكثر فعالية أمرًا بالغ الأهمية لنجاح أي مبادرة في مجال الرؤية الحاسوبية. مع تزايد الطلب على حلول الذكاء الاصطناعي عالية الأداء، YOLOv7 مقارنة النماذج الراسخة مثل EfficientDet و YOLOv7 أمرًا ضروريًا للمطورين الذين يهدفون إلى تحسين الدقة والكفاءة الحسابية.

يستكشف هذا التحليل التقني الشامل الفروق الدقيقة في البنية ومقاييس الأداء وسيناريوهات النشر المثالية لكلا النموذجين. بالإضافة إلى ذلك، سنوضح لماذا يوفر النظام البيئي المتكامل الذي توفره Ultralytics— والذي يتوج بأحدث إصدار Ultralytics — بديلاً متميزًا لمهام الرؤية الحاسوبية الحديثة.

فهم EfficientDet

تم تصميم EfficientDet لتحقيق أقصى قدر من الدقة مع إدارة تكاليف الحوسبة بشكل منهجي عبر مختلف قيود الموارد. وقد حقق ذلك من خلال نهج مبتكر للتوسع ودمج الميزات.

تفاصيل EfficientDet:
المؤلفون: Mingxing Tan, Ruoming Pang, and Quoc V. Le
المنظمة: Google
التاريخ: 2019-11-20
أرشيف: EfficientDet: كشف الكائنات القابل للتطوير والفعال
GitHub: مستودع Google AutoML

الهندسة المعمارية والابتكارات

في جوهره، يستخدم EfficientDet شبكة هرمية ثنائية الاتجاه للميزات (BiFPN). على عكس شبكات FPN التقليدية، تسمح BiFPN بدمج الميزات متعددة المقاييس بسهولة وسرعة من خلال إدخال أوزان قابلة للتعلم لمعرفة أهمية ميزات الإدخال المختلفة. يتم دمج ذلك مع طريقة قياس مركبة تقوم بتوسيع دقة وعمق وعرض الشبكة الأساسية وشبكة الميزات وشبكات التنبؤ بالمربع/الفئة بشكل موحد في وقت واحد.

نقاط القوة والضعف

يتميز EfficientDet بقدرته العالية على التوسع. وتتميز نسخه الأصغر حجماً (d0-d2) بكفاءة عالية في المعلمات، مما يجعلها مناسبة للبيئات ذات القيود الصارمة على التخزين. أما النسخ الأكبر حجماً (مثل d7) فتتجاوز حدود متوسط الدقة (mAP) للمعالجة المتطورة في وضع عدم الاتصال.

ومع ذلك، فإن EfficientDet يعتمد بشكل كبير على TensorFlow القديمة وخطوط أنابيب AutoML المعقدة. هذه البنية التحتية القديمة تجعل من الصعب للغاية دمجها في سير العمل الحديث PyTorch. علاوة على ذلك، فإنها تعاني من تأخر كبير في الاستدلال على الأجهزة الطرفية عند التوسع إلى متغيرات أعلى دقة.

تعرف على المزيد حول EfficientDet

فهم YOLOv7

أحدثت YOLOv7، التي تم طرحها في عام 2022، قفزة هائلة في السرعة والدقة للتطبيقات في الوقت الفعلي، مما أرسى أساسًا جديدًا YOLO الشهيرة على نطاق واسع في ذلك الوقت.

تفاصيل YOLOv7:
المؤلفون: تشين-ياو وانغ، أليكسي بوتشكوفسكي، وهونغ-يوان مارك لياو
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2022-07-06
Arxiv: YOLOv7: مجموعة من الميزات المجانية القابلة للتدريب تحدد أحدث ما توصلت إليه التقنيات في أجهزة detect الكائنات في الوقت الفعلي
GitHub: المستودع الرسمي لـ YOLOv7

الهندسة المعمارية والابتكارات

YOLOv7 شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN). يعمل هذا التحسين المعماري على تحسين قدرة الشبكة على التعلم دون تدمير مسار التدرج الأصلي، مما يسمح للنموذج بتعلم ميزات أكثر تنوعًا بكفاءة. بالإضافة إلى ذلك، فإنه ينفذ "حقيبة هدايا قابلة للتدريب"، مستفيدًا من تقنيات مثل إعادة تحديد المعلمات المخطط لها وتعيين التسميات الديناميكية لتعزيز الدقة دون زيادة تكلفة الاستدلال.

نقاط القوة والضعف

YOLOv7 في السيناريوهات في الوقت الفعلي، مثل تحليلات الفيديو والملاحة الروبوتية عالية السرعة. وهو يتكيف بشكل استثنائي مع وحدات معالجة الرسومات (GPU) على مستوى الخادم ويوفر PyTorch محلي، مما يجعله متاحًا للباحثين الأكاديميين.

على الرغم من سرعته المذهلة، لا يزال YOLOv7 يعتمد على Non-Maximum Suppression (NMS) للمعالجة اللاحقة، مما قد يؤدي إلى زمن استجابة متغير في المشاهد المزدحمة. علاوة على ذلك، فإن استهلاكه للذاكرة أثناء التدريب أكبر بشكل ملحوظ من الأجيال الأحدث، مما يتطلب أجهزة أكثر قوة للتعامل مع أحجام الدفعات الكبيرة.

تعرف على المزيد حول YOLOv7

مقارنة الأداء والمقاييس

عند مقارنة هذه النماذج، من الضروري دراسة التوازن بين الدقة وسرعة الاستدلال وحجم المعلمات. فيما يلي تقييم مفصل لمختلف YOLOv7 EfficientDet و YOLOv7 .

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

أداء Takeaway

بينما يحقق EfficientDet-d7 أعلى mAP إلا أنه يتطلب ما يقرب من 128 مللي ثانية على GPU T4. وفي تناقض صارخ، يحقق YOLOv7x معدل mAP مماثل mAP 53.1 mAP 11.57 مللي ثانية بسرعة مذهلة، مما يدل على قفزة جيلية هائلة في كفاءة الحوسبة للنشر في الوقت الفعلي.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين EfficientDet وYOLOv7 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار EfficientDet

يعد EfficientDet خيارًا قويًا لـ:

  • خطوط أنابيب Google Cloud و TPU: الأنظمة المدمجة بعمق مع واجهات برمجة تطبيقات Google Cloud Vision أو بنية TPU التحتية حيث يتمتع EfficientDet بتحسين أصلي.
  • بحث التحجيم المركب: قياس الأداء الأكاديمي الذي يركز على دراسة تأثيرات تحجيم عمق الشبكة وعرضها ودقتها المتوازن.
  • النشر على الأجهزة المحمولة عبر TFLite: المشاريع التي تتطلب بشكل خاص تصدير TensorFlow Lite لأجهزة Android أو أجهزة Linux المدمجة.

متى تختار YOLOv7

YOLOv7 في الحالات التالية:

  • المقارنة المعيارية الأكاديمية: لإعادة إنتاج أحدث النتائج من حقبة 2022 أو دراسة تأثيرات E-ELAN وتقنيات "حقيبة المجانيات" القابلة للتدريب.
  • أبحاث إعادة التوسيط (Reparameterization): التحقيق في الالتفافات المعاد توسيطها المخطط لها واستراتيجيات قياس النماذج المركبة.
  • مسارات مخصصة موجودة: المشاريع ذات المسارات المخصصة بشكل كبير والمبنية حول بنية YOLOv7 المحددة والتي لا يمكن إعادة هيكلتها بسهولة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
  • بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.

ميزة Ultralytics

يتجاوز اختيار البنية الصحيحة مجرد المقاييس الأولية؛ فهو يتضمن تقييم دورة حياة التعلم الآلي بأكملها. يوفر النظام البيئي لـ Ultralytics تجربة مطور لا مثيل لها، مما يقلل بشكل كبير من عوائق الدخول لعمليات نشر الذكاء الاصطناعي القوية.

  • سهولة الاستخدام: توفر Ultralytics واجهة برمجة تطبيقات Python موحدة للغاية. يمكن للمطورين تدريب النماذج والتحقق منها وتصديرها في بضعة أسطر فقط من التعليمات البرمجية، مما يلغي الحاجة إلى إدارة قواعد التعليمات البرمجية المعقدة والمجزأة النموذجية لـ EfficientDet.
  • نظام بيئي جيد الصيانة: بالاستفادة من التحديثات السريعة، والوثائق الشاملة، والمجتمع النشط، تضمن Ultralytics التوافق مع أحدث أطر النشر مثل TensorRT و OpenVINO.
  • متطلبات الذاكرة: من خلال الاستفادة من مُحملات بيانات PyTorch المحسّنة للغاية وهياكل الشبكة المبسّطة، تتطلب نماذج Ultralytics YOLO ذاكرة CUDA أقل بكثير أثناء التدريب مقارنة بالشبكات متعددة الفروع والنماذج الثقيلة القائمة على المحولات (transformers).
  • تعدد الاستخدامات: على عكس البنى القديمة المرتبطة بشكل صارم باكتشاف الصناديق المحيطة، تُعد نماذج Ultralytics قوى عاملة متعددة المهام تدعم تجزئة الكائنات، تقدير الوضعيات، والصناديق المحيطة الموجهة (OBB).

كفاءة التدريب مع Ultralytics

يوضح الكود التالي بساطة تدريب نموذج متطور باستخدامPython وهو ما يتناقض تمامًا مع تكوين TensorFlow القديمة.

from ultralytics import YOLO

# Load the highly recommended YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model automatically handling hyperparameter tuning and augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the model to TensorRT for deployment
model.export(format="engine")

المعيار الجديد: YOLO26

بينما أرسى YOLOv7 EfficientDet الأساس للرؤية الحاسوبية الحديثة، تطور المشهد بشكل كبير مع طرح Ultralytics في يناير 2026. صُمم YOLO26 لتحقيق دقة فائقة وأداء لا مثيل له، وهو الخيار الأمثل لجميع مشاريع الرؤية الجديدة.

ابتكارات YOLO26 الرئيسية

  • تصميم خالٍ من NMS وشامل: استنادًا إلى الأسس التي وضعها YOLOv10، فإن YOLO26 شامل بطبيعته. من خلال الإزالة الكاملة لمعالجة قمع غير الحد الأقصى (NMS) اللاحقة، فإنه يوفر زمن انتقال أقل وأكثر اتساقًا، وهو أمر بالغ الأهمية للأنظمة الحساسة للسلامة مثل القيادة الذاتية.
  • استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): بفضل إزالة Distribution Focal Loss (DFL)، يتميز YOLO26 بعملية تصدير مبسطة بشكل كبير وسرعة لا مثيل لها على الأجهزة الطرفية مثل Raspberry Pi، مما يجعله البطل بلا منازع في الحوسبة الطرفية.
  • مُحسِّن MuSGD: يدمج YOLO26 مُحسِّن MuSGD الثوري — وهو مزيج من SGD و Muon مستوحى من ابتكارات تدريب نماذج اللغة الكبيرة (LLM) من Moonshot AI. يؤدي هذا إلى ديناميكيات تدريب مستقرة بشكل ملحوظ ومعدلات تقارب أسرع بكثير.
  • ProgLoss + STAL: يعمل دمج الخسارة التدريجية (Progressive Loss) وخسارة المحاذاة المستهدفة بالحجم (Scale-Targeted Alignment Loss) على تحسين قدرة النموذج بشكل كبير على detect الأجسام الدقيقة، مما يحل مشكلة كبيرة لصور الطائرات بدون طيار وأنظمة إنذار الأمان.
  • تحسينات خاصة بالمهام: YOLO26 ليس مجرد كاشف. يتميز بفقدان تجزئة دلالية ونموذج أولي متعدد المقاييس لـ تجزئة خالية من العيوب، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لـ track الوضعية فائق الدقة، وخسارة زاوية متخصصة لحل غموض حدود OBB.

تعرف على المزيد حول YOLO26

استكشاف نماذج بديلة

بينما يمثل YOLO26 قمة التكنولوجيا الحالية، يدعم Ultralytics مجموعة متنوعة من النماذج المصممة خصيصًا لحالات استخدام مختلفة.

بالنسبة للمطورين الذين يديرون أنظمة قديمة لا تزال تتطلب التوسع التقليدي بدون ربط، YOLO11 خيارًا قويًا ومدعومًا بشكل كبير ضمن Ultralytics . بالإضافة إلى ذلك، بالنسبة للسيناريوهات التي تتطلب بشكل صريح بنى قائمة على المحولات، RT-DETR يوفر الكشف في الوقت الفعلي باستخدام محولات الرؤية، مما يسد الفجوة بين آليات الانتباه المتطورة وسرعات التنفيذ في الوقت الفعلي.

في الختام، في حين أن EfficientDet يوفر رؤى أكاديمية حول توسيع نطاق المركبات YOLOv7 أداءً قوياً في الوقت الفعلي، فإن الشركات الحديثة تحصل على أفضل الخدمات من خلال اعتماد Ultralytics . من خلال الاستفادة من YOLO26، يمكن للفرق ضمان أقصى أداء وأقل احتكاك في التدريب وتأمين مستقبل عمليات نشر الذكاء الاصطناعي.


تعليقات