تخطي إلى المحتوى

YOLOv6.0 مقابل EfficientDet: الموازنة بين السرعة والدقة في الكشف عن الكائنات

في مشهد الرؤية الحاسوبية سريع التطور، يعد اختيار البنية الصحيحة لاكتشاف الأجسام أمرًا بالغ الأهمية لنجاح مشروعك. تتعمق هذه المقارنة في YOLOv6.0 و EfficientDet، وهما نموذجان بارزان يتعاملان مع تحدي التعرف البصري من زوايا مختلفة. بينما يركز EfficientDet على كفاءة المعلمات وقابلية التوسع، تم تصميم YOLOv6.0 خصيصًا للتطبيقات الصناعية حيث يكون زمن الاستنتاج والسرعة في الوقت الفعلي غير قابل للتفاوض.

مقاييس الأداء والتحليل الفني

يكمن الاختلاف الأساسي بين هاتين البنيتين في فلسفة تصميمهما. تعتمد EfficientDet على آلية دمج ميزات متطورة تُعرف باسم BiFPPN، والتي تعمل على تحسين الدقة ولكن غالبًا على حساب السرعة الحسابية على وحدات معالجة الرسومات. وعلى العكس من ذلك، يتبنى YOLOv6.0 تصميمًا مدركًا للأجهزة، باستخدام إعادة المعلمات لتبسيط العمليات أثناء الاستدلال، مما يؤدي إلى إطارات في الثانية أعلى بكثير.

يوضح الجدول أدناه هذه المفاضلة. بينما يحقق EfficientDet-det-d7 mAP عالية في الاستنتاج، إلا أن زمن استجابته كبير. في المقابل، يوفر YOLOv6.0l دقة مماثلة مع تقليل زمن الاستدلال بشكل كبير، مما يجعله أكثر ملاءمة لسيناريوهات الاستدلال في الوقت الحقيقي.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0 م64050.0-5.2834.985.8
YOLOv6.0L64052.8-8.9559.6150.7
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

تحسين الأداء

بالنسبة لعمليات النشر الصناعية، فإن الجمع بين YOLOv6.0 مع TensorRT يمكن أن يؤدي إلى تحسينات هائلة في السرعة. تسمح البساطة المعمارية ل YOLOv6 بتعيين تعليمات أجهزة GPU بكفاءة عالية مقارنةً بشبكات هرم الميزات المعقدة الموجودة في النماذج القديمة.

YOLOv6.0: مصمم للصناعة

YOLOv6.0 هو كاشف أجسام أحادي المرحلة مصمم لسد الفجوة بين البحث الأكاديمي والمتطلبات الصناعية. وهو يعطي الأولوية للسرعة دون التضحية بالدقة اللازمة لمهام مثل فحص الجودة.

المؤلفون: تشوي لي، ولولو لي، ويفي جينغ، وهونغليانغ جيانغ، ومنغ تشنغ، وبو تشنغ، وبو تشانغ، وزيدان كي، وشياومينغ شو، وشيانغ شيانغ تشو
المنظمة:Meituan
التاريخ: 2023-01-13
Arxiv:YOLOv6 v3.0: إعادة تحميل كامل النطاق
GitHub:YOLOv6
Docs:وثائقYOLOv6

الهندسة المعمارية ونقاط القوة

يكمن جوهر YOLOv6.0 في عموده الفقري الفعال وتصميم "RepOpt". من خلال استخدام إعادة المعرفات، يفصل النموذج بين الهياكل متعددة الفروع في وقت التدريب عن الهياكل أحادية الفرع في وقت الاستدلال. وينتج عن ذلك نموذج يسهل تدريبه بتدرجات غنية ولكن سريع للغاية في التنفيذ.

  • التقطير الذاتي: توظف استراتيجية التدريب التقطير الذاتي، حيث يعمل التنبؤ بالنموذج نفسه كعلامة ناعمة لتوجيه التعلم، مما يعزز الدقة دون بيانات إضافية.
  • دعم التكميم الكمي: تم تصميمه مع وضع التكميم الكمي للنموذج في الاعتبار، مما يقلل من انخفاض الدقة عند التحويل إلى INT8 لنشر الحافة.
  • التركيز على الصناعة: مثالي للذكاء الاصطناعي في التصنيع والروبوتات حيث يكون زمن الاستجابة بالمللي ثانية مهمًا.

تعرف على المزيد حول YOLOv6.0

EfficientDet: دقة قابلة للتطوير

أحدثت EfficientDet ثورة في هذا المجال من خلال تقديم مفهوم القياس المركب لاكتشاف الأجسام. فهو يعمل على تحسين عمق الشبكة وعرضها ودقتها في وقت واحد لتحقيق أداء ممتاز لكل معلمة.

المؤلفون: Mingxing Tan, Ruoming Pang, and Quoc V. Le
المنظمة:Google
التاريخ: 2019-11-20
Arxiv:EfficientDet: الكشف عن الكائنات القابلة للتطوير والفعالة
GitHub:google

الهندسة المعمارية ونقاط القوة

يعتمد EfficientDet على العمود الفقري لشبكة EfficientNet ويقدم شبكة هرم السمات ثنائية الاتجاه (BiFPPN). تسمح بنية العنق المعقدة هذه بدمج الميزات متعددة المقاييس بسهولة وسرعة.

  • الشبكة الثنائية للشبكات ثنائية الفينيل المتعددة الوظائف: على عكس شبكات FPN التقليدية، تسمح الشبكة الثنائية للشبكات الافتراضية الأحيائية بتدفق المعلومات من أعلى إلى أسفل ومن أسفل إلى أعلى، مع تطبيق أوزان لميزات المدخلات المختلفة للتأكيد على أهميتها.
  • القياس المركب: يسمح المعامل البسيط $\phi$ للمستخدمين بتوسيع نطاق النموذج (من d0 إلى d7) اعتمادًا على الموارد المتاحة، مما يوفر منحنى دقة-حساب يمكن التنبؤ به.
  • كفاءة المعلمة: المتغيرات الأصغر (د0-د2) خفيفة الوزن للغاية من حيث حجم القرص وعمليات التشغيل المؤقتة، مما يجعلها مفيدة للبيئات ذات التخزين المحدود.

التعقيد المعماري

في حين أن BiFPPN فعالة للغاية من حيث الدقة، إلا أن أنماط الوصول غير المنتظمة إلى الذاكرة يمكن أن تجعلها أبطأ على وحدات معالجة الرسومات مقارنةً بوحدات معالجة الرسومات ذات الكتل الكثافة المنتظمة المستخدمة في بنيات YOLO . هذا هو السبب في أن EfficientDet غالبًا ما يقيس معايير EfficientDet بزمن استنتاج أعلى على الرغم من وجود عدد أقل من المعلمات.

تعرف على المزيد حول EfficientDet

حالات الاستخدام في العالم الحقيقي

غالباً ما يعتمد الاختيار بين هذه النماذج على القيود المحددة لبيئة النشر.

السيناريوهات المثالية ل YOLOv6.0

  • التصنيع عالي السرعة: الكشف عن العيوب على سيور النقل سريعة الحركة حيث يتطلب الأمر سرعة عالية في الثانية track كل عنصر.
  • الملاحة الذاتية: تمكين الروبوتات من التنقل في البيئات الديناميكية من خلال معالجة موجزات الفيديو في الوقت الفعلي.
  • حوسبة الحافة: النشر على أجهزة مثل NVIDIA Jetson حيث يجب تعظيم موارد GPU لتحقيق أقصى قدر من الإنتاجية.

السيناريوهات المثالية ل EfficientDet

  • التحليل الطبي: تحليل الصور الثابتة عالية الدقة، مثل اكتشاف الأورام في الأشعة السينية، حيث يكون وقت المعالجة أقل أهمية من الدقة.
  • الاستشعار عن بعد: معالجة صور الأقمار الصناعية دون اتصال بالإنترنت لتحديد التغيرات البيئية أو التنمية الحضرية.
  • إنترنت الأشياء منخفضة التخزين: الأجهزة ذات السعة التخزينية المحدودة للغاية التي تتطلب حجم ملف صغير النموذج (مثل EfficientDet-d0).

ميزة Ultralytics: لماذا تختار YOLO11؟

على الرغم من أن YOLOv6.0 و EfficientDet من النماذج القادرة على Ultralytics YOLO11 يمثل أحدث ما توصلت إليه تكنولوجيا الرؤية الحاسوبية. يحسّن YOLO11 أفضل سمات أجيال YOLO السابقة ويدمجها في نظام بيئي سلس وسهل الاستخدام.

المزايا الرئيسية لـ YOLO11

  1. سهولة الاستخدام: تعطي Ultralytics الأولوية لتجربة المطورين. فباستخدام واجهة برمجة تطبيقات Pythonic، يمكنك تدريب النماذج والتحقق من صحتها ونشرها في بضعة أسطر من التعليمات البرمجية، على عكس ملفات التكوين المعقدة التي غالباً ما تكون مطلوبة لـ EfficientDet.
  2. تعدد الاستخدامات: على عكس YOLOv6 و EfficientDet اللذين يعتبران نموذجين للكشف عن الكائنات في المقام الأول، يدعم YOLO11 في الأصل مهام متعددة بما في ذلك تجزئة النماذج وتقدير الوضعيات والصناديق المحدودة الموجهة والتصنيف.
  3. توازن الأداء: يحقق YOLO11 أحدث مفاضلة بين السرعة والدقة. فهو يتفوق باستمرار على البنى الأقدم على مجموعة بياناتCOCO مع الحفاظ على زمن انتقال منخفض.
  4. نظام بيئي جيد الصيانة: نماذج Ultralytics مدعومة بمجتمع نشط وتحديثات متكررة. يمكنك الوصول إلى الوثائق الشاملة والبرامج التعليمية والتكاملات السلسة مع أدوات مثل Ultralytics HUB للتدريب السحابي وإدارة مجموعة البيانات.
  5. كفاءة التدريب: صُمم YOLO11 ليكون موفرًا للموارد أثناء التدريب، وغالبًا ما يتقارب بشكل أسرع ويتطلب ذاكرةGPU أقل من النماذج المعقدة القائمة على المحولات أو البنى القديمة.
from ultralytics import YOLO

# Load the YOLO11 model (recommended over older versions)
model = YOLO("yolo11n.pt")

# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

تعرف على المزيد حول YOLO11

استكشف نماذج أخرى

إذا كنت تقوم بتقييم الخيارات المتاحة لخط أنابيب الرؤية الحاسوبية لديك، ففكر في استكشاف نماذج أخرى في كتالوج Ultralytics . إن YOLOv8 أداءً قويًا لمجموعة واسعة من المهام، في حين أن المحول القائم على المحول RT-DETR بديلاً للسيناريوهات التي تتطلب وعيًا بالسياق العالمي. للتطبيقات الخاصة بالهاتف المحمول YOLOv10 تستحق الدراسة أيضًا. يمكن أن تساعدك مقارنة هذه التطبيقات مع EfficientDet في ضبط اختيارك بما يتناسب مع متطلبات الأجهزة والدقة الخاصة بك.


تعليقات