تخطي إلى المحتوى

EfficientDet مقابل YOLOv6.0: مقارنة تقنية شاملة

في المشهد المتطور للرؤية الحاسوبية، يعد اختيار البنية الصحيحة للكشف عن الكائنات أمرًا بالغ الأهمية للنشر الناجح. تستكشف هذه المقارنة الفروق الفنية بين EfficientDet، وهو نموذج يركز على الأبحاث من Google و YOLOv6.0، وهو كاشف من الدرجة الصناعية من Meituan. بينما قدم EfficientDet مفاهيم كفاءة رائدة مثل القياس المركب، تم تصميم YOLOv6.0 خصيصًا للتطبيقات الصناعية ذات الكمون المنخفض، مما يسلط الضوء على التحول من المعايير الأكاديمية إلى الإنتاجية في العالم الحقيقي.

مقارنة مقاييس الأداء

توضّح المعايير التالية على مجموعة بياناتCOCO المفاضلة بين الكفاءة المعمارية وزمن الاستنتاج. يُظهر YOLOv6.0 سرعة فائقة على أجهزة GPU مستفيدًا من تقنيات إعادة المعرفات، بينما يحافظ EfficientDet على دقة تنافسية بتكاليف حسابية أعلى.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0 م64050.0-5.2834.985.8
YOLOv6.0L64052.8-8.9559.6150.7

EfficientDet: الكفاءة القابلة للتطوير

يمثل EfficientDet نقلة نوعية في تصميم النماذج من خلال تحسين عمق الشبكة وعرضها ودقتها بشكل منهجي. واستناداً إلى العمود الفقري لشبكة EfficientNet، فقد أدخلت الشبكة الهرمية ثنائية الاتجاه (BiFPPN)، مما يسمح بدمج الميزات متعددة النطاقات بسهولة.

الابتكارات المعمارية

إن جوهر EfficientDet هو الشبكة الهرمية الثنائية للميزات (BiFPPN)، والتي تسمح بتدفق المعلومات من أعلى إلى أسفل ومن أسفل إلى أعلى، مما يدمج الميزات بشكل متكرر على مستويات مختلفة. وهذا يتناقض مع شبكات هرم السمات الأبسط (FPN) المستخدمة غالبًا في أجهزة الكشف القديمة. بالإضافة إلى ذلك، يستخدم EfficientDet مقياسًا مركبًا، وهي طريقة تعمل على قياس العمود الفقري وشبكات الهرميات الثنائية وشبكات الفئات/المربعات بشكل موحد باستخدام معامل مركب واحد $\phi$. يضمن هذا النهج المهيكل توازن الموارد عبر أبعاد النموذج، وتجنب الاختناقات التي غالبًا ما توجد في البنى المصممة يدويًا.

نقاط القوة والضعف

تتفوق EfficientDet في كفاءة البارامترات، وتحقق نسبة عالية من mAPبمعلمات أقل نسبيًا من معاصريه مثل YOLOv3. وهي فعالة بشكل خاص في مهام تصنيف الصور واكتشافها حيث يكون حجم النموذج (التخزين) قيدًا ولكن زمن الاستجابة قابل للتفاوض. ومع ذلك، يمكن أن تكون الوصلات المعقدة غير المنتظمة في طبقة BiFPPN والاستخدام المكثف للالتفافات العميقة القابلة للفصل غير فعالة على وحدات معالجة الرسومات القياسية، مما يؤدي إلى زمن انتقال أعلى للاستدلال على الرغم من انخفاض عدد عمليات التشغيل.

زمن الاستجابة مقابل عدد مرات التكرار

على الرغم من أن EfficientDet يحتوي على عمليات FLOP منخفضة (عمليات النقطة العائمة)، إلا أن هذا لا يُترجم دائمًا إلى سرعة أسرع على وحدات معالجة الرسومات. يمكن أن تؤدي تكاليف الوصول إلى الذاكرة لتلافيفها القابلة للفصل بعمق إلى اختناق الأداء مقارنةً بالتلافيف القياسية المستخدمة في نماذج YOLO .

تعرف على المزيد حول EfficientDet

YOLOv6.0: السرعة الصناعية

يبتعد YOLOv6.0 عن المقاييس الأكاديمية البحتة للتركيز على الإنتاجية في العالم الحقيقي، وتحديدًا تحسين قيود الأجهزة الموجودة في البيئات الصناعية.

  • المؤلفون: تشوي لي، لولو لي، ييفي قنغ، هونغليانغ جيانغ، منغ تشنغ، بو تشانغ، زيدان كه، شياومينغ شو، وشيانغشيانغ تشو
  • المنظمة: Meituan
  • التاريخ: 2023-01-13
  • Arxiv: https://arxiv.org/abs/2301.05586
  • جيثب: https:YOLOv6
  • المستندات: https:ultralytics

الهندسة المعمارية والتصميم

يستخدم YOLOv6.0 العمود الفقري EfficientRR Backbone، والذي يستخدم إعادة المعلمات (أسلوب RepVGG) لفصل البنى وقت التدريب عن البنى وقت الاستدلال. أثناء التدريب، يستخدم النموذج كتلًا معقدة متعددة الفروع لتحسين تدفق التدرج؛ وأثناء الاستدلال، يتم طيها إلى 3 \times 3$ واحد من التلافيف، مما يزيد من GPU كثافة الحوسبة. دمج الإصدار 3.0 أيضًا استراتيجيات متقدمة مثل التدريب الواعي بالتقدير الكمي (QAT) والتقطير الذاتي، مما يسمح للنموذج بالحفاظ على الدقة حتى عند تكميمه إلى دقة INT8 للنشر على الأجهزة المتطورة.

حالات الاستخدام المثالية

نظرًا لتصميمه الملائم للأجهزة، يُعدّ YOLOv6.0 مثاليًا لـ

  • التصنيع عالي السرعة: الكشف عن العيوب على السيور الناقلة سريعة الحركة حيث تكون سرعة الاستدلال غير قابلة للتفاوض.
  • أتمتة البيع بالتجزئة: تشغيل أنظمة الدفع بدون أمين الصندوق التي تتطلب التعرف على الأجسام في زمن انتقال منخفض.
  • تحليلات المدينة الذكية: معالجة تدفقات الفيديو المتعددة لتحليل حركة المرور أو أنظمة الأمن.

تعرف على المزيد حول YOLOv6.0

تحليل مقارن

ويؤدي الاختلاف في فلسفة التصميم بين هذين النموذجين إلى مزايا متميزة اعتمادًا على أجهزة النشر.

الدقة مقابل السرعة

كما هو موضّح في الجدول، يحقق YOLOv6.0l mAP (52.8) لـ EfficientDet-d6 (52.6) ولكنه يعمل أسرع 10 مرات تقريبًا على GPU T4 (8.95 مللي ثانية مقابل 89.29 مللي ثانية). تسلط هذه الفجوة الهائلة الضوء على عدم كفاءة التلافيف العميقة على الأجهزة عالية الإنتاجية مقارنةً بالتلافيف الكثيفة في YOLOv6. يحتفظ EfficientDet بميزة طفيفة في الدقة المطلقة مع متغير D7 الأكبر، ولكن بتكلفة زمن انتقال تمنع الاستدلال في الوقت الحقيقي.

التدريب وتعدد الاستخدامات

يعتمد EfficientDet بشكل كبير على نظام TensorFlow البيئي وتسريع TPU للتدريب الفعال. في المقابل، يتلاءم YOLOv6 مع نظام PyTorch البيئي، مما يجعله أكثر سهولة للباحثين بشكل عام. ومع ذلك، تم تصميم كلا النموذجين بشكل أساسي للكشف عن الكائنات. أما بالنسبة للمشاريع التي تتطلب تجزئة المثيل أو تقدير الوضع، فغالباً ما يحتاج المستخدمون إلى البحث عن شوكات خارجية أو بنى بديلة.

ميزة Ultralytics

في حين أن YOLOv6.0 و EfficientDet من النماذج القادرة, Ultralytics YOLO11 يمثّل التطور التالي في مجال الرؤية الحاسوبية، حيث يعالج قيود كلا النموذجين السابقين من خلال إطار عمل موحّد يركّز على المستخدم.

لماذا تختار Ultralytics YOLO11؟

  1. سهولة الاستخدام والنظام البيئي: على عكس المستودعات المجزأة لنماذج البحث، توفر Ultralytics تجربة سلسة. تتيح لك واجهة برمجة تطبيقاتPython المتناسقة تدريب النماذج والتحقق من صحتها ونشرها في بضعة أسطر من التعليمات البرمجية.
  2. تنوع لا مثيل له: لا يقتصر YOLO11 على المربعات المحدودة. فهو يدعم أصلاً تصنيف الصور, تجزئة المثيل, تقدير الوضعيةو المربعات المحدودة الموجهة (OBB)مما يجعله حلاً شاملاً لخطوط أنابيب الذكاء الاصطناعي المعقدة.
  3. كفاءة التدريب: تم تحسين نماذج Ultralytics لتلبية متطلبات الذاكرة، وغالباً ما تتقارب بشكل أسرع وتستخدم ذاكرة وصول عشوائي (VRAM) أقل من البنى ذات المحولات الثقيلة أو البنى الأقدم. تعمل إمكانية الوصول هذه على إضفاء الطابع الديمقراطي على تطوير الذكاء الاصطناعي المتطور لأولئك الذين ليس لديهم مجموعات حوسبة ضخمة.
  4. نظام بيئي جيد الصيانة: بدعم من مجتمع نشط وتحديثات متكررة، يضمن نظام Ultralytics البيئي بقاء مشاريعك متوافقة مع المستقبل، مع سهولة التكامل في أدوات التعليق التوضيحي للبيانات والتسجيل والنشر.

التطوير المبسط

باستخدام Ultralytics يكون التبديل من اكتشاف الكائنات إلى تجزئة المثيل بسيطًا مثل تغيير اسم النموذج (على سبيل المثال, yolo11n.pt إلى yolo11n-seg.pt). تقلل هذه المرونة بشكل كبير من وقت التطوير مقارنةً بتكييف بنيات مختلفة مثل EfficientDet للمهام الجديدة.

مثال على الكود

اختبر بساطة واجهة برمجة تطبيقات Ultralytics مقارنةً بقواعد رموز البحث المعقدة:

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")

تعرف على المزيد حول YOLO11

الخلاصة

يظل EfficientDet علامة بارزة في نظرية توسيع نطاق النموذج، وهو مثالي للأبحاث الأكاديمية أو المعالجة دون اتصال بالإنترنت حيث تكون الدقة هي المقياس الوحيد. يعمل YOLOv6.0 على دفع الظرف الخاص بالذكاء الاصطناعي المتطور الصناعي، مما يوفر سرعة ممتازة على الأجهزة المدعومة.

ومع ذلك، للحصول على حل شامل يوازن بين الأداء المتطور وإنتاجية المطورين, Ultralytics YOLO11 هو الخيار الموصى به. حيث يتيح تكامله لمهام الرؤية المتنوعة وانخفاض بصمة الذاكرة ونظام الدعم القوي للمطورين الانتقال من النموذج الأولي إلى الإنتاج بثقة.

استكشف نماذج أخرى

إذا كنت مهتمًا باستكشاف المزيد من التفاصيل، ففكر في هذه المقارنات ذات الصلة في وثائقنا:


تعليقات