تخطي إلى المحتوى

YOLOv6.0 مقابل EfficientDet: مقارنة تقنية شاملة

يتطلب اختيار البنية المثلى لمشاريع رؤية الكمبيوتر فهمًا عميقًا للمفاضلات بين السرعة والدقة وجدوى النشر. توفر صفحة المقارنة هذه تحليلاً متعمقًا لنموذجين متميزين لاكتشاف الكائنات: YOLOv6-3.0 و EfficientDet. بينما ساهم كلا النموذجين بشكل كبير في هذا المجال، غالبًا ما تستفيد عمليات النشر الحديثة على الحافة (edge deployments) والنماذج الأولية السريعة من أطر عمل أكثر توحيدًا مثل منصة Ultralytics.

فيما يلي مخطط تفاعلي يوضح بصريًا اختلافات الأداء بين هذه النماذج لمساعدتك على فهم ملفات تعريف زمن الاستجابة والدقة الخاصة بكل منها.

YOLOv6.0: إنتاجية على مستوى صناعي

تم تصميم YOLOv6.YOLOv6 بشكل صريح من قبل Meituan ليكون إطار عمل عالي الأداء للكشف عن الكائنات في مرحلة واحدة ومصمم خصيصًا للتطبيقات الصناعية. ويركز بشكل كبير على تعظيم الإنتاجية على GPU مما يجعله خيارًا قويًا لخطوط الإنتاج عالية السرعة وتحليلات الفيديو غير المتصلة بالإنترنت.

  • المؤلفون: تشوي لي، لولو لي، ييفي جينغ، هونغليانغ جيانغ، منغ تشنغ، بو تشانغ، زيدان كي، شياومينغ شو، وشيانغشيانغ تشو
  • المنظمة: Meituan
  • التاريخ: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: YOLOv6

أبرز الملامح المعمارية

تعتمد بنية YOLOv6 على وحدة تسلسل ثنائي الاتجاه (BiC) لتحسين دمج الميزات عبر مستويات مختلفة. لضمان سرعات استدلال عالية، تستفيد من شبكة EfficientRep الأساسية، والتي تم تحسينها بشكل كبير GPU . علاوة على ذلك، تستخدم استراتيجية التدريب بمساعدة المثبت (AAT)، التي تدمج مزايا كل من أجهزة الكشف القائمة على المثبت وأجهزة الكشف الخالية من المثبت خلال مرحلة التدريب، مع الحفاظ على خط استدلال خالٍ من المثبت لتقليل زمن الاستجابة.

نقاط القوة والضعف

يتميز YOLOv6 في البيئات التي تتوفر فيها GPU مخصصة، حيث يوفر استنتاجات فورية سريعة للغاية باستخدام TensorRT. ومع ذلك، فإن اعتماده الكبير على تحسينات الأجهزة المحددة يمكن أن يؤدي إلى أداء دون المستوى الأمثل على أجهزة الذكاء الاصطناعي الطرفية CPU. بالإضافة إلى ذلك، على الرغم من أنه يدعم بعض التكمية، إلا أن النظام البيئي يفتقر إلى البساطة الشاملة الموجودة في Ultralytics الحديثة.

تعرف على المزيد حول YOLOv6

EfficientDet: بنية AutoML قابلة للتطوير

تم تطوير EfficientDet بواسطة Google ، وهو يتبع نهجًا مختلفًا تمامًا. فبدلاً من إنشاء الشبكة يدويًا، استخدم المؤلفون التعلم الآلي التلقائي (AutoML) لتصميم بنية قابلة للتطوير توازن بين المعلمات وعمليات FLOPs والدقة.

  • المؤلفون: مينغشينغ تان، رومينغ بانغ، وكووك في. لي
  • المنظمة: Google
  • التاريخ: 2019-11-20
  • Arxiv: 1911.09070
  • GitHub: google

أبرز الملامح المعمارية

قدم EfficientDet شبكة هرمية ثنائية الاتجاه (BiFPN)، والتي تسمح بدمج الميزات متعددة المقاييس بسهولة وسرعة. بالاقتران مع طريقة قياس مركبة تقيس الدقة والعمق والعرض بشكل موحد لجميع شبكات العمود الفقري وشبكات الميزات وشبكات التنبؤ بالصناديق/الفئات، تتراوح نماذج EfficientDet من d0 المدمجة للغاية إلى d7 الضخمة.

نقاط القوة والضعف

يتميز EfficientDet بكفاءة عالية في المعلمات. فهو يحقق متوسط دقة قوي (mAP) مع عدد قليل نسبيًا من المعلمات مقارنة بأجهزة الكشف عن الكائنات القديمة. ومع ذلك، فإن البنية متجذرة بعمق في TensorFlow القديمة. وهذا يؤدي إلى إدارة معقدة للتبعية، ودورات تدريب أبطأ، ومتطلبات ذاكرة أعلى أثناء التدريب مقارنة PyTorch المحسّنة. علاوة على ذلك، فإن سرعة الاستدلال على وحدات معالجة الرسومات الحديثة أبطأ بكثير من YOLO الحديثة.

تعرف على المزيد حول EfficientDet

مقارنة مفصلة للأداء

يوضح الجدول أدناه المقارنة بين المواصفات الفنية لـ YOLOv6. YOLOv6 و EfficientDet عبر مختلف المقاييس. لاحظ كيف يهيمن YOLOv6. YOLOv6 في GPU بينما يرتفع EfficientDet إلى mAP أعلى mAP حساب زمن انتقال كبير.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

زمن الانتقال مقابل الإنتاجية

عند مقارنة النماذج، تذكر أن FLOPs وعدد المعلمات لا يرتبطان دائمًا بشكل مثالي بزمن الاستجابة في العالم الواقعي. تم تحسين YOLOv6. YOLOv6 لـ TensorRT حيث يحقق سرعات تصل إلى أجزاء من الثانية على الرغم من احتوائه على عدد FLOPs أعلى من نماذج EfficientDet الأقل مستوى.

ميزة النظام البيئي لـ Ultralytics

بينما يخدم YOLOv6. YOLOv6 و EfficientDet مجالات محددة، تتطلب مشاريع الرؤية الحاسوبية الحديثة التنوع وسهولة الاستخدام ونظامًا بيئيًا جيد الصيانة. وهنا يأتي دور Ultralytics YOLO تتفوق حقًا.

سهولة الاستخدام وكفاءة التدريب

على عكس EfficientDet، الذي يتطلب التنقل بين TensorFlow المعقدة، فإن Ultralytics مبنية على PyTorch البديهي. توفر Ultralytics واجهة برمجة تطبيقات مبسطة تعمل على تبسيط دورة حياة التعلم الآلي بأكملها. يتطلب تدريب Ultralytics CUDA أقل بكثير، مما يسرع التجارب ويقلل من تكاليف الحوسبة.

تنوع لا مثيل له

YOLOv6.YOLOv6 و EfficientDet مرتبطان بشكل أساسي باكتشاف الكائنات. في المقابل، تتميز Ultralytics الحديثة بطبيعتها بأنها متعددة الوسائط. تتيح لك واجهة واحدة تدريب النماذج لمهام تقسيم المثيلات وتقدير الوضع وتصنيف الصور ومربع الحدود الموجه (OBB).

تقديم Ultralytics

بالنسبة للمطورين الذين يبحثون عن التوازن المثالي في الأداء، يمثل Ultralytics تحولًا جذريًا. تم إصداره في يناير 2026، ويقدم العديد من الابتكارات الثورية التي تفوق كل من YOLOv6 EfficientDet:

  • تصميم شامل بدون NMS: يلغي YOLO26 بطبيعته الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، مما يقلل بشكل كبير من تباين زمن الاستجابة ويبسط منطق النشر على الأجهزة الطرفية.
  • مُحسِّن MuSGD: مستوحى من تدريب نماذج اللغة الكبيرة (LLM)، يضمن هذا المحسِّن الهجين تدريبًا مستقرًا وتقاربًا سريعًا بشكل لا يصدق.
  • استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): مع إزالة Distribution Focal Loss (DFL)، يعد YOLO26 أكثر كفاءة بكثير على وحدات CPU وأجهزة إنترنت الأشياء منخفضة الطاقة مقارنة بالنماذج القديمة.
  • ProgLoss + STAL: These advanced loss functions deliver massive improvements in small object recognition, making YOLO26 ideal for drone and aerial imagery applications.

تعرف على المزيد حول YOLO26

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLOv6 و EfficientDet على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار YOLOv6

YOLOv6 خيار قوي لـ:

  • النشر الصناعي المدرك للأجهزة: سيناريوهات حيث يوفر تصميم النموذج المدرك للأجهزة وإعادة التكوين الفعالة أداءً محسنًا على أجهزة مستهدفة محددة.
  • detect سريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الخام على GPU لمعالجة الفيديو في الوقت الفعلي في بيئات محكومة.
  • تكامل نظام Meituan البيئي: الفرق التي تعمل بالفعل ضمن مكدس تقنية Meituan والبنية التحتية للنشر.

متى تختار EfficientDet

يوصى باستخدام EfficientDet في الحالات التالية:

  • خطوط أنابيب Google Cloud و TPU: الأنظمة المدمجة بعمق مع واجهات برمجة تطبيقات Google Cloud Vision أو بنية TPU التحتية حيث يتمتع EfficientDet بتحسين أصلي.
  • بحث التحجيم المركب: قياس الأداء الأكاديمي الذي يركز على دراسة تأثيرات تحجيم عمق الشبكة وعرضها ودقتها المتوازن.
  • النشر على الأجهزة المحمولة عبر TFLite: المشاريع التي تتطلب بشكل خاص تصدير TensorFlow Lite لأجهزة Android أو أجهزة Linux المدمجة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
  • بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.

مثال على التنفيذ: تدريب YOLO26

يوضح الكود التالي بساطة Ultralytics . إن تدريب نموذج متطور أمر سهل للغاية، حيث لا يتطلب سوى تحميل الأوزان والإشارة إلى بياناتك.

from ultralytics import YOLO

# Load the highly optimized YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on a dataset with automatic hyperparameter handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model to check mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")

# Run inference on a test image seamlessly
prediction = model("https://ultralytics.com/images/bus.jpg")

نماذج أخرى يجب أخذها في الاعتبار

إذا كنت تستكشف المشهد الأوسع لنماذج الرؤية الحاسوبية، ففكر في هذه البدائل:

  • YOLO11: السلف الناجح للغاية لـ YOLO26، يقدم قدرات قوية متعددة المهام ودعمًا مجتمعيًا واسع النطاق.
  • YOLOv10: أول بنية YOLO تقدم تدريبًا خاليًا من NMS، مما يمهد الطريق للكشف الحديث الشامل.
  • RT-DETR: للسيناريوهات التي تُفضل فيها المعماريات القائمة على المحولات وآليات الانتباه على الشبكات العصبية التلافيفية التقليدية (CNNs).

الخلاصة

بينما يوفر YOLOv6.YOLOv6 GPU صناعية ممتازة ويُظهر EfficientDet إمكانات AutoML في إنشاء شبكات قابلة للتطوير وفعالة من حيث المعلمات، فإن كلا النموذجين يظهران قيودًا في سهولة النشر وتعدد المهام الحديثة.

بالنسبة للغالبية العظمى من التطبيقات في العالم الواقعي — من نشر الحافة المتنقلة إلى التحليلات المستندة إلى السحابة — يوفر Ultralytics توازنًا لا مثيل له في الأداء. من خلال اعتماد YOLO26، يحصل المطورون على إمكانية الوصول إلى استدلال متطور NMS ووظائف خسارة متقدمة للأجسام الصغيرة، وخط أنابيب تدريب موحد وموثق جيدًا يعمل على تسريع المسار من النموذج الأولي إلى الإنتاج بشكل كبير.


تعليقات