تخطي إلى المحتوى

YOLOv10 مقارنة بـ YOLOv7: مقارنة فنية تفصيلية

يعد اختيار نموذج الكشف عن الكائنات المناسب أمرًا بالغ الأهمية لمشاريع رؤية الكمبيوتر، مما يؤثر على الأداء والسرعة واستخدام الموارد. تقدم هذه الصفحة مقارنة فنية بين YOLOv10 و YOLOv7، وهما نموذجان مهمان في عائلة You Only Look Once (YOLO)، لمساعدتك في اختيار الأنسب لاحتياجاتك. سوف نتعمق في بنيتهما ومقاييس الأداء وحالات الاستخدام المثالية.

YOLOv10

يمثل YOLOv10، الذي قدمه باحثون من جامعة تسينغ هوا في مايو 2024، تطورًا كبيرًا في اكتشاف الكائنات في الوقت الفعلي. يتمثل ابتكاره الأساسي في تحقيق اكتشاف شامل للكائنات عن طريق إلغاء الحاجة إلى التثبيط غير الأقصى (NMS) أثناء الاستدلال. يقلل هذا الإنجاز من النفقات الحسابية ويقلل من زمن انتقال الاستدلال، مما يجعل النشر أكثر كفاءة.

تفاصيل فنية:

البنية والميزات الرئيسية

يقدم YOLOv10 العديد من الابتكارات المعمارية التي تهدف إلى تحسين المفاضلة بين السرعة والدقة:

  • تدريب بدون NMS: باستخدام تعيينات ثنائية متسقة لتعيين التسميات، يتجنب YOLOv10 التنبؤات الزائدة ويزيل الحاجة إلى خطوة المعالجة اللاحقة NMS. هذا يبسط مسار النشر ويجعل النموذج حقًا من طرف إلى طرف.
  • تصميم مدفوع بالكفاءة والدقة الشاملة: تم تحسين بنية النموذج بشكل شامل لكل من الكفاءة والأداء. يتضمن ذلك تقديم رأس تصنيف خفيف الوزن واستخدام تقليل الأبعاد المفصول مكانيًا وقنواتيًا لتقليل التكرار الحسابي مع تعزيز قدرة النموذج.
  • نهج خالٍ من المربعات المحورية (Anchor-Free Approach): مثل نماذج YOLO الحديثة الأخرى، فإنه يتبنى تصميم كاشف خالٍ من المربعات المحورية (anchor-free detector)، مما يبسط رأس الكشف ويحسن التعميم.
  • تكامل Ultralytics سلس: تم دمج YOLOv10 بالكامل في نظام Ultralytics البيئي، ويستفيد من تجربة مستخدم مبسطة مع Python API بسيط و أوامر CLI قوية. هذا يجعل التدريب والتحقق من الصحة والنشر في غاية السهولة.

نقاط القوة

  • كفاءة هي الأحدث على مستوى التقنية: يؤدي التصميم الخالي من NMS والتحسينات المعمارية إلى سرعات استدلال أسرع وزمن انتقال أقل بشكل ملحوظ، وهو أمر بالغ الأهمية للتطبيقات في الوقت الفعلي.
  • دقة تنافسية: تحافظ YOLOv10 على دقة قوية مع تقليل حجم النموذج والتكلفة الحسابية بشكل كبير مقارنة بأسلافها.
  • تبسيط عملية النشر: إن إزالة NMS تخلق مسارًا حقيقيًا للكشف الشامل، مما يسهل عملية النشر، خاصة على الأجهزة الطرفية.
  • قابلية تطوير ممتازة: يقدم مجموعة من النماذج من Nano (N) إلى Extra-large (X)، لتلبية احتياجات الأداء المتنوعة من الأجهزة الطرفية ذات الموارد المحدودة إلى خوادم الحوسبة السحابية القوية.

نقاط الضعف

  • نموذج أحدث: باعتباره إصدارًا حديثًا، قد يكون دعم المجتمع وعدد عمليات التكامل مع الجهات الخارجية أقل شمولاً مقارنة بالنماذج الأكثر رسوخًا مثل YOLOv7 أو Ultralytics YOLOv8.

تعرف على المزيد حول YOLOv10

YOLOv7

وضعت YOLOv7، التي تم إصدارها في يوليو 2022، بسرعة معيارًا جديدًا للكشف عن الكائنات بتوازنها الملحوظ بين السرعة والدقة. وقد قدمت، التي تم تطويرها بواسطة باحثين في معهد علوم المعلومات، أكاديميا سينيكا، العديد من التحسينات المعمارية واستراتيجيات التدريب المعروفة باسم "trainable bag-of-freebies" لتعزيز الأداء دون زيادة تكاليف الاستدلال.

تفاصيل فنية:

البنية والميزات الرئيسية

يتضمن هيكل YOLOv7 العديد من التحسينات الرئيسية التي دفعت حدود كشف الأجسام في الوقت الفعلي في وقت إصداره:

  • شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN): يحسن هيكل الشبكة المتقدم هذا قدرة النموذج على تعلم ميزات متنوعة مع الحفاظ على تدفق تدرج فعال، مما يؤدي إلى دقة أفضل وتقارب أسرع.
  • توسيع نطاق النموذج للنماذج القائمة على التسلسل: قدم YOLOv7 طرق توسيع نطاق مركبة تقوم بضبط عمق النموذج وعرضه بذكاء لتحسين الأداء عبر ميزانيات حسابية مختلفة.
  • حقيبة الحيل المجانية القابلة للتدريب: تستفيد من تقنيات التدريب المتقدمة، مثل استخدام رأس إضافي مع توجيه من الخشن إلى الدقيق، لتحسين الدقة دون إضافة أي حمل زائد أثناء الاستدلال.

نقاط القوة

  • متوسط الدقة العالية (mAP): يقدم دقة ممتازة في الكشف عن الكائنات، مما يجعله خيارًا قويًا للتطبيقات التي تكون فيها الدقة ذات أهمية قصوى.
  • استدلال سريع: يوفر سرعات استدلال تنافسية مناسبة للعديد من المهام في الوقت الفعلي، خاصة على أجهزة GPU.
  • راسخ: نظرًا لكونه متاحًا لفترة أطول، يستفيد YOLOv7 من قاعدة مجتمعية أكبر، والمزيد من الدروس التعليمية، واعتماد أوسع في مختلف المشاريع.

نقاط الضعف

  • اعتمادية NMS: على عكس YOLOv10، يعتمد YOLOv7 على خطوة المعالجة اللاحقة NMS، مما يزيد من زمن الوصول للاستدلال الإجمالي ويعقد خط أنابيب النشر.
  • أقل كفاءة: بالمقارنة مع YOLOv10، تحتوي نماذج YOLOv7 بشكل عام على المزيد من المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs) لمستوى مماثل من الدقة، مما يجعلها أقل كفاءة.

تعرف على المزيد حول YOLOv7

مقارنة الأداء: YOLOv10 مقابل YOLOv7

عند مقارنة الأداء، يُظهر YOLOv10 ميزة واضحة في الكفاءة. المقارنة الأكثر مباشرة هي بين YOLOv10-M و YOLOv7-L. كما هو موضح في الجدول أدناه، يحقق YOLOv10-M نسبة mAPval متطابقة تقريبًا تبلغ 51.3% مقارنة بنسبة 51.4% لـ YOLOv7-L. ومع ذلك، فإن YOLOv10-M أكثر كفاءة بشكل ملحوظ: فهو أسرع (5.48 مللي ثانية مقابل 6.84 مللي ثانية على TensorRT)، ولديه أقل من نصف عدد المعلمات (15.4 مليون مقابل 36.9 مليون)، ويتطلب موارد حسابية أقل بكثير (59.1 مليار FLOPs مقابل 104.7 مليار FLOPs). هذا يسلط الضوء على التصميم المعماري الفائق لـ YOLOv10، والذي يوفر دقة مماثلة بكفاءة أكبر بكثير.

النموذج الحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

الخلاصة

يعتبر كل من YOLOv10 و YOLOv7 من نماذج الكشف عن الأجسام القوية، لكن YOLOv10 يمثل الخطوة التالية في كفاءة الكشف في الوقت الفعلي. يوفر تصميمه الخالي من NMS حلاً شاملاً حقيقيًا أسرع وأخف وزنًا وأسهل في النشر دون التضحية بالدقة. بالنسبة للمشاريع الجديدة، وخاصة تلك التي تستهدف الذكاء الاصطناعي المتطور أو تتطلب الحد الأدنى من زمن الوصول، فإن YOLOv10 هو الخيار الموصى به.

في حين أن YOLOv7 لا يزال نموذجًا قادرًا، إلا أن اعتماده على NMS وهندسته المعمارية الأقل كفاءة تجعله مناسبًا بشكل أفضل للمشاريع القديمة أو السيناريوهات التي تعتبر فيها موارد مجتمعه الواسعة اعتبارًا أساسيًا. بالنسبة للمطورين الذين يبحثون عن أفضل أداء وسهولة في الاستخدام ونظام بيئي شامل، فإن نماذج Ultralytics مثل YOLO10 تقدم تجربة فائقة. إن التكامل مع Ultralytics HUB يزيد من تبسيط التدريب والنشر، مما يجعل رؤية الكمبيوتر المتقدمة أكثر سهولة من أي وقت مضى.

استكشف نماذج أخرى

للمزيد من الاستكشاف، ضع في اعتبارك هذه النماذج الأخرى الحديثة المتوفرة في وثائق Ultralytics:

  • Ultralytics YOLOv8: نموذج متعدد الاستخدامات للغاية يتفوق في مهام رؤية متعددة، بما في ذلك الاكتشاف و التجزئة و تقدير الوضع.
  • YOLOv9: يقدم ابتكارات مثل معلومات التدرج القابلة للبرمجة (PGI) لمعالجة فقدان المعلومات في الشبكات العميقة.
  • YOLO11: أحدث نموذج رسمي من Ultralytics، يقدم أداءً حديثًا، ودعمًا للمهام المتعددة، وسهولة استخدام لا مثيل لها.


📅 تم إنشاؤه منذ سنة واحدة ✏️ تم التحديث منذ شهر واحد

تعليقات