تخطي إلى المحتوى

YOLOv10 مقابل YOLOv7: مقارنة مفصلة

يعد اختيار النموذج الصحيح للكشف عن الكائنات أمرًا بالغ الأهمية لمشاريع الرؤية الحاسوبية. تقدم Ultralytics YOLO مجموعة من النماذج المصممة خصيصًا لتلبية الاحتياجات المختلفة. تقدم هذه الصفحة مقارنة تقنية بين YOLOv10 و YOLOv7، وهما خياران شائعان لمهام اكتشاف الأجسام. سنقوم بتحليل بنيتهما ومقاييس أدائهما وتطبيقاتهما المثالية لمساعدتك في اتخاذ قرار مستنير.

الطراز الحجم
(بكسل)
مافال
50-95
السرعة
CPU ONNX
(مللي ثانية)
السرعة
T4 T4TensorRT10
(مللي ثانية)
بارامز
(م)

(ب)
يولوف 10 ن 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
يولوف 10 م 640 51.3 - 5.48 15.4 59.1
يولوف 10 ب 640 52.7 - 6.54 24.4 92.0
يولوف 10 ل 640 53.3 - 8.33 29.5 120.3
يولوف 10x 640 54.4 - 12.2 56.9 160.4
يولوف7ل 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

يولوف 10

يمثل YOLOv10، الذي قدمه باحثون من جامعة تسينغهوا في مايو 2024، أحدث ما توصل إليه الباحثون في مجال الكشف عن الأجسام في الوقت الحقيقي. يقدم آو وانغ، وهوي تشن، وليهاو ليو، وآخرون في ورقتهم البحثية التي تحمل عنوان"YOLOv10: الكشف عن الأجسام في الوقت الحقيقي من البداية إلى النهاية"، YOLOv10 كتقدم كبير يركز على كل من الكفاءة والدقة. التطبيق الرسمي متاح على GitHub. صُمم YOLOv10 للنشر من البداية إلى النهاية، حيث يعالج اعتماد إصدارات YOLO السابقة على نظام الكبح غير الأقصى (NMS).

البنية والمميزات الرئيسية:

يتميز YOLOv10 بالعديد من الابتكارات المعمارية التي تهدف إلى تعزيز السرعة وتقليل التكرار الحسابي. تشمل الميزات الرئيسية نهجًا خاليًا من الارتكاز وتصميمًا خاليًا من نظام إدارة الشبكة (NMS)، مما يؤدي إلى تبسيط المعالجة اللاحقة وتسريع الاستدلال. يتبنى النموذج استراتيجية تصميم شاملة قائمة على الكفاءة والدقة، مما يؤدي إلى تحسين المكونات المختلفة لتحقيق الحد الأدنى من النفقات العامة والقدرة القصوى. وينتج عن ذلك نموذج ليس أسرع فحسب، بل يحافظ أيضًا على دقة تنافسية، مما يجعله مناسبًا للأجهزة المتطورة وتطبيقات الوقت الحقيقي.

مقاييس الأداء والمعايير المرجعية:

كما هو موضح في جدول المقارنة، تقدم نماذج YOLOv10، خاصةً متغيري YOLOv10n و YOLOv10s، سرعات استدلال مذهلة على TensorRT حيث تحقق 1.56 مللي ثانية و 2.66 مللي ثانية على التوالي. يحقق YOLOv10n سرعة mAPval50-95 تبلغ 39.5 مع 2.3 مليون معلمة فقط و 6.7 مليار عملية فلوبس، بينما يصل YOLOv10x إلى 54.4 mAPval50-95. تُسلط هذه المقاييس الضوء على قدرة YOLOv10 على تقديم أحدث أداء مع موارد حسابية محسّنة. للحصول على فهم أعمق لمقاييس أداء YOLO راجع وثائق Ultralytics حول مقاييس أداءYOLO .

حالات الاستخدام:

إن تركيز YOLOv10 على الأداء والكفاءة في الوقت الفعلي يجعله مثاليًا للتطبيقات التي تتطلب اكتشافًا سريعًا للأجسام بموارد حسابية محدودة. تشمل حالات الاستخدام المناسبة ما يلي:

  • تطبيقات الذكاء الاصطناعي المتطورة: النشر على أجهزة الحافة للمعالجة في الوقت الفعلي في سيناريوهات مثل الكاميرات الذكية وأجهزة إنترنت الأشياء.
  • الروبوتات: تمكين التعرف على الأجسام بشكل أسرع وأكثر كفاءة للملاحة والتفاعل في الأنظمة الروبوتية، كما تمت مناقشته في دور الذكاء الاصطناعي في الروبوتات.
  • الأنظمة المستقلة: التطبيقات في المركبات ذاتية القيادة والطائرات بدون طيار حيث يكون وقت الاستجابة المنخفض أمرًا بالغ الأهمية للتشغيل الآمن والفعال.
  • الأنظمة المحمولة والمضمنة: اكتشاف الأجسام في التطبيقات المحمولة والأنظمة المدمجة ذات القدرة الحاسوبية المحدودة.

نقاط القوة:

  • كفاءة عالية: تصميم خالٍ من نظام إدارة الشبكة وبنية محسّنة لاستدلال أسرع وزمن استجابة أقل.
  • دقة تنافسية: يحافظ على دقة عالية مع تحسين السرعة بشكل ملحوظ.
  • النشر من النهاية إلى النهاية: مصممة للكشف عن الكائنات في الوقت الحقيقي بسلاسة من البداية إلى النهاية.
  • أحجام نماذج أصغر: تؤدي البنية الفعالة إلى أحجام نماذج أصغر ومعلمات أقل مقارنةً ببعض النماذج السابقة.

نقاط الضعف:

  • جديد نسبيًا: كنموذج أحدث، قد يكون لدى YOLOv10 مجتمع أصغر وأمثلة نشر أقل مقارنةً بالنماذج الأكثر رسوخاً مثل YOLOv7.
  • ضبط الأداء: قد يتطلب تحقيق الأداء الأمثل ضبطًا دقيقًا وتجريبًا بأحجام وتكوينات مختلفة للنماذج، كما هو مفصل في نصائح تدريب النماذج.

اعرف المزيد عن YOLOv10

يولوف 7

YOLOv7، الذي قدمه في يوليو 2022 كل من تشين ياو وانغ، وأليكسي بوشكوفسكي، وهونغ يوان مارك لياو، هو نموذج للكشف عن الأجسام مشهود له بالكفاءة والدقة. تم تفصيل النموذج في ورقة Arxiv البحثية بعنوان"YOLOv7: حقيبة الأجسام المجانية القابلة للتدريب تحدد أحدث ما توصلت إليه أجهزة الكشف عن الأجسام في الوقت الحقيقي"، ويوفر مستودع GitHub الرسمي تفاصيل التنفيذ. يعتمد YOLOv7 على إصدارات YOLO السابقة، ويتضمن تحسينات معمارية لزيادة الأداء إلى أقصى حد دون زيادة التكلفة الحسابية بشكل كبير.

البنية والمميزات الرئيسية:

يتضمن YOLOv7 العديد من الابتكارات المعمارية لتعزيز أدائه وكفاءته. تشمل الميزات الرئيسية ما يلي:

  • شبكات تجميع الطبقات الموسعة ذات الكفاءة الموسعة (E-ELAN): يعزز قدرات الشبكة على التعلم والتدفق المتدرج للشبكة.
  • قياس النموذج للنماذج القائمة على التسلسل: يوفر إرشادات لقياس العمق والعرض الفعال.
  • الرأس الإضافي ورأس الرصاص الخشن إلى الدقيق: يحسن كفاءة التدريب ودقة الكشف.

تُسهم هذه الميزات في قدرة YOLOv7 على تحقيق أحدث النتائج من حيث السرعة والدقة، مما يجعله خيارًا قويًا لمختلف مهام اكتشاف الأجسام.

مقاييس الأداء والمعايير المرجعية:

يُظهر YOLOv7 توازنًا قويًا بين السرعة والدقة. كما هو موضح في الجدول، يحقق YOLOv7l سرعة mAPval50-95 تبلغ 51.4، بينما يصل YOLOv7x إلى 53.1 mAPval50-95. على الرغم من أنه أبطأ قليلًا من YOLOv10n و YOLOv10s في سرعة الاستدلال في TensorRT إلا أن نماذج YOLOv7 لا تزال تقدم أداءً تنافسيًا، خاصةً عند النظر في أحجام نماذج YOLOv7 الأكبر. للاطلاع على المقاييس التفصيلية، راجع وثائق YOLOv7.

حالات الاستخدام:

إن توازن YOLOv7 بين الدقة والكفاءة يجعله مناسبًا للتطبيقات التي تتطلب اكتشافًا موثوقًا للأجسام في سيناريوهات الوقت الفعلي. تشمل حالات الاستخدام المثالية ما يلي:

  • المركبات ذاتية القيادة: الكشف القوي عن الأجسام في بيئات القيادة المعقدة، باعتباره أمراً بالغ الأهمية للذكاء الاصطناعي في السيارات ذاتية القيادة.
  • أنظمة المراقبة المتقدمة: دقة عالية لتحديد التهديدات الأمنية المحتملة في الأنظمة الأمنية.
  • الروبوتات: التعرف على الأجسام بدقة للتلاعب والملاحة في الروبوتات، على غرار YOLOv10، ولكن من المحتمل أن تكون الدقة في سيناريوهات معينة.
  • الأتمتة الصناعية: مراقبة الجودة والكشف عن العيوب في عمليات التصنيع حيث تكون الدقة أمرًا بالغ الأهمية.

نقاط القوة:

  • متوسط دقة عالية: يحقق متوسط دقة متوسط دقة عالية، مما يشير إلى دقة ممتازة في اكتشاف الأجسام.
  • استدلال فعال: مصمم للاستدلال السريع، ومناسب لتطبيقات الوقت الحقيقي.
  • راسخ وناضج: يستفيد YOLOv7 من مجتمع أكبر واستخدام واسع النطاق، مما يوفر المزيد من الموارد والدعم.
  • أحجام النماذج القابلة للإدارة: يوفر توازناً جيداً بين حجم النموذج والأداء.

نقاط الضعف:

  • التعقيد: الهندسة المعمارية أكثر تعقيدًا من بعض النماذج الأبسط، مما قد يتطلب المزيد من الخبرة للضبط والتحسين.
  • كثيفة الموارد مقارنةً بنماذج النانو: على الرغم من كفاءتها، إلا أنها أكثر كثافة من الناحية الحسابية من النماذج الأصغر مثل YOLOv10n، خاصةً في البيئات محدودة الموارد للغاية.

اعرف المزيد عن YOLOv7

موديلات YOLO الأخرى

إلى جانب YOLOv10 و YOLOv7، تقدم Ultralytics مجموعة من نماذج YOLO ولكل منها نقاط قوة فريدة. فكِّر في استكشاف YOLOv8 للحصول على خيار متعدد الاستخدامات وسهل الاستخدام، و YOLOv9 للتطورات في بنية الشبكة، و YOLO11 للحصول على أحدث أداء متطور. يمكنك أيضًا مقارنة YOLOv7 بنماذج أخرى مثل YOLOv5 و YOLOX لفهم مفاضلاتها المحددة.

📅 تم إنشاؤها منذ 1 سنة مضت ✏️ تم التحديث منذ 1 شهر

التعليقات