YOLO11 مقابل YOLOOv7: مقارنة تقنية مفصلة لاكتشاف الأجسام
يعد اختيار النموذج الصحيح لاكتشاف الأجسام أمرًا بالغ الأهمية لتحقيق الأداء الأمثل في مهام الرؤية الحاسوبية. تقدم هذه الصفحة مقارنة تقنية مفصلة بين Ultralytics YOLO11 و YOLOv7، وهما نموذجان متقدمان مصممان لاكتشاف الأجسام بكفاءة ودقة. سنستكشف الفروق المعمارية الدقيقة ومعايير الأداء والتطبيقات المناسبة لإرشادك في اتخاذ قرار مستنير.
Ultralytics YOLO11
يعد برنامج Ultralytics YOLO11 الذي ألّفه جلين جوتشر وجينغ تشيو من شركة Ultralytics وتم إصداره في 2024-09-27، أحدث تطور في سلسلة YOLO . وهو يركز على تعزيز كل من الدقة والكفاءة في اكتشاف الأجسام، مما يجعله متعدد الاستخدامات لمجموعة واسعة من التطبيقات في العالم الحقيقي. Ultralytics YOLO11 يعتمد على نماذج YOLO السابقة، حيث يعمل على تحسين بنية الشبكة لتحقيق أحدث دقة في الكشف مع الحفاظ على الأداء في الوقت الفعلي.
البنية والمميزات الرئيسية:
تشتمل بنية YOLO11 على تقنيات متقدمة لاستخراج الخصائص، مما يؤدي إلى دقة أعلى مع تقليل عدد المعلمات مقارنةً بنماذج مثل YOLOv8. يؤدي هذا التحسين إلى سرعة أكبر في محرك الاستدلال وسرعة أكبر في الاستدلال ومتطلبات حسابية أقل، مما يجعله مناسبًا للنشر عبر منصات متنوعة، من الأجهزة المتطورة إلى البنية التحتية السحابية. يدعم YOLO11 العديد من مهام الرؤية الحاسوبية، بما في ذلك اكتشاف الأجسام، وتجزئة النماذج، وتصنيف الصور، وتقدير الوضعية. النموذج متاح على GitHub.
مقاييس الأداء والمعايير المرجعية:
يُظهِر YOLO11 متوسط درجات متوسط الدقة (mAP) المذهل عبر أحجام النماذج المختلفة. على سبيل المثال، يُحقق YOLO11m متوسط دقة (mAPval50-95) يبلغ 51.5 عند حجم 640 صورة، مما يحقق التوازن بين السرعة والدقة بفعالية. تقدم المتغيرات الأصغر مثل YOLO11n و YOLO11s استدلالاً أسرع في الوقت الحقيقي للتطبيقات التي تعطي الأولوية للسرعة، بينما النماذج الأكبر مثل YOLO11x تزيد من الدقة. للاطلاع على مقاييس أداءYOLO المفصلة، راجع وثائق Ultralytics .
حالات الاستخدام:
إن دقة وكفاءة YOLO11 المحسّنة تجعلها مثالية للتطبيقات التي تتطلب اكتشافًا دقيقًا وفي الوقت الحقيقي للأجسام، مثل
- الروبوتات: للملاحة الدقيقة والتفاعل مع الأجسام في البيئات الديناميكية.
- الأنظمة الأمنية: في أنظمة الإنذار الأمني المتقدمة للكشف الدقيق عن التسلل والمراقبة الشاملة.
- تحليلات البيع بالتجزئة: للذكاء الاصطناعي في البيع بالتجزئة لتحسين إدارة المخزون والتحليل المتعمق لسلوك العملاء.
- الأتمتة الصناعية: للرقابة الصارمة على الجودة والكشف الفعال عن العيوب في عمليات التصنيع.
نقاط القوة:
- دقة عالية: يحقق أحدث ما توصلت إليه الهندسة المعمارية المحسنة.
- استدلال فعال: معالجة سريعة مناسبة للتطبيقات في الوقت الحقيقي.
- مهام متعددة الاستخدامات: يدعم اكتشاف الأجسام وتجزئتها وتصنيفها وتقدير وضعيتها.
- قابلية التوسع: أداء فعال عبر أجهزة مختلفة، من الأجهزة المتطورة إلى الأنظمة السحابية.
نقاط الضعف:
- يمكن أن تتطلب النماذج الأكبر حجمًا موارد حاسوبية أكبر مقارنةً بالنماذج الأصغر المحسّنة للسرعة.
- قد يتطلب التحسين لأجهزة حافة محددة تكوينات نشر نموذج إضافي.
يولوف 7
يُعرف YOLOv7، الذي قدمه تشين ياو وانغ وأليكسي بوشكوفسكي وهونغ يوان مارك لياو من معهد علوم المعلومات في الأكاديمية الصينية بتايوان في يوليو 2022، بحقيبة الأجسام الحرة القابلة للتدريب والتي تحدد أحدث ما توصلت إليه أجهزة الكشف عن الأجسام في الوقت الحقيقي. يركز YOLOv7، المفصل في ورقة arXiv ومستودع GitHub الخاص به، على السرعة والكفاءة مع الحفاظ على دقة عالية في مهام الكشف عن الأجسام.
البنية والمميزات الرئيسية:
يعتمد YOLOv7 على شبكة تجميع الطبقات الفعّالة (ELAN) ويقدم شبكة تجميع الطبقات الفعّالة (E-ELAN) لتعزيز قدرة الشبكة على التعلم. وهي تستخدم تقنيات مثل إعادة تحديد النموذج وتعيين التسمية الديناميكية لتحسين كفاءة التدريب وسرعة الاستدلال. تم تصميم YOLOv7 للكشف عن الكائنات عالية الأداء في مختلف التطبيقات.
مقاييس الأداء والمعايير المرجعية:
يُظهر نموذج YOLOv7 مقاييس أداء ممتازة، حيث يحقق معدل أداء متوسط يبلغ 51.4% على مجموعة بيانات COCO بحجم 640 صورة. كما أن سرعته ملحوظة أيضًا، حيث يحقق نموذج YOLOv7 الأساسي 161 إطارًا في الثانية في استنتاج الدفعة 1. للاطلاع على معايير الأداء التفصيلية، يرجى الرجوع إلى مستودع YOLOv7 الرسمي على موقع GitHub.
حالات الاستخدام:
إن توازن YOLOv7 بين السرعة والدقة يجعله مناسبًا لمجموعة واسعة من التطبيقات، بما في ذلك:
- اكتشاف الأجسام في الوقت الحقيقي: مثالي للتطبيقات التي تتطلب الكشف السريع، مثل القيادة الذاتية وتحليل الفيديو السريع.
- حوسبة عالية الأداء: مناسبة للبيئات التي تتوافر فيها الموارد الحاسوبية وتُعطى الأولوية للدقة العالية إلى جانب السرعة.
- البحث والتطوير: نموذج أساسي قوي لإجراء المزيد من الأبحاث في بنيات الكشف عن الأجسام ومنهجيات التدريب.
نقاط القوة:
- سرعة عالية: يحقق سرعات استنتاج مذهلة ومناسبة لأنظمة الوقت الحقيقي.
- دقة جيدة: تقدم درجات تنافسية في دقة MAP على مجموعات البيانات المعيارية.
- بنية فعالة: تستخدم E-ELAN E-ELAN وإعادة تحديد النموذج لتحسين الأداء.
نقاط الضعف:
- قد يتطلب المزيد من الموارد الحسابية مقارنةً بالنماذج الأصغر والأحدث مثل YOLO11n لسيناريوهات نشر الحافة.
- وعلى الرغم من كفاءة هذه البنية إلا أنها أقل تنوعاً في دعم مهام الرؤية المتنوعة التي تتجاوز اكتشاف الأجسام مقارنةً ب YOLO11.
جدول مقارنة النماذج
الطراز | الحجم (بكسل) |
مافال 50-95 |
السرعة CPU ONNX (مللي ثانية) |
السرعة T4 T4TensorRT10 (مللي ثانية) |
بارامز (م) |
(ب) |
---|---|---|---|---|---|---|
يولو 11 ن | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
يولو 11 م | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
يولو 11ل | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
يولو11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
يولوف7ل | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
الخاتمة
يعد كل من YOLO11 و YOLOv7 نموذجين قويين لاكتشاف الأجسام، ولكل منهما نقاط قوة فريدة. يتفوق YOLO11 في تعدد الاستخدامات والكفاءة، حيث يدعم مهام الرؤية المتعددة بدقة وسرعة فائقة، مما يجعله خيارًا قويًا للتطبيقات وبيئات النشر المتنوعة. وعلى الرغم من كفاءة YOLOv7، إلا أنه مُحسَّن بشكل خاص لاكتشاف الأجسام عالية السرعة، ومناسب للتطبيقات في الوقت الفعلي والأغراض البحثية. يعتمد الاختيار بينهما على المتطلبات المحددة لمشروعك، مع الموازنة بين عوامل مثل تنوع المهام واحتياجات الدقة وقيود النشر.
بالنسبة للمستخدمين المهتمين باستكشاف نماذج أخرى، تقدم Ultralytics أيضًا YOLOv8 المعروف بكفاءته المبسطة وتعدد استخداماته، و YOLOv5 المعتمد على نطاق واسع لسرعته وسهولة استخدامه. يمكنك أيضًا التفكير في مقارنة YOLO11 مع YOLOv9 أو استكشاف نماذج مثل RT-DETR لمقارنتها بنماذج أخرى مثل RT-DETR لمقارنتها بنهج معمارية مختلفة لاكتشاف الكائنات.