YOLOv7 مقابل YOLO11: من الإرث في الوقت الحقيقي إلى الكفاءة الحديثة
ينطوي التنقل في مشهد نماذج الرؤية الحاسوبية على فهم الفروق الدقيقة بين البنى الراسخة وأحدث الابتكارات الحديثة (SOTA). يقدم هذا الدليل مقارنة تقنية شاملة بين YOLOv7 وهو علامة بارزة في سلسلة YOLO و Ultralytics YOLO11وهو الطراز المتطور المصمم لتحقيق الأداء الفائق وتعدد الاستخدامات.
سنقوم باستكشاف الاختلافات المعمارية والمقاييس المعيارية والتطبيقات العملية لمساعدة المطورين والباحثين على اختيار الأداة المثلى للمهام التي تتراوح بين اكتشاف الكائنات إلى تجزئة المثيل المعقد.
YOLOv7: معيار في الهندسة المعمارية الفعالة
يمثل YOLOv7 الذي صدر في يوليو 2022، قفزة كبيرة إلى الأمام في التوازن بين كفاءة التدريب وسرعة الاستدلال. تم تصميمه ليتفوق في أدائه على أجهزة الكشف السابقة من خلال التركيز على التحسينات المعمارية التي تقلل من عدد المعلمات دون التضحية بالدقة.
المؤلفون: تشين ياو وانغ، وأليكسي بوشكوفسكي، وهونغ يوان مارك لياو
المنظمة:معهد علوم المعلومات، الأكاديمية الصينية للعلوم بتايوان
التاريخ: 2022-07-06
اركسيف:https://arxiv.org/abs/2207.02696
جيثب:https://github.com/WongKinYiu/yolov7
المستندات:ultralytics
الملامح المعمارية البارزة
قدم YOLOv7 شبكة تجميع الطبقات الموسعة الفعالة الموسعة (E-ELAN). تسمح هذه البنية للنموذج بتعلم ميزات أكثر تنوعًا من خلال التحكم في أقصر وأطول مسارات التدرج، مما يعزز التقارب أثناء التدريب. بالإضافة إلى ذلك، فقد استخدمت "حقيبة من الجسيمات المجانية القابلة للتدريب"، وهي مجموعة من استراتيجيات التحسين مثل إعادة تحديد النموذج وتعيين التسمية الديناميكية، والتي تعمل على تحسين الدقة دون زيادة تكلفة الاستدلال.
على الرغم من كونه نموذجًا للكشف عن الأجسام في المقام الأول، فقد استكشف مجتمع المصادر المفتوحة توسيع نطاق YOLOv7 لتقدير الوضعية. ومع ذلك، غالبًا ما تفتقر هذه التطبيقات إلى التكامل السلس الموجود في الأطر الموحدة.
نقاط القوة والقيود
يحظى YOLOv7 بالاحترام والتقدير:
- أداء قوي: لقد أنشأ خط أساس جديد لأجهزة الكشف في الوقت الحقيقي عند إصداره، حيث كان أداؤه جيدًا على مجموعة بياناتCOCO .
- الابتكار المعماري: أثر تقديم E-ELAN على الأبحاث اللاحقة في تصميم الشبكات.
ومع ذلك، فإنه يواجه تحديات في سير العمل الحديث:
- التعقيد: يمكن أن يكون خط أنابيب التدريب معقدًا، ويتطلب تكوينًا يدويًا كبيرًا مقارنةً بالمعايير الحديثة.
- براعة محدودة: لا يدعم أصلاً مهام مثل التصنيف أو الصناديق المحدودة الموجهة (OBB) خارج الصندوق.
- استخدام الموارد: يتطلب تدريب المتغيرات الأكبر حجمًا، مثل YOLOv7x، موارد كبيرة GPU والتي يمكن أن تكون عنق الزجاجة للباحثين ذوي الأجهزة المحدودة.
Ultralytics YOLO11: إعادة تعريف السرعة والدقة وسهولة الاستخدام
Ultralytics YOLO11 هو أحدث تطور في سلالة YOLO الشهيرة، وقد تم تصميمه لتقديم أداء SOTA عبر مجموعة واسعة من مهام الرؤية الحاسوبية. يوفر YOLO11 المبني على إرث من التحسين المستمر، بنية محسنة تزيد من الكفاءة في النشر في العالم الحقيقي.
المؤلفان: جلين يوتشر وجينغ كيو
المنظمة:Ultralytics
التاريخ: 2024-09-27
GitHubultralytics
المستنداتyolo11
بنية متطورة ومتعددة الاستخدامات
يستخدم YOLO11 عمودًا فقريًا حديثًا باستخدام كتل C3k2 ووحدة SPPF محسّنة لالتقاط الميزات بمقاييس مختلفة بشكل أكثر فعالية. وينتج عن هذا التصميم نموذج ليس أكثر دقة فحسب، بل أخف وزنًا بشكل ملحوظ من حيث المعلمات وفلوبس البلازما مقارنةً بسابقاته ومنافسيه.
من الخصائص المميزة لـ YOLO11 دعمه الأصلي متعدد المهام. في إطار واحد، يمكن للمستخدمين القيام بـ
- الكشف: تحديد الأجسام ذات المربعات المحدودة.
- التجزئة: إخفاء على مستوى البكسل لتحليل دقيق للشكل.
- التصنيف: تعيين تسميات الفئات للصور بأكملها.
- تقدير الوضعية: اكتشاف النقاط الرئيسية على الأجسام البشرية.
- OBB: الكشف عن الأجسام المدورة، وهو أمر بالغ الأهمية للصور الجوية.
النظام البيئي الموحد
تتكامل منصة Ultralytics YOLO11 بسلاسة مع Ultralytics HUB، وهي منصة لإدارة مجموعات البيانات، والتدريب بدون رموز، والنشر بنقرة واحدة. يعمل هذا التكامل على تسريع دورة حياة MLOPS بشكل كبير.
لماذا يختار المطورون YOLO11
- سهولة الاستخدام: بفضل تصميمه الذي يركز على المستخدم، يمكن تنفيذ YOLO11 ببضعة أسطر من كود Python أو عبر CLI.
- نظام بيئي جيد الصيانة: مدعومًا بمجتمع نشط وفريق Ultralytics يتلقى النموذج تحديثات متكررة، مما يضمن التوافق مع أحدث PyTorch ومسرعات الأجهزة.
- توازن الأداء: يحقق مفاضلة استثنائية بين سرعة الاستدلال ومتوسط الدقة المتوسطة (mAP)، مما يجعله مثاليًا لكل من الأجهزة الطرفية والخوادم السحابية.
- كفاءة الذاكرة: عادةً ما تتطلب نماذج YOLO11 ذاكرة CUDA أقل أثناء التدريب مقارنةً بالبنى القديمة أو النماذج القائمة على المحولات، مما يسمح بأحجام دفعات أكبر أو التدريب على أجهزة متواضعة.
مقارنة الأداء: المعايير الفنية
يوضح الجدول التالي الفروق في الأداء بين YOLOv7 و YOLO11. تبرز البيانات كيف أن التحسينات الحديثة تسمح لـ YOLO11 بتحقيق دقة فائقة بجزء بسيط من التكلفة الحسابية.
| النموذج | الحجم (بالبكسل) | mAPفال 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
التحليل:
- الكفاءة: يضاهي YOLO11m دقة YOLOv7l (51.5 مقابل 51.4 mAP) مع استخدام ما يقرب من نصف المعلمات (20.1 مليون مقابل 36.9 مليون) وعدد أقل بكثير من عمليات التحويل إلى عمليات التصفية.
- السرعة: بالنسبة للتطبيقات في الوقت الحقيقي، فإن YOLO11n أسرع بشكل كبير، حيث تصل سرعته إلى 1.5 مللي ثانية على GPU T4، مما يجعله مثاليًا لمعالجة الفيديو عالي الإطارات في الثانية.
- الدقة: يتفوق النموذج الأكبر، YOLO11x، على YOLOv7x في الدقة (54.7 مقابل 53.1 mAP) مع الحفاظ على عدد معلمات تنافسي.
حالات الاستخدام في العالم الحقيقي
الزراعة والرصد البيئي
في الزراعة الدقيقة، يتطلب الكشف عن أمراض المحاصيل أو مراقبة النمو نماذج يمكن تشغيلها على أجهزة ذات طاقة محدودة، مثل الطائرات بدون طيار أو أجهزة الاستشعار الحقلية.
- YOLO11: تسمح بنيته خفيفة الوزن (YOLO11n/s تحديداً) بالنشر على أجهزة Raspberry Pi أو NVIDIA Jetson، مما يتيح مراقبة صحة المحاصيل في الوقت الحقيقي.
- YOLOv7: على الرغم من دقته، إلا أن طلبه الحسابي المرتفع يحد من فائدته على الأجهزة المتطورة التي تعمل بالبطارية.
التصنيع الذكي ومراقبة الجودة
تتطلب أنظمة الفحص البصري الآلي دقة عالية detect العيوب الدقيقة في خطوط التصنيع.
- YOLO11: قدرة النموذج على إجراء التجزئة و OBB أمر بالغ الأهمية هنا. على سبيل المثال، يعد OBB ضروريًا لاكتشاف المكونات الدوارة على الحزام الناقل، وهي ميزة مدعومة أصلاً في YOLO11 ولكنها تتطلب تطبيقات مخصصة في YOLOv7.
- YOLOv7: مناسب للكشف عن المربع المحدود القياسي ولكنه أقل قابلية للتكيف مع العيوب الهندسية المعقدة دون تعديل كبير.
المراقبة والأمن
غالباً ما تعالج أنظمة الأمان تدفقات فيديو متعددة في وقت واحد.
- YOLO11: تسمح سرعة الاستدلال العالية لخادم واحد بمعالجة المزيد من التدفقات بالتوازي، مما يقلل من تكاليف البنية التحتية.
- YOLOv7: فعّال، ولكن وقت الاستجابة الأعلى لكل إطار يقلل من إجمالي عدد القنوات التي يمكن لوحدة واحدة التعامل معها.
كفاءة التنفيذ والتدريب
إحدى الميزات البارزة في نظام Ultralytics هي تجربة المطورين المبسطة. فيما يلي مقارنة لكيفية البدء.
البساطة في التعليمات البرمجية
صُمم Ultralytics YOLO11 ليكون "متضمناً للبطاريات"، مما يلغي التعليمات البرمجية النمطية المعقدة.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
في المقابل، غالبًا ما تتطلب المستودعات الأقدم استنساخ الريبو، وتعديل ملفات التكوين يدويًا، وتشغيل نصوص برمجية معقدة للتدريب والاستدلال.
مرونة التصدير
يدعم YOLO11 التصدير بنقرة واحدة إلى تنسيقات مختلفة للنشر، بما في ذلك ONNX, TensorRTو CoreML و TFLite. تضمن هذه المرونة أن يكون نموذجك جاهزًا للإنتاج في أي بيئة.
الخاتمة: الفائز الواضح
بينما YOLOv7 يظل نموذجًا محترمًا في تاريخ الرؤية الحاسوبية, Ultralytics YOLO11 يمثل المستقبل. بالنسبة للمطورين والباحثين، يقدم YOLO11 حزمة مقنعة:
- مقاييس متفوقة: سرعة mAP أعلى وسرعة أعلى في الاستدلال.
- نظام بيئي غني: الوصول إلى Ultralytics HUB، والمستندات الشاملة، والدعم المجتمعي.
- تعدد الاستخدامات: إطار عمل واحد للكشف والتجزئة والوضعية والتصنيف و OBB.
- مواكبة المستقبل: تضمن التحديثات والصيانة المستمرة التوافق مع مكتبات الأجهزة والبرامج الجديدة.
بالنسبة لأي مشروع جديد، فإن الاستفادة من كفاءة وسهولة استخدام YOLO11 هو المسار الموصى به لتحقيق أحدث النتائج بأقل قدر من الاحتكاك.
استكشف نماذج أخرى
إذا كنت مهتمًا بمزيد من المقارنات، استكشف هذه الصفحات ذات الصلة في الوثائق:
- YOLO11 مقارنة بـ YOLOv8
- YOLO11 مقابل YOLOv10
- YOLOv7 مقابل RT-DETR
- YOLOv7 مقابل YOLOv5
- استكشف YOLOv9 الهندسة المعمارية