YOLO11 YOLOv7: مقارنة تقنية مفصلة
يستمر مجال الرؤية الحاسوبية في التطور بوتيرة سريعة، حيث يظل الكشف عن الأجسام في الوقت الفعلي في طليعة تطبيقات الذكاء الاصطناعي. يتطلب اختيار البنية المناسبة لمشروعك إجراء مفاضلة معقدة بين السرعة والدقة وسهولة النشر. في هذا الدليل، نقدم مقارنة تقنية شاملة بين بنيتين بارزتين: Ultralytics YOLO11 و YOLOv7.
خلفية النموذج والتفاصيل الفنية
كلا النموذجين كان لهما تأثير كبير على مجتمع التعلم العميق، لكنهما ينبعان من فلسفات تطوير وعصور مختلفة.
YOLO11 :
المؤلفون: Glenn Jocher و Jing Qiu
المنظمة: Ultralytics
التاريخ: 2024-09-27
GitHub: ultralytics
المستندات: yolo11
YOLOv7 :
المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، أكاديمية سينكا، تايوان
التاريخ: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
المستندات: ultralytics
الاختلافات المعمارية
عند تحليل الآليات الداخلية، يستخدم كلا الكاشفين مفاهيم حديثة، لكن أسسهما الهيكلية تختلف.
YOLOv7 مفهوم شبكات التجميع الفعالة الموسعة (E-ELAN). تم تصميم هذه البنية لتعزيز قدرة الشبكة على التعلم بشكل مستمر دون تدمير مسار التدرج الأصلي، وهو إنجاز هام تم الإبلاغ عنه في ورقة البحث الخاصة بهم. YOLOv7 بشكل كبير على إعادة تحديد المعلمات الهيكلية ومنهجية "bag-of-freebies" القوية أثناء التدريب، مما يحسن الدقة الإجمالية في COCO دون زيادة تكاليف الاستدلال.
في المقابل، YOLO11 بناء YOLO11 على أساس Ultralytics عالية التحسين. وهو يركز على خط إنتاج استخراج الميزات الأكثر دقة مع عدد أقل من المعلمات، مما يؤدي إلى انخفاض استخدام الذاكرة أثناء التدريب. YOLO11 توازنًا عاليًا في الأداء، باستخدام موارد حسابية أقل (FLOPs) مع مطابقة أو تجاوز دقة الكشف في النماذج الأثقل. علاوة على ذلك، يدعم YOLO11 مجموعة متنوعة من المهام، مما يجعله خيارًا متعدد الاستخدامات لتطبيقات الرؤية الحاسوبية الحديثة.
كفاءة الذاكرة
إحدى الميزات البارزةYOLO Ultralytics YOLO هي متطلباتها المنخفضة من الذاكرة أثناء التدريب مقارنة بالنماذج الحديثة الأخرى، مما يتيح للمطورين تدريب شبكات قوية على أجهزة المستهلكين. PyTorch المخصصة للمستهلكين.
مقارنة الأداء والمقاييس
لتقييم الجدوى في العالم الواقعي بدقة، من الضروري تقييم مقاييس مثل متوسط الدقة (mAP) وسرعة الاستدلال ومعلمات النموذج والتعقيد الحسابي (FLOPs). يوضح الجدول التالي مقارنة بين متغيرات YOLO11 YOLOv7 الأكبر حجماً.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
كما لوحظ، يحقق نموذج مثل YOLO11x معدل دقة متوسط أعلى يبلغ 54.7 mAP مقارنة بمعدل YOLOv7x البالغ 53.1 mAP مع استخدام معلمات أقل بكثير (56.9 مليون مقابل 71.3 مليون). وهذا يسلط الضوء على الكفاءة المعمارية الفائقة YOLO11.
كفاءة التدريب وقابلية استخدام النظام البيئي
إحدى السمات الأكثر تميزًا التي تفصل بين هاتين البنيتين هي تجربة المطورين والنظام البيئي المحيط.
YOLOv7 هو في الأساس مستودع للأبحاث الأكاديمية. غالبًا ما تتطلب نماذج التدريب إعدادات بيئية معقدة، وإدارة التبعيات يدويًا، واستخدام حجج سطر أوامر طويلة. على الرغم من أنه يدعم التجارب المتطورة، إلا أن تكييف كود مستودعYOLOv7 لبيئات الإنتاج المخصصة قد يستغرق وقتًا طويلاً.
YOLO11 يعيد تعريف سهولة الاستخدام تمامًا. وهو مدمج بالكامل في Ultralytics وهي نظام بيئي شامل ومُحكم يوفر سير عمل سلسًا من البداية إلى النهاية. من تعليق البيانات والتدريب المحلي إلى النشر، تعمل Python الموحدة وواجهة سطر الأوامر البسيطة على تبسيط العملية بأكملها.
مقارنة التعليمات البرمجية
YOLO11 تدريب نموذج الكشف عن الكائنات باستخدام YOLO11 بضع أسطر فقط من التعليمات البرمجية، مما يقلل بشكل كبير من عوائق الدخول:
from ultralytics import YOLO
# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model effortlessly using the unified API
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Quickly export to ONNX format
model.export(format="onnx")
في المقابل، يبدو أمر YOLOv7 النموذجي YOLOv7 كما يلي، ويتطلب إعدادًا دقيقًا للمسارات وملفات التكوين bash البرمجة النصية bash :
python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'
يوفر YOLO11 تنوعًا هائلاً. في حين أن YOLOv7 قواعد برمجية مختلفة تمامًا أو تعديلات كبيرة لدعم المهام التي تتجاوز الكشف (مثل الوضع أو التجزئة)، YOLO11 الكشف عن الكائنات، وتجزئة المثيلات، وتصنيف الصور، وتقدير الوضع، والكشف عن الصندوق المحيط الموجه (OBB) عبر إطار عمل واحد متماسك.
تسهيل عملية التصدير
تصدير YOLO11 تنسيقات مثل TensorRT أو OpenVINO يتطلب أمرًا واحدًا فقط، مما يقلل من مشكلات دعم المشغل النموذجية التي تواجهها النماذج القديمة.
تطبيقات في العالم الحقيقي وحالات استخدام مثالية
YOLO11 الاختيار بين YOLOv7 YOLO11 كليًا على نطاق المشروع وقيود النشر.
متى يجب التفكير في استخدام YOLOv7:
- مقارنة النماذج القديمة: يمكن للباحثين الأكاديميين الذين يدرسون تصميمات المسارات التدرجية استخدام YOLOv7 لتقييم الشبكات العصبية التلافيفية الأحدث.
- خطوط الأنابيب المخصصة الحالية: فرق تعمل CUDA C++ أو CUDA مخصصة بشكل كبير ومصممة خصيصًا حول منطق فك تشفير المربع المحيط الفريد YOLOv7.
متى تختار YOLO11:
- الإنتاج التجاري: تستفيد التطبيقات في مجال البيع بالتجزئة الذكي أو التشخيص الصحي بشكل كبير من قاعدة الكود المستقرة والاستقرار العالي YOLO11.
- البيئات المحدودة الموارد: إن الحجم الصغير لـ YOLO11n يجعله مناسبًا بشكل استثنائي للنشر على الأجهزة المحمولة والأجهزة الطرفية عبر ONNX.
- مشاريع متعددة المهام: إذا احتاج تطبيق واحد إلى تحديد هوية شخص ما، ورسم خريطة لهيكله العظمي (وضعيته)، segment الذي يحمله، YOLO11 حلاً موحدًا.
الحدث الأحدث: المضي قدماً مع YOLO26
في حين أن YOLO11 خيارًا قويًا للغاية، إلا أن الابتكار في مجال الذكاء الاصطناعي لا يتوقف أبدًا. بالنسبة للمهندسين الذين يبدؤون مشاريع جديدة اليوم، فإن استكشاف Ultralytics موصى به للغاية.
تم إصدار YOLO26 في يناير 2026، وهو يقدم تصميمًا شاملاً NMS، مما يزيل تمامًا اختناقات الكمون المرتبطة بمعالجة ما بعد عدم القمع الأقصى. علاوة على ذلك، يدمج YOLO26 مُحسِّن MuSGD الثوري، المستوحى من منهجيات تدريب LLM، لضمان تقارب أسرع. بفضل التحسينات المستهدفة في الخسارة عبر ProgLoss + STAL CPU الأسرع CPU تصل إلى 43٪ بفضل إزالة DFL، تم تحسين YOLO26 خصيصًا للحوسبة الطرفية ويمثل قمة الذكاء الاصطناعي البصري الحالي.
بالنسبة للمستخدمين المهتمين بالهياكل البديلة المتخصصة، استكشاف المحولات القائمة على RT-DETR أو نماذج YOLO الديناميكية ذات المفردات المفتوحة.