YOLO11 مقابل YOLOv7: مقارنة تقنية مفصلة
يستمر مشهد رؤية الحاسوب في التطور بوتيرة سريعة، حيث يظل اكتشاف الكائنات في الوقت الفعلي في طليعة تطبيقات الذكاء الاصطناعي. يتطلب اختيار البنية المناسبة لمشروعك التعامل مع مقايضات معقدة بين السرعة والدقة وسهولة النشر. في هذا الدليل، نقدم مقارنة تقنية شاملة بين بنيتين بارزتين: Ultralytics YOLO11 وYOLOv7.
خلفية النموذج والتفاصيل التقنية
لقد أثر كلا النموذجين بشكل كبير على مجتمع التعلم العميق، لكنهما ينبعان من فلسفات تطوير وعصور مختلفة.
تفاصيل YOLO11:
المؤلفون: Glenn Jocher و Jing Qiu
المؤسسة: Ultralytics
التاريخ: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
التوثيق: https://docs.ultralytics.com/models/yolo11/
تفاصيل YOLOv7:
المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
المؤسسة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان
التاريخ: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
التوثيق: https://docs.ultralytics.com/models/yolov7/
الاختلافات المعمارية
عند تحليل الآليات الداخلية، يستخدم كلا الكاشفين مفاهيم متطورة، ومع ذلك تختلف أسسهما الهيكلية.
قدم YOLOv7 مفهوم شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN). صُممت هذه البنية لتعزيز قدرة التعلم للشبكة باستمرار دون تدمير مسار التدرج الأصلي، وهو إنجاز حاسم ورد ذكره في ورقتهم البحثية. يعتمد YOLOv7 بشكل كبير على إعادة تحديد المعلمات الهيكلية ومنهجية "حقيبة الهدايا" القوية أثناء التدريب، مما يحسن الدقة الإجمالية على مجموعة بيانات COCO دون زيادة تكاليف الاستدلال.
في المقابل، تم بناء YOLO11 على بنية Ultralytics المحسنة للغاية. وهو يؤكد على خط معالجة أكثر دقة لـ استخراج الميزات مع عدد أقل من المعلمات، مما يؤدي إلى انخفاض استخدام الذاكرة أثناء التدريب. يحقق YOLO11 توازناً ممتازاً في الأداء، حيث يستخدم موارد حوسبة أقل (FLOPs) مع مطابقة أو تجاوز دقة الكشف للنماذج الأثقل. علاوة على ذلك، يدعم YOLO11 بشكل أصلي مجموعة واسعة من المهام، مما يجعله خياراً متعدد الاستخدامات لتطبيقات رؤية الحاسوب الحديثة.
إحدى الميزات البارزة لنماذج Ultralytics YOLO هي متطلبات الذاكرة الأقل أثناء التدريب مقارنة بالنماذج الحديثة الأخرى، مما يسمح للمطورين بتدريب شبكات قوية على أجهزة PyTorch للمستهلكين.
مقارنة الأداء والمقاييس
لقياس الجدوى في العالم الحقيقي بدقة، يعد تقييم مقاييس مثل متوسط الدقة (mAP)، وسرعة الاستدلال، ومعلمات النموذج، والتعقيد الحسابي (FLOPs) أمراً ضرورياً. يوضح الجدول التالي كيفية مقارنة متغيرات قياس YOLO11 بنماذج YOLOv7 الأكبر.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ملي ثانية) | السرعة T4 TensorRT10 (ملي ثانية) | المعلمات (مليون) | FLOPs (مليار) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
كما لوحظ، يحقق نموذج مثل YOLO11x درجة 54.7 mAP أعلى مقارنة بـ 53.1 mAP الخاص بـ YOLOv7x، مع استخدام معلمات أقل بكثير (56.9 مليون مقابل 71.3 مليون). يسلط هذا الضوء على الكفاءة المعمارية المتفوقة لـ YOLO11.
كفاءة التدريب وقابلية استخدام النظام البيئي
واحدة من أكثر الخصائص تحديداً التي تفصل بين هاتين البنيتين هي تجربة المطور والنظام البيئي المحيط.
YOLOv7 هو في الأساس مستودع بحثي أكاديمي. غالباً ما يتطلب تدريب النماذج إعدادات بيئة معقدة، وإدارة التبعيات يدوياً، واستخدام وسيطات سطر أوامر طويلة. على الرغم من أنه يدعم التجريب المتطور، إلا أن تكييف كود مستودع YOLOv7 على GitHub لبيئات الإنتاج المخصصة قد يستغرق وقتاً طويلاً.
YOLO11 يعيد تعريف سهولة الاستخدام بالكامل. إنه مدمج بالكامل في منصة Ultralytics، وهو نظام بيئي شامل ومصان جيداً يوفر سير عمل سلس من البداية إلى النهاية. من تعليق البيانات والتدريب المحلي إلى النشر، تبسط واجهة برمجة تطبيقات Python الموحدة وواجهة سطر الأوامر البسيطة العملية بأكملها.
مقارنة الكود
يتطلب تدريب نموذج اكتشاف الكائنات باستخدام YOLO11 بضعة أسطر فقط من الكود، مما يقلل بشكل كبير من حاجز الدخول:
from ultralytics import YOLO
# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model effortlessly using the unified API
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Quickly export to ONNX format
model.export(format="onnx")في المقابل، يبدو أمر تدريب YOLOv7 المعتاد كما يلي، مما يتطلب إعداداً دقيقاً للمسارات وملفات التكوين ونصوص bash البرمجية:
python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'يوفر YOLO11 أيضاً تنوعاً هائلاً. في حين يتطلب YOLOv7 قواعد كود مختلفة تماماً أو تعديلات ثقيلة لدعم مهام تتجاوز الكشف (مثل الوضع أو التجزئة)، يتعامل YOLO11 مع اكتشاف الكائنات وتجزئة المثيلات وتصنيف الصور وتقدير الوضع واكتشاف صندوق الإحاطة الموجه (OBB) عبر إطار عمل واحد متماسك.
التطبيقات الواقعية وحالات الاستخدام المثالية
يعتمد الاختيار بين YOLOv7 وYOLO11 كلياً على نطاق المشروع وقيود النشر.
متى تفكر في YOLOv7:
- قياس النماذج القديمة: قد يستخدم الباحثون الأكاديميون الذين يستكشفون تصميمات مسار التدرج YOLOv7 كخط أساس لتقييم الشبكات العصبية التلافيفية الأحدث.
- خطوط الإنتاج المخصصة الحالية: الفرق التي لديها خطوط إنتاج C++ أو CUDA مخصصة للغاية تم بناؤها خصيصاً حول منطق فك تشفير صندوق الإحاطة الفريد الخاص بـ YOLOv7.
متى تختار YOLO11:
- الإنتاج التجاري: تستفيد التطبيقات في تجزئة التجزئة الذكية أو تشخيص الرعاية الصحية بشكل كبير من قاعدة كود YOLO11 المدارة وثباته العالي.
- البيئات محدودة الموارد: البصمة خفيفة الوزن لـ YOLO11n تجعله مناسباً بشكل استثنائي للنشر على الأجهزة المحمولة وأجهزة الحافة عبر ONNX.
- المشاريع متعددة المهام: إذا كان تطبيق واحد يحتاج إلى تحديد شخص، وتخطيط هيكله العظمي (الوضع)، وتجزئة كائن يحمله، فإن YOLO11 يوفر حلاً موحداً.
أحدث ما توصلت إليه التقنية: المضي قدماً مع YOLO26
بينما يظل YOLO11 خياراً قوياً للغاية، فإن الابتكار في الذكاء الاصطناعي لا يتوقف أبداً. للمهندسين الذين يبدأون مشاريع جديدة اليوم، يوصى بشدة باستكشاف Ultralytics YOLO26.
تم إصدار YOLO26 في يناير 2026، ويقدم تصميماً خالياً من NMS من البداية إلى النهاية، مما يلغي تماماً اختناقات زمن الوصول المرتبطة بمعالجة كبح غير الحد الأقصى (NMS). علاوة على ذلك، يدمج YOLO26 مُحسِّن MuSGD الثوري، المستوحى من منهجيات تدريب LLM، لضمان تقارب أسرع. مع تحسينات الخسارة المستهدفة عبر ProgLoss + STAL واستدلال CPU أسرع بنسبة تصل إلى 43% بسبب إزالة DFL، تم تحسين YOLO26 خصيصاً لحوسبة الحافة ويمثل ذروة رؤية الذكاء الاصطناعي الحالية.
بالنسبة للمستخدمين المهتمين بالهياكل البديلة المتخصصة، قد يؤدي استكشاف RT-DETR القائم على Transformer أو نماذج YOLO-World الديناميكية مفتوحة المفردات إلى نتائج مفيدة لنشر رؤية الحاسوب المتنوعة.