YOLO11 YOLOv7: مقارنة تقنية مفصلة
يستمر مجال الرؤية الحاسوبية في التطور بوتيرة سريعة، حيث يظل الكشف عن الأجسام في الوقت الفعلي في طليعة تطبيقات الذكاء الاصطناعي. يتطلب اختيار البنية المناسبة لمشروعك إجراء مفاضلة معقدة بين السرعة والدقة وسهولة النشر. في هذا الدليل، نقدم مقارنة تقنية شاملة بين بنيتين بارزتين: Ultralytics YOLO11 و YOLOv7.
خلفية النموذج والتفاصيل الفنية
أثر كلا النموذجين بشكل كبير على مجتمع التعلم العميق، لكنهما ينبعان من فلسفات وعصور تطوير مختلفة.
تفاصيل YOLO11:
المؤلفون: Glenn Jocher و Jing Qiu
المنظمة: Ultralytics
التاريخ: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
الوثائق: https://docs.ultralytics.com/models/yolo11/
تفاصيل YOLOv7:
المؤلفون: تشين-ياو وانغ، أليكسي بوتشكوفسكي، وهونغ-يوان مارك لياو
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
الوثائق: https://docs.ultralytics.com/models/yolov7/
الاختلافات المعمارية
عند تحليل الآليات الداخلية، يستخدم كلا الكاشفين مفاهيم حديثة، لكن أسسهما الهيكلية تختلف.
YOLOv7 مفهوم شبكات التجميع الفعالة الموسعة (E-ELAN). تم تصميم هذه البنية لتعزيز قدرة الشبكة على التعلم بشكل مستمر دون تدمير مسار التدرج الأصلي، وهو إنجاز هام تم الإبلاغ عنه في ورقة البحث الخاصة بهم. YOLOv7 بشكل كبير على إعادة تحديد المعلمات الهيكلية ومنهجية "bag-of-freebies" القوية أثناء التدريب، مما يحسن الدقة الإجمالية في COCO دون زيادة تكاليف الاستدلال.
في المقابل، YOLO11 بناء YOLO11 على أساس Ultralytics عالية التحسين. وهو يركز على خط إنتاج استخراج الميزات الأكثر دقة مع عدد أقل من المعلمات، مما يؤدي إلى انخفاض استخدام الذاكرة أثناء التدريب. YOLO11 توازنًا عاليًا في الأداء، باستخدام موارد حسابية أقل (FLOPs) مع مطابقة أو تجاوز دقة الكشف في النماذج الأثقل. علاوة على ذلك، يدعم YOLO11 مجموعة متنوعة من المهام، مما يجعله خيارًا متعدد الاستخدامات لتطبيقات الرؤية الحاسوبية الحديثة.
كفاءة الذاكرة
إحدى الميزات البارزةYOLO Ultralytics YOLO هي متطلباتها المنخفضة من الذاكرة أثناء التدريب مقارنة بالنماذج الحديثة الأخرى، مما يتيح للمطورين تدريب شبكات قوية على أجهزة المستهلكين. PyTorch المخصصة للمستهلكين.
مقارنة الأداء والمقاييس
لتقييم الجدوى في العالم الواقعي بدقة، من الضروري تقييم مقاييس مثل متوسط الدقة (mAP) وسرعة الاستدلال ومعلمات النموذج والتعقيد الحسابي (FLOPs). يوضح الجدول التالي مقارنة بين متغيرات YOLO11 YOLOv7 الأكبر حجماً.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
كما لوحظ، يحقق نموذج مثل YOLO11x نسبة 54.7 mAP أعلى مقارنة بـ YOLOv7x التي تبلغ 53.1 mAP، مع استخدام عدد أقل بكثير من المعلمات (56.9 مليون مقابل 71.3 مليون). وهذا يبرز كفاءة YOLO11 المعمارية الفائقة.
كفاءة التدريب وقابلية استخدام النظام البيئي
إحدى السمات الأكثر تميزًا التي تفصل بين هاتين البنيتين هي تجربة المطورين والنظام البيئي المحيط.
YOLOv7 هو في جوهره مستودع للبحث الأكاديمي. غالبًا ما يتطلب تدريب النماذج إعدادات بيئة معقدة، وإدارة يدوية للتبعيات، واستخدام وسائط سطر أوامر طويلة. بينما يدعم التجارب المتطورة، فإن تكييف رمز مستودع YOLOv7 على GitHub لبيئات الإنتاج المخصصة قد يستغرق وقتًا طويلاً.
YOLO11 يعيد تعريف سهولة الاستخدام بالكامل. فهو مدمج بالكامل في منصة Ultralytics، وهو نظام بيئي شامل ومصان جيدًا يقدم سير عمل سلسًا وشاملاً. من التعليق التوضيحي للبيانات والتدريب المحلي إلى النشر، تعمل واجهة برمجة تطبيقات Python الموحدة وواجهة سطر الأوامر البسيطة على تبسيط العملية برمتها.
مقارنة التعليمات البرمجية
YOLO11 تدريب نموذج الكشف عن الكائنات باستخدام YOLO11 بضع أسطر فقط من التعليمات البرمجية، مما يقلل بشكل كبير من عوائق الدخول:
from ultralytics import YOLO
# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model effortlessly using the unified API
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Quickly export to ONNX format
model.export(format="onnx")
في المقابل، يبدو أمر YOLOv7 النموذجي YOLOv7 كما يلي، ويتطلب إعدادًا دقيقًا للمسارات وملفات التكوين bash البرمجة النصية bash :
python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'
يوفر YOLO11 تنوعًا هائلاً. في حين أن YOLOv7 قواعد برمجية مختلفة تمامًا أو تعديلات كبيرة لدعم المهام التي تتجاوز الكشف (مثل الوضع أو التجزئة)، YOLO11 الكشف عن الكائنات، وتجزئة المثيلات، وتصنيف الصور، وتقدير الوضع، والكشف عن الصندوق المحيط الموجه (OBB) عبر إطار عمل واحد متماسك.
تسهيل عملية التصدير
تصدير YOLO11 تنسيقات مثل TensorRT أو OpenVINO يتطلب أمرًا واحدًا فقط، مما يقلل من مشكلات دعم المشغل النموذجية التي تواجهها النماذج القديمة.
تطبيقات في العالم الحقيقي وحالات استخدام مثالية
يعتمد الاختيار بين YOLOv7 و YOLO11 كليًا على نطاق المشروع وقيود النشر.
متى يجب التفكير في استخدام YOLOv7:
- قياس أداء النماذج القديمة: قد يستخدم الباحثون الأكاديميون الذين يستكشفون تصميمات مسار التدرج YOLOv7 كخط أساس لتقييم الشبكات العصبية التلافيفية الأحدث.
- مسارات مخصصة موجودة: الفرق التي لديها مسارات C++ أو CUDA مخصصة بشكل كبير ومبنية خصيصًا حول منطق فك تشفير الصناديق المحيطة الفريد لـ YOLOv7.
متى تختار YOLO11:
- الإنتاج التجاري: تستفيد التطبيقات في التجزئة الذكية أو تشخيصات الرعاية الصحية بشكل كبير من قاعدة كود YOLO11 المحافظ عليها واستقرارها العالي.
- البيئات محدودة الموارد: تجعل البصمة الخفيفة لـ YOLO11n مناسبًا بشكل استثنائي للنشر على الأجهزة المحمولة وأجهزة الحافة عبر ONNX.
- مشاريع المهام المتعددة: إذا كان تطبيق واحد يحتاج إلى تحديد شخص، ورسم هيكله العظمي (الوضعية)، وتجزئة كائن يحمله، يوفر YOLO11 حلاً موحدًا.
الحدث الأحدث: المضي قدماً مع YOLO26
في حين أن YOLO11 خيارًا قويًا للغاية، إلا أن الابتكار في مجال الذكاء الاصطناعي لا يتوقف أبدًا. بالنسبة للمهندسين الذين يبدؤون مشاريع جديدة اليوم، فإن استكشاف Ultralytics موصى به للغاية.
تم إصدار YOLO26 في يناير 2026، وهو يقدم تصميمًا شاملاً NMS، مما يزيل تمامًا اختناقات الكمون المرتبطة بمعالجة ما بعد عدم القمع الأقصى. علاوة على ذلك، يدمج YOLO26 مُحسِّن MuSGD الثوري، المستوحى من منهجيات تدريب LLM، لضمان تقارب أسرع. بفضل التحسينات المستهدفة في الخسارة عبر ProgLoss + STAL CPU الأسرع CPU تصل إلى 43٪ بفضل إزالة DFL، تم تحسين YOLO26 خصيصًا للحوسبة الطرفية ويمثل قمة الذكاء الاصطناعي البصري الحالي.
بالنسبة للمستخدمين المهتمين بالهياكل البديلة المتخصصة، استكشاف المحولات القائمة على RT-DETR أو نماذج YOLO الديناميكية ذات المفردات المفتوحة.