YOLOv7 YOLO11: مقارنة تقنية شاملة
تطور مجال الرؤية الحاسوبية بسرعة خلال السنوات القليلة الماضية. بالنسبة للمطورين والباحثين الذين يختارون إطار عمل الكشف عن الكائنات المناسب، من الضروري فهم الاختلافات المعمارية والعملية بين النماذج التي تحدد الجيل. يقدم هذا الدليل مقارنة تقنية مفصلة بين الاختراق الأكاديمي لـ YOLOv7 والنموذج المُحسّن للغاية والجاهز للإنتاج Ultralytics YOLO11.
أصول النموذج والفلسفات المعمارية
YOLOv7، الذي صدر في 6 يوليو 2022، من قبل المؤلفين تشين-ياو وانغ، وأليكسي بوتشكوفسكي، وهونغ-يوان مارك لياو من معهد علوم المعلومات في أكاديميا سينيكا، قدم العديد من المفاهيم الجديدة في هذا المجال. مفصلًا في ورقتهم البحثية حول YOLOv7 المنشورة على arXiv، يركز النموذج بشكل كبير على نهج "حقيبة الحيل القابلة للتدريب" (trainable bag-of-freebies) وشبكات تجميع الطبقات الفعالة الموسعة (E-ELAN). صُممت هذه الخيارات المعمارية خصيصًا لزيادة كفاءة مسار التدرج، مما يجعله أداة قوية للمقارنات الأكاديمية على وحدات معالجة الرسوميات (GPU) عالية الأداء.
YOLO11، الذي طوره Glenn Jocher و Jing Qiu في Ultralytics، صدر في 27 سبتمبر 2024. يحول YOLO11 التركيز من التعقيد المعماري البحت إلى نظام بيئي شامل يركز على المطور. يستضيفه مستودع Ultralytics GitHub، ويتميز YOLO11 بتصميم محسّن خالٍ من المراسي يقلل بشكل كبير من استهلاك الذاكرة أثناء التدريب والاستدلال. وهو مدمج أصلاً في منصة Ultralytics، مما يوفر سهولة استخدام لا مثيل لها من التعليق التوضيحي لمجموعات البيانات إلى النشر على الحافة.
ميزة النظام البيئي
في حين أن المستودعات المستقلة غالبًا ما تصبح غير نشطة بعد نشر ورقة أكاديمية، تستفيد Ultralytics من التحديثات المستمرة، مما يضمن التوافق طويل الأمد مع مجموعات التعلم الآلي الحديثة مثل أحدث PyTorch ومسرعات الأجهزة المتخصصة.
مقاييس الأداء والكفاءة
عند نشر النماذج في تطبيقات واقعية، يجب موازنة الدقة الأولية مع سرعة الاستدلال والتكلفة الحسابية. فيما يلي مقارنة مباشرة بين YOLO11 YOLOv7 YOLO11 التي تم تقييمها على معايير COCO القياسية.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
ملاحظة: YOLOv7 CPU المفقودة لـ YOLOv7 بيئات اختبار قديمة لم تقم بتوحيدCPU ONNX . تم تمييز أفضل القيم في المستويات المماثلة.
تحليل النتائج
توضح البيانات تطورًا واضحًا في الكفاءة. يحقق نموذج YOLO11l (كبير) قيمةmAPval فائقة تبلغ 53.4٪ مقارنة بـ 51.4٪ لنموذج YOLOv7l، مع استخدام معلمات أقل بكثير (25.3 مليون مقابل 36.9 مليون) وعمليات FLOP أقل بكثير (86.9 مليار مقابل 104.7 مليار). يتيح هذا التخفيض في التعقيد الحسابي YOLO11 العمل بشكل أسرع على TensorRT NVIDIA TensorRT ويتطلب ذاكرة VRAM أقل، مما يجعله أكثر ملاءمة للبيئات المقيدة من حيث الأجهزة.
سهولة الاستخدام وسير العمل التدريبي
نقطة اختلاف رئيسية بين الإطارين هي تجربة المطور.
تدريب YOLOv7
غالبًا ما يتطلب استخدام قاعدة الكودYOLOv7 الأصلية YOLOv7 استنساخ المستودع، وحل التبعيات يدويًا، والاعتماد على حجج سطر الأوامر التفصيلية. غالبًا ما تتضمن إدارة المهام المختلفة أو التصدير إلى تنسيقات الأجهزة المحمولة تعديل البرامج النصية المصدرية أو الاعتماد على فروع طرف ثالث.
تدريب YOLO11
YOLO11 مدمج بشكل عميق في ultralytics Python تبسط دورة حياة التعلم الآلي. تدريب نموذج الكشف عن الأجسام لا يتطلب سوى بضع أسطر من التعليمات البرمجية، ويقوم إطار العمل بمعالجة تنزيل البيانات وضبط المعلمات الفائقة والتخزين المؤقت بشكل أصلي.
from ultralytics import YOLO
# Load a pretrained YOLO11 Nano model for maximum speed
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX format for deployment
export_path = model.export(format="onnx")
علاوة على ذلك، YOLO11 بتنوعه الفائق. فمن خلال تغيير لاحقة النموذج ببساطة، يمكن للمطورين الانتقال فورًا من الكشف إلى تعيين تجزئة الحالات، أو تتبع تقدير الوضع، أو التعرف على الصندوق المحيط الموجه (OBB)— وهو مستوى من الدعم الأصلي للمهام المتعددة الذي YOLOv7 .
الصادرات المبسطة
تصدير YOLO11 تنسيقات حافة مثل أبل CoreML أو OpenVINO Intel OpenVINO يتطلب فقط واحد .export() أمر، متجنبًا جراحة الرسم البياني المعقدة التي غالبًا ما تتطلبها نماذج الجيل الأقدم.
سيناريوهات النشر المثالية
فهم نقاط القوة لكل نموذج يساعد في تحديد أفضل حالات استخدامها.
- إعادة إنتاج المعايير القديمة: YOLOv7 لا يزال مفيدًا للباحثين الأكاديميين الذين يحتاجون إلى إعادة إنتاج معايير محددة لعام 2022 أو دراسة تأثيرات تقنيات إعادة المعايرة على الشبكات القائمة على نقاط الارتكاز.
- بيئات الإنتاج التجارية: YOLO11 هو الخيار الأمثل لأنظمة المؤسسات. استقراره وصيانته النشطة وتكامله مع واجهة Ultralytics Platform السحابية يجعله مثاليًا لإدارة تحليلات التجزئة واسعة النطاق، ومراقبة الأمن، ومراقبة جودة التصنيع.
- الحوسبة الطرفية محدودة الموارد: متغير YOLO11n خفيف الوزن بشكل لا يصدق مصمم خصيصًا للأجهزة الطرفية منخفضة الطاقة، ويعمل بكفاءة على نظام Raspberry Pi أو وحدات NVIDIA Jetson.
التطلع إلى المستقبل: التحول النموذجي لـ YOLO26
في حين أن YOLO11 حلاً متطوراً للغاية، فإن مجال التعلم الآلي يتقدم بلا هوادة. بالنسبة للمستخدمين الذين يبدؤون اليوم مشاريع رؤية جديدة تماماً، يوصى بشدة باستكشاف Ultralytics الذي تم إصداره مؤخراً.
صدر YOLO26 في يناير 2026، ويقدم العديد من الميزات الرائدة التي تتفوق على كل من YOLOv7 YOLO11:
- بنية خالية من NMS بشكل أصلي: يلغي YOLO26 الحاجة إلى معالجة ما بعد التثبيط غير الأقصى (Non-Maximum Suppression). يبسط هذا التصميم الشامل خطوط أنابيب النشر ويقلل بشكل كبير من تباين زمن الوصول.
- سرعة استدلال أسرع بنسبة تصل إلى 43% على الـ CPU: من خلال الإزالة الاستراتيجية لوحدة Distribution Focal Loss (DFL)، تم تحسين YOLO26 بشكل كبير للأجهزة الطرفية والبيئات التي لا تحتوي على وحدات GPU مخصصة.
- دمج مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (LLM) المتقدمة من Moonshot AI، يضمن هذا المُحسِّن الهجين استقرارًا غير مسبوق في التدريب ومعدلات تقارب أسرع.
- اكتشاف الكائنات الصغيرة الفائق: يوفر إدخال دوال الخسارة ProgLoss و STAL تعزيزات حاسمة في الدقة لتحديد التفاصيل الدقيقة، وهو مثالي لتحليل صور الطائرات بدون طيار الجوية وبيانات مستشعرات إنترنت الأشياء المعقدة.
بالنسبة للمستخدمين المهتمين بالبنى القائمة على المحولات أو النماذج البديلة، تغطي Ultralytics أيضًا نماذج مثل كاشفRT-DETR ونموذجYOLO ذي المفردات المفتوحة.