تخطي إلى المحتوى

YOLO11 YOLOv7: مقارنة تقنية بين البنية والأداء

مع تسارع تطور مجال الرؤية الحاسوبية، أصبح اختيار بنية الكشف عن الأجسام المناسبة أمراً حاسماً للنجاح. وهناك منافسان رئيسيان في YOLO هما YOLO11، الذي طورته Ultralytics و YOLOv7، وهو نموذج قائم على الأبحاث من Academia Sinica. ورغم أن كلا النموذجين قد قدما مساهمات كبيرة في مجال التكنولوجيا الحديثة، إلا أنهما يلبيان احتياجات مختلفة فيما يتعلق بالسرعة والمرونة وسهولة النشر.

يقدم هذا الدليل تحليلاً تقنياً متعمقاً لهياكلها ومقاييس أدائها وحالات الاستخدام المثالية لمساعدة المطورين والباحثين على اختيار أفضل أداة لمشاريعهم.

نظرة عامة على النموذج والأصول

فهم نسب هذه النماذج يوفر سياقًا لقراراتها المعمارية.

YOLO11

صدر في سبتمبر 2024 عن Ultralytics، YOLO11 تحسينًا لفلسفة الشركة التي تركز على الإنتاج. وقد تم تصميمه لتحقيق أقصى قدر من الكفاءة على الأجهزة الحديثة، وتحقيق التوازن بين الإنتاجية العالية والدقة التنافسية.

  • المؤلفون: غلين جوشر وجينغ تشيو
  • المؤسسة:Ultralytics
  • التاريخ: سبتمبر 2024
  • التركيز الرئيسي: سهولة الاستخدام في الوقت الفعلي، ودعم واسع النطاق للمهام (الكشف، والتجزئة، والوضع، و OBB، والتصنيف)، والنشر المبسط عبر نظام Ultralytics .

تعرف على المزيد حول YOLO11

YOLOv7

صدر YOLOv7 في يوليو 2022، YOLOv7 إنجاز أكاديمي كبير قدمه الفريق الذي طور YOLOv4. وقد أدخل العديد من "الحزم المجانية" لتحسين الدقة دون زيادة تكلفة الاستدلال، مع التركيز بشكل كبير على تحسينات الهندسة القابلة للتدريب.

  • المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
  • المؤسسة: معهد علوم المعلومات، أكاديميا سينيكا
  • التاريخ: يوليو 2022
  • التركيز الرئيسي: تحليل مسار التدرج، إعادة تحديد معلمات النموذج، وتعيين التسميات الديناميكية.

تعرف على المزيد حول YOLOv7

تحليل الأداء

عند مقارنة هذه البنى، فإن المقاييس مثل متوسط الدقة (mAP) وزمن الاستدلال لها أهمية قصوى. يوضح الجدول أدناه كيف أن الهندسة الأحدث في YOLO11 إلى مكاسب في الكفاءة مقارنة YOLOv7 القديمة YOLOv7 .

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

النقاط الرئيسية

  • الكفاءة: يحقق نموذج YOLO11m دقة أعلى قليلاً (51.5٪ mAP) من نموذج YOLOv7 القياسي YOLOv7 51.4٪) مع استخدام معلمات أقل بنسبة 45٪ تقريبًا (20.1 مليون مقابل 36.9 مليون) وعدد أقل بكثير من FLOPs.
  • السرعة: على وحدات معالجة الرسومات T4، تتفوق YOLO11 باستمرار على YOLOv7 في زمن الاستدلال، وهو عامل حاسم للتطبيقات في الوقت الفعلي مثل القيادة الذاتية أو تحليلات الفيديو.
  • قابلية التوسع: YOLO11 نطاقًا أوسع من نماذج المقاييس (من Nano إلى X-Large)، مما يسهل نشره على الأجهزة ذات الموارد المحدودة مثل Raspberry Pi أو الأجهزة المحمولة.

الاختلافات المعمارية

Ultralytics YOLO11

YOLO11 على مفاهيم العمود الفقري CSPNet (Cross-Stage Partial Network)، ولكنه يحسن تصميم الكتلة من أجل تدفق تدرج أفضل واستخراج الميزات.

  • العمود الفقري المُحسّن: يستخدم كتلة C3k2 محسّنة (تنفيذ أسرع لمعوقات CSP) مما يعزز إعادة استخدام الميزات مع تقليل الحسابات.
  • الكشف بدون مرساة: مثل سابقاتها المباشرة، YOLO11 رأسًا بدون مرساة ، مما يبسط عملية التدريب من خلال إزالة الحاجة إلى تجميع مربعات المرساة يدويًا.
  • رؤوس متعددة المهام: تم تصميم البنية بشكل أساسي لدعم مهام متعددة باستخدام هيكل رأس موحد، مما يتيح التبديل السلس بين اكتشاف الكائنات وتجزئة الحالات وتقدير الوضع.

YOLOv7

YOLOv7 "Extended-ELAN" (E-ELAN) للتحكم في أقصر وأطول مسارات التدرج بشكل فعال.

  • E-ELAN: كتلة حسابية مصممة للسماح للشبكة بتعلم ميزات أكثر تنوعًا دون تدمير مسار التدرج.
  • إعادة تحديد معلمات النموذج: يستخدم تقنيات إعادة تحديد المعلمات (RepConv) لدمج طبقات التلافيف المنفصلة في طبقة واحدة أثناء الاستدلال، مما يزيد السرعة دون فقدان دقة التدريب.
  • رأس مساعد من الخشن إلى الناعم: يقدم رأسًا مساعدًا للإشراف على التدريب، مما يساعد على الإشراف العميق على النموذج ولكنه يضيف تعقيدًا إلى مسار التدريب.

التطور إلى YOLO26

بينما YOLO11 تحسينات كبيرة، فإن أحدث إصدار YOLO26 تدفع الحدود إلى أبعد من ذلك. تم إصدار YOLO26 في يناير 2026، ويتميز بتصميم End-to-End NMS مما يلغي الحاجة إلى المعالجة اللاحقة ويسرع CPU بنسبة تصل إلى 43٪. كما أنه يعتمد على MuSGD Optimizer، المستوحى من تدريب LLM، من أجل تقارب أسرع .

التدريب وسهولة الاستخدام

بالنسبة للمطورين، غالبًا ما تكون "تجربة المستخدم" للنموذج — مدى سهولة تدريبه والتحقق من صحته ونشره — مهمة بقدر أهمية المقاييس الأولية.

ميزة النظام البيئي لـ Ultralytics

YOLO11 بالكامل في Python Ultralytics Python YOLO11 يوفر سير عمل "من الصفر إلى القمة".

  1. واجهة برمجة تطبيقات موحدة: يمكنك التبديل بين YOLO11 و YOLOv8أو YOLO26 عن طريق تغيير سلسلة واحدة.
  2. كفاءة الذاكرة: تم تحسين Ultralytics بحيث تستخدم CUDA أقل أثناء التدريب مقارنة بالعديد من مستودعات الأبحاث. وهذا يسمح بأحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) الاستهلاكية.
  3. تصدير بنقرة واحدة: التصدير إلى تنسيقات مثل ONNXو TensorRT، CoreML أو TFLite عبر وضع أمر واحد.
from ultralytics import YOLO

# Load a YOLO11 model (or YOLO26 for best results)
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for deployment
path = model.export(format="onnx")

YOLOv7

يعتمد YOLOv7 على مستودع مستقل. على الرغم من قوته، إلا أنه غالبًا ما يتطلب:

  • التكوين اليدوي لـ .yaml ملفات للمراسي (إذا لم تكن تستخدم الإصدار الخالي من المراسي).
  • نصوص برمجية محددة "للنشر" لدمج الأوزان المعاد تحديد معلماتها قبل التصدير.
  • حجج سطر أوامر أكثر تعقيدًا لإدارة الرؤوس المساعدة أثناء التدريب.

تطبيقات عملية في أرض الواقع

متى تختار YOLO11

YOLO11 الخيار المفضل للتطبيقات التجارية والصناعية التي تعتمد بشكل أساسي على الموثوقية والصيانة.

  • Edge AI: توفر طرازات "Nano" و"Small" يجعل YOLO11 للكاميرات الذكية وأجهزة إنترنت الأشياء التي تراقب خطوط الإنتاج.
  • المشاريع متعددة المهام: إذا كان تطبيقك يتطلب تتبع الكائنات مع تقدير النقاط الرئيسية في نفس الوقت (مثل تحليلات الرياضة)، فإن إطار عمل YOLO11 الموحد يبسط قاعدة الكود.
  • النماذج الأولية السريعة: سهولة الاستخدام تتيح للفرق تكرار العمل بسرعة على مجموعات البيانات المخصصة باستخدام Ultralytics مما يقلل من وقت طرح المنتج في السوق.

متى تختار YOLOv7

  • المقارنة الأكاديمية: إذا كنت تقوم بتكرار نتائج من الأدبيات الخاصة بالفترة 2022-2023 أو تدرس التأثيرات المحددة لهياكل E-ELAN.
  • الأنظمة القديمة: بالنسبة للأنظمة المدمجة بالفعل بشكل عميق مع بنية الإدخال/الإخراج المحددة YOLO الأصلية على غرار Darknet.

الخلاصة

بينما YOLOv7 لا يزال يمثل علامة فارقة مرموقة في تاريخ اكتشاف الأجسام، فإن YOLO11 حلًا أكثر حداثة وكفاءة وسهولة في الاستخدام للمطورين. بفضل نسب السرعة إلى الدقة الفائقة ومتطلبات الذاكرة المنخفضة ودعم Ultralytics القوي، YOLO11 مسارًا أكثر وضوحًا للنشر في العالم الواقعي.

لأولئك الذين يبحثون عن أحدث التقنيات، نوصي باستكشاف YOLO26، الذي يبني على هذه الأسس مع استدلال NMS ومُحسِّنات من الجيل التالي.

موارد إضافية


تعليقات