تخطي إلى المحتوى

YOLO11 مقابل YOLOv7: مقارنة فنية تفصيلية

يعد اختيار نموذج الكشف عن الأجسام المناسب قرارًا بالغ الأهمية يؤثر على السرعة والدقة وقابلية التوسع في تطبيقات رؤية الكمبيوتر. يقدم هذا الدليل مقارنة فنية متعمقة بين Ultralytics YOLO11 و YOLOv7، وهما معلمَان مهمان في سلالة YOLO (You Only Look Once). بينما يمثل YOLOv7 قفزة كبيرة إلى الأمام في عام 2022، يقدم YOLO11 الذي تم إصداره مؤخرًا تحسينات معمارية تعيد تعريف أحدث أداء لتطوير الذكاء الاصطناعي الحديث.

Ultralytics YOLO11: المعيار الجديد للرؤية الذكاء الاصطناعي

تم إصدار Ultralytics YOLO11 في أواخر عام 2024، وهو يعتمد على الأساس المتين الذي وضعته الإصدارات السابقة لتقديم كفاءة وتنوع لا مثيل لهما. لقد صُمم للتعامل مع مجموعة واسعة من مهام الرؤية الحاسوبية ضمن إطار عمل موحد.

الهندسة المعمارية والابتكارات

يقدم YOLO11 بنية محسنة تتميز بآليتي C3k2 block و C2PSA (Cross-Stage Partial with Spatial Attention). تسمح هذه التحسينات للنموذج باستخراج الميزات بدقة أكبر مع الحفاظ على عدد أقل من المعلمات مقارنة بالأجيال السابقة. تم تحسين البنية من أجل السرعة، مما يضمن أن حتى المتغيرات الأكبر للنموذج تحافظ على قدرات الاستدلال في الوقت الفعلي على الأجهزة القياسية.

إحدى الخصائص المميزة لـ YOLO11 هي دعمها الأصلي لمهام متعددة تتجاوز اكتشاف الكائنات، بما في ذلك تقسيم المثيلات، و تقدير الوضعية، و اكتشاف الصندوق المحيط الموجه (OBB)، و تصنيف الصور.

تكامل النظام الإيكولوجي لـ Ultralytics

تم دمج YOLO11 بالكامل في نظام Ultralytics البيئي، مما يوفر للمطورين وصولاً سلسًا إلى أدوات إدارة البيانات وتدريب النماذج ونشرها. يقلل هذا التكامل بشكل كبير من تعقيد خطوط أنابيب MLOps، مما يسمح للفرق بالانتقال من النموذج الأولي إلى الإنتاج بشكل أسرع.

تعرف على المزيد حول YOLO11

YOLOv7: معيار في التدريب الفعال

ركزت YOLOv7، التي أُصدرت في منتصف عام 2022، بشكل كبير على تحسين عملية التدريب لتحقيق دقة عالية دون زيادة تكاليف الاستدلال. وقد قدمت العديد من المفاهيم الجديدة التي أثرت على الأبحاث اللاحقة في هذا المجال.

الهندسة المعمارية والابتكارات

يكمن جوهر YOLOv7 في E-ELAN (شبكة تجميع الطبقات الفعالة الممتدة)، والتي تعمل على تحسين قدرة النموذج على التعلم دون تدمير مسار التدرج الأصلي. قدم المؤلفون أيضًا "حقيبة التدريب المجانية القابلة للتدريب"، وهي مجموعة من استراتيجيات التحسين - مثل إعادة معلمات النموذج و رؤوس الكشف المساعدة - التي تعزز الدقة أثناء التدريب ولكن يتم تبسيطها أثناء الاستدلال.

في حين أن YOLOv7 وضعت معايير مثيرة للإعجاب عند إصدارها، إلا أنها في الأساس بنية للكشف عن الكائنات. غالبًا ما يتطلب تكييفه لمهام أخرى مثل التجزئة أو تقدير الوضع فروعًا أو تفرعات محددة لقاعدة التعليمات البرمجية، على عكس النهج الموحد للنماذج الأحدث.

بنية قديمة

يعتمد YOLOv7 على طرق الكشف القائمة على المرساة والرؤوس المساعدة المعقدة. على الرغم من فعاليتها، إلا أن هذه الخيارات المعمارية يمكن أن تجعل النموذج أكثر صعوبة في التخصيص والتحسين للنشر على الحافة مقارنة بالتصميمات المبسطة والخالية من المرساة الموجودة في نماذج Ultralytics الحديثة.

تعرف على المزيد حول YOLOv7

تحليل الأداء: السرعة والدقة والكفاءة

عند مقارنة المقاييس التقنية، تصبح التطورات في بنية YOLO11 واضحة. يحقق النموذج الأحدث دقة مماثلة أو فائقة مع عدد أقل بكثير من المعلمات وسرعات استدلال أسرع.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

النقاط الرئيسية

  1. كفاءة المعلمات: يوفر YOLO11 انخفاضًا كبيرًا في حجم النموذج. على سبيل المثال، يتجاوز YOLO11l دقة YOLOv7x (53.4% مقابل 53.1% mAP) مع استخدام معلمات أقل بنسبة 65% تقريبًا (25.3 مليون مقابل 71.3 مليون). هذا التخفيض ضروري لنشر النماذج على الأجهزة ذات التخزين والذاكرة المحدودين.
  2. سرعة الاستدلال: تُترجم التحسينات المعمارية في YOLO11 مباشرةً إلى سرعة. على وحدة معالجة الرسوميات T4 باستخدام TensorRT، يكون YOLO11l أسرع بحوالي مرتين من YOLOv7x. بالنسبة للتطبيقات المستندة إلى وحدة المعالجة المركزية CPU، يوفر YOLO11n خفيف الوزن سرعات لا تصدق (56.1 مللي ثانية)، مما يتيح الكشف في الوقت الفعلي على أجهزة الحافة حيث ستواجه متغيرات YOLOv7 صعوبة.
  3. متطلبات الحوسبة: عدد FLOPs (عمليات النقطة العائمة) أقل بكثير بالنسبة لنماذج YOLO11. يؤدي هذا الحمل الحسابي الأقل إلى تقليل استهلاك الطاقة وتوليد الحرارة، مما يجعل YOLO11 مناسبًا جدًا لأجهزة الذكاء الاصطناعي الطرفية التي تعمل بالبطاريات.

النظام البيئي وتجربة المطور

بالإضافة إلى المقاييس الأولية، تُعد تجربة المطور ميزة رئيسية. تشتهر نماذج Ultralytics YOLO بسهولة الاستخدام والنظام البيئي القوي.

سير عمل مبسط

يتطلب YOLOv7 عادةً استنساخ مستودع والتفاعل مع نصوص shell المعقدة للتدريب والاختبار. في المقابل، يتم توزيع YOLO11 عبر حزمة Python قياسية (ultralytics). يتيح هذا للمطورين دمج إمكانات رؤية الكمبيوتر المتقدمة في برامجهم ببضعة أسطر فقط من التعليمات البرمجية.

from ultralytics import YOLO

# Load a model (YOLO11n recommended for speed)
model = YOLO("yolo11n.pt")

# Train the model with a single command
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

تعدد الاستخدامات وكفاءة التدريب

يدعم YOLO11 مجموعة واسعة من المهام خارج الصندوق. إذا تحول شرط المشروع من مربعات إحاطة بسيطة إلى تجزئة المثيل أو تقدير الوضعية، يمكن للمطورين ببساطة تبديل ملف وزن النموذج (على سبيل المثال، yolo11n-seg.pt) دون تغيير قاعدة التعليمات البرمجية أو خط الأنابيب بأكمله. يتطلب YOLOv7 عمومًا العثور على فروع معينة وتكوينها لهذه المهام.

علاوة على ذلك، يستفيد YOLO11 من كفاءة التدريب. تستخدم النماذج تقنيات التحسين الحديثة وتأتي مع أوزان مُدرَّبة مسبقًا عالية الجودة، وغالبًا ما تتقارب بشكل أسرع من التصميمات المعمارية القديمة. تمتد هذه الكفاءة إلى متطلبات الذاكرة؛ تم تحسين نماذج Ultralytics لتقليل استخدام ذاكرة CUDA أثناء التدريب، مما يمنع أخطاء نفاد الذاكرة (OOM) الشائعة التي تبتلي أجهزة الكشف القديمة أو القائمة على المحولات.

الوثائق والدعم

تحتفظ Ultralytics بـ توثيق شامل ومجتمع نابض بالحياة. يستفيد المستخدمون من التحديثات المتكررة وإصلاحات الأخطاء ومسار واضح لدعم المؤسسات. وعلى العكس من ذلك، فإن مستودع YOLOv7، على الرغم من أهميته التاريخية، إلا أنه أقل نشاطًا في الصيانة، مما قد يشكل مخاطر على عمليات النشر الإنتاجية طويلة الأجل.

تطبيقات عملية في أرض الواقع

  • تحليلات البيع بالتجزئة: تتيح الدقة والسرعة العالية لـ YOLO11 تتبع سلوك العملاء ومراقبة المخزون في الوقت الفعلي على أجهزة المتجر القياسية.
  • الروبوتات الذاتية: إن زمن الوصول المنخفض لـ YOLO11n يجعله مثاليًا للملاحة وتجنب العوائق في الطائرات بدون طيار والروبوتات حيث كل جزء من الألف من الثانية مهم.
  • صور الرعاية الصحية: مع الدعم الأصلي للتجزئة، يمكن تكييف YOLO11 بسرعة لتحديد وتحديد الحالات الشاذة في الفحوصات الطبية بدقة عالية.
  • الفحص الصناعي: إن قدرة YOLO11 على التعامل مع OBB (مربعات الإحاطة الموجهة) تجعله متفوقًا في اكتشاف الأجزاء أو النصوص التي تم تدويرها على خطوط التجميع، وهي ميزة غير متوفرة أصلاً في YOLOv7 القياسي.

الخلاصة

في حين أن YOLOv7 لا يزال نموذجًا قادرًا وشهادة على التقدم السريع لرؤية الحاسوب في عام 2022، إلا أن Ultralytics YOLO11 يمثل الخيار النهائي لتطوير الذكاء الاصطناعي الحديث. إنه يوفر توازنًا فائقًا بين الأداء و الكفاءة و سهولة الاستخدام.

بالنسبة للمطورين والباحثين، يوفر الانتقال إلى YOLO11 فوائد فورية: أوقات استدلال أسرع، وتكاليف أجهزة مخفضة، وسير عمل موحد لمهام الرؤية المتنوعة. بدعم من نظام Ultralytics البيئي النشط، فإن YOLO11 ليس مجرد نموذج ولكنه حل شامل لنشر أحدث رؤية حاسوبية في العالم الحقيقي.

مزيد من الاستكشاف

استكشف المزيد من المقارنات للعثور على أفضل نموذج لاحتياجاتك الخاصة:


تعليقات