تخطي إلى المحتوى

YOLO11 مقابل YOLOv7: مقارنة تقنية مفصلة

يعد اختيار النموذج الصحيح لاكتشاف الأجسام قرارًا حاسمًا يؤثر على سرعة تطبيقات الرؤية الحاسوبية ودقتها وقابليتها للتطوير. يوفر هذا الدليل مقارنة فنية متعمقة بين Ultralytics YOLO11 و YOLOv7وهما علامتان بارزتان هامتان في سلسلة YOLO (أنت تنظر مرة واحدة فقط). بينما يمثل YOLOv7 قفزة كبيرة إلى الأمام في عام 2022، يقدم YOLO11 الذي تم إصداره مؤخرًا تحسينات معمارية تعيد تعريف الأداء الحديث لتطوير الذكاء الاصطناعي الحديث.

Ultralytics YOLO11: المعيار الجديد للذكاء الاصطناعي البصري

صدر في أواخر عام 2024, Ultralytics YOLO11 يعتمد على الأساس القوي لسابقاته لتقديم كفاءة وتعدد استخدامات لا مثيل لها. وهو مصمم للتعامل مع مجموعة واسعة من مهام الرؤية الحاسوبية ضمن إطار عمل واحد وموحد.

الهندسة المعمارية والابتكارات

يقدم YOLO11 بنية محسّنة تتميز بآليات C3k2 بلوك C3k2 و C2PSA (الجزئي عبر المراحل مع الانتباه المكاني). تسمح هذه التحسينات للنموذج باستخراج الميزات بدقة أكبر مع الحفاظ على عدد أقل من المعلمات مقارنةً بالأجيال السابقة. تم تحسين البنية من أجل السرعة، مما يضمن الحفاظ على قدرات الاستدلال في الوقت الحقيقي على الأجهزة القياسية حتى في النماذج الأكبر حجماً.

تتمثل إحدى الخصائص المميزة ل YOLO11 في دعمه الأصلي لمهام متعددة تتجاوز اكتشاف الأجسام، بما في ذلك تجزئة النماذج وتقدير الوضعيات واكتشاف الصندوق المحيط الموجه (OBB) وتصنيف الصور.

تكامل نظام Ultralytics البيئي

تم دمج YOLO11 بالكامل في نظام Ultralytics البيئي، مما يوفر للمطورين وصولاً سلسًا إلى أدوات إدارة البيانات والتدريب على النماذج والنشر. يقلل هذا التكامل بشكل كبير من تعقيد خطوط أنابيب MLOps، مما يسمح للفرق بالانتقال من النموذج الأولي إلى الإنتاج بشكل أسرع.

تعرف على المزيد حول YOLO11

YOLOv7: معيار مرجعي في التدريب الفعال

ركز YOLOv7 الذي صدر في منتصف عام 2022، بشكل كبير على تحسين عملية التدريب لتحقيق دقة عالية دون زيادة تكاليف الاستدلال. قدم العديد من المفاهيم الجديدة التي أثرت على الأبحاث اللاحقة في هذا المجال.

الهندسة المعمارية والابتكارات

ويتمثل جوهر YOLOv7 في شبكة تجميع الطبقات الموسعة ذات الكفاءة الموسعة ( E-ELAN )، والتي تعمل على تحسين قدرة النموذج على التعلم دون تدمير مسار التدرج الأصلي. كما قدم المؤلفون أيضًا "حقيبة من الرغبات المجانية القابلة للتدريب"، وهي مجموعة من استراتيجيات التحسين - مثل إعادة تحديد معلمات النموذج ورؤوس الكشفالإضافية - التيتعزز الدقة أثناء التدريب ولكن يتم تبسيطها بعيدًا أثناء الاستدلال.

على الرغم من أن YOLOv7 قد وضع معايير مثيرة للإعجاب عند إصداره، إلا أنه في المقام الأول بنية للكشف عن الكائنات. وغالبًا ما يتطلب تكييفها لمهام أخرى مثل التجزئة أو تقدير الوضعية فروعًا أو شوكات محددة من قاعدة الشفرة، على عكس النهج الموحد للنماذج الأحدث.

الهندسة المعمارية القديمة

يعتمد YOLOv7 على طرق الكشف القائمة على المرساة والرؤوس المساعدة المعقدة. على الرغم من فعاليتها، إلا أن هذه الخيارات المعمارية يمكن أن تجعل النموذج أكثر صعوبة في التخصيص والتحسين لنشر الحافة مقارنةً بالتصاميم المبسطة الخالية من المراسي الموجودة في نماذج Ultralytics الحديثة.

اعرف المزيد عن YOLOv7

تحليل الأداء: السرعة والدقة والكفاءة

عند مقارنة المقاييس التقنية، تتضح التطورات في بنية YOLO11. فالنموذج الأحدث يحقق دقة مماثلة أو متفوقة مع عدد أقل بكثير من المعلمات وسرعات استدلال أسرع.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

النقاط الرئيسية

  1. كفاءة المعلمات: يوفر YOLO11 انخفاضًا كبيرًا في حجم النموذج. على سبيل المثال، يتفوق YOLO11l على دقة YOLOv7x (53.4% مقابل 53.1% mAP) مع استخدام معلمات أقل بنسبة 65% تقريبًا (25.3 مليون مقابل 71.3 مليون). هذا التخفيض أمر بالغ الأهمية لنشر النماذج على الأجهزة ذات التخزين والذاكرة المحدودين.
  2. سرعة الاستدلال: تُترجم التحسينات المعمارية في YOLO11 مباشرةً إلى سرعة. على GPU T4 باستخدام TensorRTفإن YOLO11l أسرع بمرتين تقريبًا من YOLOv7x. بالنسبة للتطبيقات CPU يوفر YOLO11n خفيف الوزن سرعات مذهلة (56.1 مللي ثانية)، مما يتيح الكشف في الوقت الفعلي على الأجهزة المتطورة حيث قد تعاني متغيرات YOLOv7 .
  3. متطلبات الحوسبة: عدد عمليات النقطة العائمة ( FLOPs ) أقل بكثير في نماذج YOLO11 . ينتج عن هذا الحمل الحسابي المنخفض استهلاك أقل للطاقة وتوليد حرارة أقل، مما يجعل YOLO11 مناسبًا للغاية لأجهزة الذكاء الاصطناعي المتطورة التي تعمل بالبطارية.

النظام البيئي وتجربة المطورين

بالإضافة إلى المقاييس الأولية، تُعد تجربة المطورين عاملًا رئيسيًا في التمييز. تشتهر نماذج Ultralytics YOLO بسهولة استخدامها ونظامها البيئي القوي.

انسيابية سير العمل

عادةً ما يتطلب YOLOv7 استنساخ مستودع والتفاعل مع البرامج النصية المعقدة للتدريب والاختبار. في المقابل، يتم توزيع YOLO11 عبر حزمة Python القياسية (ultralytics). يتيح ذلك للمطورين دمج إمكانات الرؤية الحاسوبية المتقدمة في برامجهم ببضعة أسطر من التعليمات البرمجية.

from ultralytics import YOLO

# Load a model (YOLO11n recommended for speed)
model = YOLO("yolo11n.pt")

# Train the model with a single command
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

تعدد الاستخدامات وكفاءة التدريب

يدعم YOLO11 مجموعة كبيرة من المهام الجاهزة. إذا تحولت متطلبات المشروع من المربعات المحدودة البسيطة إلى تجزئة المثيل أو تقدير الوضعية، يمكن للمطوّرين ببساطة تبديل ملف وزن النموذج (على سبيل المثال yolo11n-seg.pt) دون تغيير قاعدة الشيفرة أو خط الأنابيب بالكامل. يتطلب YOLOv7 بشكل عام إيجاد وتكوين شوكات محددة لهذه المهام.

علاوة على ذلك، يستفيد YOLO11 من كفاءة التدريب. تستخدم النماذج تقنيات التحسين الحديثة وتأتي بأوزان عالية الجودة مُدربة مسبقاً، وغالباً ما تتقارب بشكل أسرع من البنى القديمة. وتمتد هذه الكفاءة لتشمل متطلبات الذاكرة؛ حيث تم تحسين نماذج Ultralytics لتقليل استخدام ذاكرة CUDA أثناء التدريب، مما يمنع الأخطاء الشائعة التي تحدث في الذاكرة (OOM) التي تصيب أجهزة الكشف القديمة أو القائمة على المحولات.

التوثيق والدعم

تحتفظ Ultralytics بوثائق شاملة ومجتمع نابض بالحياة. ويستفيد المستخدمون من التحديثات المتكررة وإصلاحات الأخطاء ومسار واضح لدعم المؤسسات. وعلى العكس من ذلك، فإن مستودع YOLOv7 على الرغم من أهميته التاريخية، إلا أنه أقل نشاطًا في الصيانة، مما قد يشكل مخاطر على عمليات النشر طويلة الأجل للإنتاج.

تطبيقات عملية في أرض الواقع

  • تحليلات البيع بالتجزئة: تسمح الدقة والسرعة العاليتان لـ YOLO11 بتتبع سلوك العملاء في الوقت الفعلي ومراقبة المخزون على أجهزة المتجر القياسية.
  • الروبوتات المستقلة: إن زمن الاستجابة المنخفض لـ YOLO11n يجعلها مثالية للملاحة وتجنب العقبات في الطائرات بدون طيار والروبوتات حيث يكون لكل جزء من الثانية أهمية.
  • صور الرعاية الصحية: من خلال الدعم الأصلي للتجزئة، يمكن تكييف YOLO11 بسرعة لتحديد وتحديد الحالات الشاذة في عمليات المسح الطبي بدقة عالية.
  • الفحص الصناعي: إن القدرة على التعامل مع OBB (الصناديق المحدودة الموجهة) تجعل YOLO11 متفوقًا في اكتشاف الأجزاء المدورة أو النصوص على خطوط التجميع، وهي ميزة غير متوفرة أصلاً في YOLOv7 القياسي.

الخلاصة

بينما لا يزال YOLOv7 نموذجًا قادرًا وشاهدًا على التقدم السريع للرؤية الحاسوبية في عام 2022, Ultralytics YOLO11 يمثل الخيار النهائي لتطوير الذكاء الاصطناعي الحديث. فهو يوفر توازناً فائقاً بين الأداء والكفاءة وسهولة الاستخدام.

بالنسبة للمطورين والباحثين، يوفر الانتقال إلى YOLO11 مزايا فورية: أوقات استدلال أسرع، وتكاليف أجهزة أقل، وسير عمل موحد لمهام الرؤية المتنوعة. وبدعم من نظام Ultralytics النشط، فإن YOLO11 ليس مجرد نموذج بل هو حل شامل لنشر أحدث ما توصلت إليه الرؤية الحاسوبية في العالم الحقيقي.

مزيد من الاستكشاف

استكشف المزيد من المقارنات للعثور على أفضل طراز يناسب احتياجاتك الخاصة:


تعليقات