تخطي إلى المحتوى

YOLOv7 ضد YOLO11: من الإرث في الوقت الفعلي إلى أحدث كفاءة

يتضمن التنقل في مشهد نماذج رؤية الكمبيوتر فهم الفروق الدقيقة بين البنى المعمارية الراسخة وأحدث الابتكارات المتطورة (SOTA). يقدم هذا الدليل مقارنة فنية شاملة بين YOLOv7، وهو معلم بارز في سلسلة YOLO، و Ultralytics YOLO11، النموذج المتطور المصمم لتحقيق أداء فائق وتنوع.

سوف نستكشف الاختلافات المعمارية الخاصة بهم، ومقاييس الأداء، والتطبيقات العملية لمساعدة المطورين والباحثين على اختيار الأداة المثلى للمهام التي تتراوح من الكشف عن الأجسام إلى تقسيم المثيلات المعقد.

YOLOv7: معيار في الهندسة المعمارية الفعالة

يمثل YOLOv7، الذي تم إصداره في يوليو 2022، قفزة كبيرة إلى الأمام في التوازن بين كفاءة التدريب وسرعة الاستدلال. لقد تم تصميمه ليتفوق على أجهزة الكشف السابقة من خلال التركيز على التحسينات المعمارية التي تقلل عدد المعلمات دون التضحية بالدقة.

المؤلفون: تشين-ياو وانغ، أليكسي بوتشكوفسكي، وهونغ-يوان مارك لياو
المنظمة:معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
المستندات:https://docs.ultralytics.com/models/yolov7/

أبرز الملامح المعمارية

قدم YOLOv7 شبكة تجميع الطبقات الفعالة الممتدة (E-ELAN). تسمح هذه البنية للنموذج بتعلم المزيد من الميزات المتنوعة من خلال التحكم في أقصر وأطول مسارات التدرج، مما يعزز التقارب أثناء التدريب. بالإضافة إلى ذلك، استخدمت "حقيبة التدريب المجانية"، وهي مجموعة من استراتيجيات التحسين مثل إعادة تحديد معلمات النموذج وتعيين التسميات الموجهة من الخشن إلى الدقيق، مما يحسن الدقة دون زيادة تكلفة الاستدلال.

في حين أنه في الأساس نموذج للكشف عن الكائنات، فقد استكشف مجتمع مفتوح المصدر توسيع YOLOv7 لـ تقدير الوضع. ومع ذلك، غالبًا ما تفتقر هذه التطبيقات إلى التكامل السلس الموجود في الأطر الموحدة.

نقاط القوة والقيود

يحظى YOLOv7 بالتقدير لما يلي:

  • أداء قوي: لقد وضعت معيارًا جديدًا لأجهزة الكشف في الوقت الفعلي عند إصدارها، حيث كان أداؤها جيدًا على مجموعة بيانات COCO.
  • الابتكار المعماري (Architectural Innovation): أثر إدخال E-ELAN على الأبحاث اللاحقة في تصميم الشبكات.

ومع ذلك، فإنه يواجه تحديات في سير العمل الحديثة:

  • التعقيد: يمكن أن يكون مسار التدريب معقدًا، ويتطلب تكوينًا يدويًا كبيرًا مقارنةً بالمعايير الحديثة.
  • تنوع محدود: لا يدعم أصلاً مهام مثل التصنيف classify أو مربعات الإحاطة الموجهة (OBB) خارج الصندوق.
  • استخدام الموارد: يتطلب تدريب المتغيرات الأكبر، مثل YOLOv7x، ذاكرة GPU كبيرة، والتي يمكن أن تكون بمثابة عنق الزجاجة للباحثين ذوي الأجهزة المحدودة.

تعرف على المزيد حول YOLOv7

Ultralytics YOLO11: إعادة تعريف السرعة والدقة وسهولة الاستخدام

Ultralytics YOLO11 هو أحدث تطور في سلالة YOLO الشهيرة، وقد تم تصميمه لتقديم أداء SOTA عبر مجموعة واسعة من مهام الرؤية الحاسوبية. استنادًا إلى إرث من التحسين المستمر، يقدم YOLO11 بنية محسنة تزيد من الكفاءة في عمليات النشر في العالم الحقيقي.

المؤلفون: جلين جوتشر و جينغ تشيو
المنظمة:Ultralytics
التاريخ: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
المستندات:https://docs.ultralytics.com/models/yolo11/

هندسة معمارية متقدمة وتنوع

يستخدم YOLO11 عمودًا فقريًا حديثًا يستخدم كتل C3k2 ووحدة SPPF محسّنة لالتقاط الميزات بمقاييس مختلفة بشكل أكثر فعالية. يؤدي هذا التصميم إلى نموذج ليس أكثر دقة فحسب، بل أيضًا أخف وزنًا بشكل ملحوظ من حيث المعلمات و FLOPs مقارنةً بأسلافه ومنافسيه.

إحدى الخصائص المميزة لـ YOLO11 هي دعم المهام المتعددة الأصلي. ضمن إطار عمل واحد، يمكن للمستخدمين تنفيذ:

  • الكشف: تحديد الكائنات باستخدام مربعات محيطة.
  • التقسيم: إخفاء على مستوى البكسل لتحليل دقيق للشكل.
  • التصنيف: تعيين تسميات الفئات للصور بأكملها.
  • تقدير الوضعية: اكتشاف النقاط الرئيسية على أجسام الإنسان.
  • OBB: اكتشاف الكائنات المدورة، وهو أمر بالغ الأهمية للتصوير الجوي.

نظام بيئي موحد

يتكامل Ultralytics YOLO11 بسلاسة مع Ultralytics HUB، وهي منصة لإدارة مجموعات البيانات والتدريب بدون تعليمات برمجية والنشر بنقرة واحدة. يعمل هذا التكامل على تسريع دورة حياة MLOps بشكل كبير.

لماذا يختار المطورون YOLO11؟

  • سهولة الاستخدام: مع تصميم يركز على المستخدم، يمكن تنفيذ YOLO11 في بضعة أسطر فقط من تعليمات Python البرمجية أو عبر CLI بسيط.
  • نظام بيئي جيد الصيانة: مدعومًا بمجتمع نشط وفريق Ultralytics، يتلقى النموذج تحديثات متكررة، مما يضمن التوافق مع أحدث إصدارات PyTorch ومسرعات الأجهزة.
  • موازنة الأداء: يحقق توازنًا استثنائيًا بين سرعة الاستدلال و متوسط الدقة المتوسطة (mAP)، مما يجعله مثاليًا لكل من الأجهزة الطرفية والخوادم السحابية.
  • كفاءة الذاكرة: تتطلب نماذج YOLO11 عادةً ذاكرة CUDA أقل أثناء التدريب مقارنةً بالبنى الأقدم أو النماذج القائمة على المحولات، مما يسمح بأحجام دفعات أكبر أو التدريب على أجهزة متواضعة.

تعرف على المزيد حول YOLO11

مقارنة الأداء: المعايير الفنية

يوضح الجدول التالي اختلافات الأداء بين YOLOv7 و YOLO11. تسلط البيانات الضوء على كيف تتيح التحسينات الحديثة لـ YOLO11 تحقيق دقة فائقة بجزء صغير من التكلفة الحسابية.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

التحليل:

  • الكفاءة: يطابق YOLO11m دقة YOLOv7l (51.5 مقابل 51.4 mAP) مع استخدام ما يقرب من نصف عدد المعلمات (20.1 مليون مقابل 36.9 مليون) وعدد أقل بكثير من FLOPs.
  • السرعة: بالنسبة للتطبيقات في الوقت الفعلي، فإن YOLO11n أسرع بشكل كبير، حيث يسجل 1.5 مللي ثانية على وحدة معالجة الرسومات T4، مما يجعله مثاليًا لمعالجة الفيديو عالية FPS.
  • الدقة: يتجاوز النموذج الأكبر، YOLO11x، YOLOv7x في الدقة (54.7 مقابل 53.1 mAP) مع الحفاظ على عدد معلمات تنافسي.

حالات الاستخدام في العالم الحقيقي

الزراعة والرصد البيئي

في الزراعة الدقيقة، يتطلب اكتشاف أمراض المحاصيل أو مراقبة النمو نماذج يمكن تشغيلها على الأجهزة ذات الطاقة المحدودة، مثل الطائرات بدون طيار أو أجهزة الاستشعار الميدانية.

  • YOLO11: تسمح بنيتها خفيفة الوزن (خاصة YOLO11n/s) بالنشر على Raspberry Pi أو أجهزة NVIDIA Jetson، مما يتيح مراقبة صحة المحاصيل في الوقت الفعلي.
  • YOLOv7: على الرغم من دقته، إلا أن طلبه الحسابي العالي يحد من فائدته على الأجهزة الطرفية التي تعمل بالبطاريات.

التصنيع الذكي ومراقبة الجودة

تتطلب أنظمة الفحص البصري الآلية دقة عالية لاكتشاف العيوب الدقيقة في خطوط التصنيع.

  • YOLO11: تعتبر قدرة النموذج على إجراء التقطيع و OBB أمرًا بالغ الأهمية هنا. على سبيل المثال، يعتبر OBB ضروريًا لاكتشاف المكونات التي تم تدويرها على حزام ناقل، وهي ميزة مدعومة أصلاً بواسطة YOLO11 ولكنها تتطلب تطبيقات مخصصة في YOLOv7.
  • YOLOv7: مناسب للكشف القياسي عن المربعات المحيطة ولكنه أقل قابلية للتكيف مع العيوب الهندسية المعقدة دون تعديل كبير.

المراقبة والأمن

غالبًا ما تعالج الأنظمة الأمنية تدفقات فيديو متعددة في وقت واحد.

  • YOLO11: تتيح سرعة الاستدلال العالية لخادم واحد معالجة المزيد من التدفقات بالتوازي، مما يقلل من تكاليف البنية التحتية.
  • YOLOv7: فعال، ولكن زمن الوصول الأعلى لكل إطار يقلل من العدد الإجمالي للقنوات التي يمكن أن تتعامل معها وحدة واحدة.

الكفاءة في التنفيذ والتدريب

تتمثل إحدى الميزات البارزة في نظام Ultralytics البيئي في تجربة المطور المبسطة. يوجد أدناه مقارنة لكيفية البدء.

البساطة في التعليمات البرمجية

تم تصميم Ultralytics YOLO11 بحيث تكون "متضمنة البطاريات"، مما يزيل التعليمات البرمجية المعقدة.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

في المقابل، غالبًا ما تتطلب المستودعات القديمة استنساخ المستودع وتعديل ملفات التكوين يدويًا وتشغيل نصوص shell المعقدة للتدريب والاستدلال.

مرونة التصدير

يدعم YOLO11 التصدير بنقرة واحدة إلى تنسيقات مختلفة للنشر، بما في ذلك ONNX و TensorRT و CoreML و TFLite. تضمن هذه المرونة أن يكون النموذج الخاص بك جاهزًا للإنتاج في أي بيئة.

الخلاصة: الفائز الواضح

في حين أن YOLOv7 لا يزال نموذجًا محترمًا في تاريخ رؤية الكمبيوتر، فإن Ultralytics YOLO11 يمثل المستقبل. بالنسبة للمطورين والباحثين، يقدم YOLO11 حزمة مقنعة:

  1. مقاييس فائقة: mAP أعلى وسرعات استدلال أسرع.
  2. نظام بيئي غني: الوصول إلى Ultralytics HUB، ووثائق شاملة، ودعم المجتمع.
  3. Versatility: إطار عمل واحد لـ detect و segment و pose و classify و OBB.
  4. مقاومة للمستقبل: تضمن التحديثات والصيانة المستمرة التوافق مع الأجهزة ومكتبات البرامج الجديدة.

لأي مشروع جديد، فإن الاستفادة من كفاءة وسهولة استخدام YOLO11 هي المسار الموصى به لتحقيق أحدث النتائج بأقل احتكاك.

استكشف نماذج أخرى

إذا كنت مهتمًا بإجراء المزيد من المقارنات، فاستكشف هذه الصفحات ذات الصلة في الوثائق:


تعليقات