تخطي إلى المحتوى

YOLOv5 مقابل YOLO11: مقارنة فنية شاملة

في المشهد سريع التطور في مجال الرؤية الحاسوبية، يعد اختيار النموذج الصحيح لاكتشاف الأجسام أمراً بالغ الأهمية لنجاح المشروع. اثنان من أهم المعالم البارزة في هذا المجال هما YOLOv5 والإصدار الأخير YOLO11. بينما أنشأ YOLOv5 معيارًا أسطوريًا لسهولة الاستخدام والسرعة، فإن YOLO11 يتخطى حدود الدقة والكفاءة، مستفيدًا من سنوات من البحث والتطوير.

يوفر هذا الدليل تحليلاً فنيًا مفصلاً لهذين المعماريين، مما يساعد المطورين والباحثين والمهندسين على اتخاذ قرارات مستنيرة لتطبيقات الذكاء الاصطناعي الخاصة بهم.

Ultralytics YOLOv5: حصان العمل الموثوق

تم إصداره في عام 2020، أحدث YOLOv5 ثورة في إمكانية الوصول إلى اكتشاف الكائنات. كان أول نموذج "You Only Look Once" تم تنفيذه أصلاً في PyTorch، مما جعله في غاية السهولة على المطورين للتدريب والنشر. إن توازنه بين السرعة والدقة جعله الخيار الأمثل لكل شيء بدءًا من الفحص الصناعي وحتى المركبات ذاتية القيادة.

تفاصيل فنية:

الميزات الرئيسية والهندسة المعمارية

يستخدم YOLOv5 بنية تعتمد على المرساة. قدم عمودًا فقريًا CSPDarknet، مما أدى إلى تحسين تدفق التدرج وتقليل التكلفة الحسابية بشكل كبير مقارنة بالتكرارات السابقة. يستخدم النموذج عنق شبكة تجميع المسار (PANet) لتعزيز تدفق المعلومات ويدمج زيادة بيانات الفسيفساء أثناء التدريب، وهي تقنية أصبحت معيارًا لتحسين قوة النموذج ضد الكائنات الأصغر.

نقاط القوة

تشتهر YOLOv5 بـ الاستقرار والنضج. مع سنوات من اختبار المجتمع، فإن النظام البيئي للبرامج التعليمية وعمليات تكامل الطرف الثالث و أدلة النشر واسع النطاق. إنه خيار ممتاز للأنظمة القديمة أو الأجهزة الطرفية حيث توجد بالفعل تحسينات محددة للأجهزة لبنيتها.

تعرف على المزيد حول YOLOv5

Ultralytics YOLO11: التطور الحديث

يمثل YOLO11، الذي سيتم إطلاقه في أواخر عام 2024، أحدث ما توصل إليه الذكاء الاصطناعي البصري. إنه يعتمد على الدروس المستفادة من YOLOv5 و YOLOv8 لتقديم نموذج أسرع وأكثر دقة وأكثر كفاءة من الناحية الحسابية.

تفاصيل فنية:

البنية والميزات الرئيسية

يقدم YOLO11 تحسينات معمارية كبيرة، بما في ذلك وحدات C3k2 block و C2PSA (Cross-Stage Partial with Spatial Attention). على عكس YOLOv5، يستخدم YOLO11 رأس اكتشاف خالٍ من المرساة، مما يبسط عملية التدريب عن طريق إلغاء الحاجة إلى حساب مربعات الارتساء يدويًا. يعزز هذا التحول في التصميم التعميم ويسمح للنموذج بالتكيف بشكل أفضل مع مجموعات البيانات المتنوعة.

تنوع لا مثيل له

إحدى الخصائص المميزة لـ YOLO11 هي دعمها الأصلي لمهام رؤية الكمبيوتر المتعددة داخل إطار عمل واحد. في حين أن YOLOv5 ركزت في المقام الأول على الاكتشاف (مع دعم لاحق للتقسيم)، فقد تم تصميم YOLO11 من الألف إلى الياء للتعامل مع:

تسمح هذه المرونة للمطورين بمعالجة مشاكل robotics والتحليل المعقدة دون تبديل الأطر.

تعرف على المزيد حول YOLO11

مقارنة الأداء

تؤدي المرحلة الانتقالية من YOLOv5 إلى YOLO11 إلى تحقيق مكاسب كبيرة في الأداء. توضح المقاييس أن YOLO11 يقدم مقايضة فائقة بين السرعة والدقة.

الدقة مقابل الكفاءة

يحقق YOLO11 باستمرار متوسط دقة أعلى (mAP) على مجموعة بيانات COCO مقارنةً بنماذج YOLOv5 ذات الحجم المماثل. على سبيل المثال، يتفوق نموذج YOLO11m على نموذج YOLOv5x الأكبر حجمًا في الدقة (51.5 مقابل 50.7 mAP) أثناء التشغيل بجزء صغير من المعلمات (20.1 مليون مقابل 97.2 مليون). يؤدي هذا الانخفاض الكبير في حجم النموذج إلى تقليل متطلبات الذاكرة أثناء التدريب والاستدلال، وهو عامل حاسم للنشر على أجهزة edge AI ذات الموارد المحدودة.

سرعة الاستدلال

بفضل الخيارات المعمارية المحسّنة، يتألق YOLO11 في سرعات الاستدلال لوحدة المعالجة المركزية (CPU). ينشئ نموذج YOLO11n معيارًا جديدًا للتطبيقات في الوقت الفعلي، حيث يسجل 56.1 مللي ثانية فقط على وحدة المعالجة المركزية (CPU) باستخدام ONNX، وهو أسرع بكثير من سابقه.

كفاءة الذاكرة

تم تصميم نماذج Ultralytics YOLO11 للاستخدام الأمثل للذاكرة. بالمقارنة مع الكاشفات المستندة إلى المحولات مثل RT-DETR، يتطلب YOLO11 ذاكرة CUDA أقل بكثير أثناء التدريب، مما يجعله في متناول المطورين الذين لديهم وحدات معالجة رسومات قياسية للمستهلكين.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

التدريب وتجربة المطور

يستفيد كلا النموذجين من نظام Ultralytics البيئي الشامل، المعروف بـ "سهولة الاستخدام".

تكامل سلس

تم دمج YOLO11 في العصر الحديث ultralytics حزمة Python، التي توحد جميع المهام تحت واجهة برمجة تطبيقات (API) بسيطة. يتيح ذلك التدريب والتحقق من الصحة والنشر في بضعة أسطر فقط من التعليمات البرمجية.

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

في حين أن YOLOv5 لديه مستودع مخصص خاص به، إلا أنه يمكن تحميله بسهولة عبر PyTorch Hub أو استخدامه داخل النظام البيئي الأحدث لمهام معينة. تضمن الوثائق القوية لكلا النموذجين أنه سواء كنت تقوم بـ ضبط المعلمات الفائقة أو التصدير إلى OpenVINO، فإن العملية مبسطة.

فوائد النظام الإيكولوجي

يعني اختيار نموذج Ultralytics الوصول إلى مجموعة أدوات مُدارة جيدًا. بدءًا من التكامل مع Comet لتتبع التجارب وحتى الإدارة السلسة لمجموعات البيانات، يدعم النظام البيئي دورة حياة MLOps بأكملها. يضمن هذا التطوير النشط تقديم تصحيحات الأمان وتحسينات الأداء بانتظام.

حالات الاستخدام المثالية

متى تختار YOLOv5

  • الأجهزة القديمة: إذا كانت لديك أجهزة طرفية حالية (مثل Raspberry Pis الأقدم) مع خطوط أنابيب مُحسَّنة خصيصًا لبنية YOLOv5.
  • سير العمل المُنشأ: للمشاريع العميقة في وضع الصيانة حيث يؤدي تحديث بنية النموذج الأساسية إلى تكاليف إعادة هيكلة كبيرة.
  • تحسينات GPU محددة: في الحالات النادرة التي يتم فيها ضبط محركات TensorRT معينة بشكل كبير لبنية طبقة YOLOv5 الدقيقة.

متى تختار YOLO11

  • تطورات جديدة: بالنسبة لجميع المشاريع الجديدة تقريبًا، يُعد YOLO11 نقطة البداية الموصى بها نظرًا لنسبة الدقة إلى الحوسبة الفائقة.
  • تطبيقات CPU في الوقت الفعلي: التطبيقات التي تعمل على معالجات قياسية، مثل أجهزة الكمبيوتر المحمولة أو الحالات السحابية، تستفيد بشكل كبير من تحسينات سرعة CPU في YOLO11.
  • مهام معقدة: المشاريع التي تتطلب segmentation المثيل أو تقدير الوضع جنبًا إلى جنب مع الكشف.
  • متطلبات الدقة العالية: مجالات مثل التصوير الطبي أو تحليل صور الأقمار الصناعية، حيث يكون الكشف عن الكائنات الصغيرة بدقة عالية أمرًا بالغ الأهمية.

الخلاصة

تظل YOLOv5 شهادة على تصميم الذكاء الاصطناعي الفعال والذي يمكن الوصول إليه، بعد أن دعمت ابتكارات لا حصر لها على مدى السنوات القليلة الماضية. ومع ذلك، تمثل YOLO11 المستقبل. بفضل بنيتها المتقدمة الخالية من المرساة، ودرجات mAP الفائقة، وتعدد استخداماتها المحسّن، فإنها توفر للمطورين مجموعة أدوات أكثر قوة لحل تحديات رؤية الكمبيوتر الحديثة.

من خلال اعتماد YOLO11، لن تحصل فقط على أداء أفضل ولكن أيضًا على تطبيقاتك المستقبلية داخل نظام Ultralytics البيئي المزدهر.

استكشف نماذج أخرى

إذا كنت مهتمًا بمقارنة هذه الهياكل مع النماذج الرائدة الأخرى، فاستكشف مقارناتنا التفصيلية:


تعليقات