YOLOv5 في مواجهة YOLO11: مقارنة تقنية شاملة
عند اختيار بنية الرؤية الحاسوبية المناسبة لمشروع جديد، يعد فهم تطور النماذج المتطورة أمراً بالغ الأهمية. إن التقدم من البنى السابقة إلى الأطر الموحدة الحديثة يسلط الضوء على قفزات كبيرة في كل من الكفاءة الخوارزمية وتجربة المطورين. يقدم هذا الدليل مقارنة تقنية متعمقة بين نموذجين بارزين طورتهما Ultralytics: نموذج YOLOv5 الرائد ونموذج YOLO11 عالي الدقة.
مقدمة عن النماذج
تمثل كلتا البنيتين معالم مهمة في مجال اكتشاف الأشياء في الوقت الفعلي، حيث تقدمان مزايا متميزة اعتماداً على بيئة النشر ومتطلبات الأنظمة القديمة لديك.
YOLOv5: حصان العمل في الصناعة
بعد إصداره في صيف عام 2020، أصبح YOLOv5 بسرعة معياراً صناعياً بفضل تنفيذه الأصلي باستخدام PyTorch، مما أدى إلى خفض حاجز الدخول للتدريب والنشر بشكل كبير. لقد ابتعد عن أطر عمل Darknet C المعقدة لأسلافه، موفراً نهجاً برمجياً (Pythonic) لبناء النماذج.
- المؤلفون: Glenn Jocher
- المنظمة: Ultralytics
- التاريخ: 2020-06-26
- GitHub: ultralytics/yolov5
- المستندات: YOLOv5 Documentation
وضع YOLOv5 أساساً قوياً لسهولة الاستخدام وقدم منهجيات تدريب قوية، بما في ذلك تعزيز بيانات الفسيفساء المتقدم (mosaic) والمراسي التلقائية (auto-anchoring). ولا يزال يتمتع بشعبية كبيرة بين الباحثين الذين يبنون أعمالهم على قاعدة كود موثقة جيداً ومختبرة بشكل مكثف.
YOLO11: إطار الرؤية الموحد
بناءً على سنوات من الملاحظات والأبحاث المعمارية، تم تقديم YOLO11 كجزء من إطار عمل موحد قادر على التعامل مع مهام رؤية متعددة بشكل أصلي. وبالتجاوز عن مجرد مربعات الإحاطة، فقد صُمم من الألف إلى الياء لتحقيق أقصى قدر من التنوع والكفاءة.
- المؤلفون: Glenn Jocher و Jing Qiu
- المنظمة: Ultralytics
- التاريخ: 2024-09-27
- GitHub: ultralytics/ultralytics
- الوثائق: توثيق YOLO11
يوفر YOLO11 تجربة مستخدم مبسطة من خلال حزمة ultralytics بلغة Python، ويتميز بواجهة برمجة تطبيقات (API) بسيطة توحد اكتشاف الأشياء، وتجزئة النسخ (instance segmentation)، والتصنيف، وتقدير الوضعية، ومربعات الإحاطة الموجهة (OBB). ويحقق توازناً إيجابياً للغاية بين السرعة والدقة، مما يجعله مثالياً لسيناريوهات النشر الواقعية المتنوعة.
يستفيد كلا النموذجين من النظام البيئي المدار جيداً الذي توفره منصة Ultralytics. تعمل هذه البيئة المتكاملة على تبسيط عملية تعليق البيانات، والتدريب السحابي، وتصدير النماذج عبر أهداف الأجهزة المختلفة.
مقارنة الأداء والمقاييس
A direct comparison of these models reveals how architectural refinements translate to tangible performance gains. The table below illustrates the mean Average Precision (mAP) evaluated on the COCO dataset, alongside CPU and GPU inference speeds and parameter counts.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ملي ثانية) | السرعة T4 TensorRT10 (ملي ثانية) | المعلمات (مليون) | FLOPs (مليار) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
تحليل النتائج
تسلط المقاييس الضوء على قفزة واضحة في توازن الأداء الذي حققه YOLO11. على سبيل المثال، يحقق نموذج YOLO11n (نانو) دقة mAP بنسبة 39.5% مقارنة بـ 28.0% لنموذج YOLOv5n، بينما يقلل في الوقت نفسه من وقت استدلال وحدة المعالجة المركزية عند التصدير عبر ONNX. علاوة على ذلك، يحافظ YOLO11 على متطلبات ذاكرة أقل بشكل ملحوظ أثناء التدريب مقارنة بالنماذج الثقيلة القائمة على Transformer، مما يجعله سهل الوصول إليه للنشر على أجهزة المستهلكين وأجهزة الحافة.
الاختلافات المعمارية
تنبع تحسينات الأداء في YOLO11 من العديد من التطورات المعمارية الرئيسية. بينما استخدم YOLOv5 بنية CSPNet قياسية مع وحدات C3، قدم YOLO11 كتل استخراج ميزات أكثر كفاءة مثل C2f ولاحقاً C3k2، والتي تعمل على تحسين تدفق التدرج وتقليل العبء الحسابي.
يتميز YOLO11 أيضاً برأس معاد صياغته بشكل كبير. وبالابتعاد عن التصميم المعتمد على المراسي (anchor-based) للنماذج القديمة، تعتمد بنى Ultralytics الأحدث نهجاً خالياً من المراسي (anchor-free). وهذا يقلل من عدد توقعات الصناديق، مما يبسط خط أنابيب ما بعد المعالجة ويحسن قدرة النموذج على التعميم عبر مقاييس ونسب عرض إلى ارتفاع مختلفة. بالإضافة إلى ذلك، تتميز هذه النماذج بـ كفاءة تدريب فائقة وأوزان مدربة مسبقاً متاحة بسهولة تسرع من تقارب مجموعات البيانات التي تم ضبطها بدقة.
التنفيذ وأمثلة الكود
إحدى الميزات البارزة في نظام Ultralytics البيئي هي بساطته. بينما جعل YOLOv5 استخدام torch.hub شائعاً للاستدلال السريع، يأخذ YOLO11 هذه الخطوة إلى أبعد من ذلك مع حزمة ultralytics الموحدة بلغة Python.
التدريب باستخدام YOLO11
يتطلب تحميل النموذج وتدريبه والتحقق منه حداً أدنى من الكود الإضافي. وتتعامل واجهة برمجة التطبيقات (API) مع ضبط المعلمات الفائقة وإدارة النموذج بسلاسة.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11s.pt")
# Train on a custom dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
# Easily export the model to TensorRT for hardware acceleration
model.export(format="engine")الاستدلال القديم مع YOLOv5
إذا كنت تحافظ على خط أنابيب أقدم، فإن YOLOv5 يتكامل مباشرة مع آلية التحميل الأصلية في PyTorch، مما يجعل من السهل دمجه في نصوص الاستدلال الحالية.
import torch
# Load a custom or pretrained YOLOv5 model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")
# Perform inference on an image URL
results = model("https://ultralytics.com/images/zidane.jpg")
# Print prediction details to the console
results.print()يدعم كلا النموذجين تنسيقات تصدير واسعة النطاق. سواء كنت تستهدف NVIDIA Jetson باستخدام TensorRT أو تطبيق iOS باستخدام CoreML، فإن عملية النشر موثقة بالكامل ومدعومة من قبل المجتمع.
حالات الاستخدام المثالية
يعتمد الاختيار بين هذه النماذج إلى حد كبير على مرحلة دورة حياة مشروعك ومتطلباتك المحددة.
متى تختار YOLOv5
- صيانة قواعد الكود القديمة: إذا كانت بيئة الإنتاج الخاصة بك مخصصة بشكل كبير حول هيكل مستودع YOLOv5 أو تقنيات تطور المعلمات الفائقة المحددة.
- المراجع الأكاديمية: عند نشر أبحاث تتطلب قياساً مباشراً للأداء مقابل معايير الرؤية الحاسوبية المعتمدة لعامي 2020-2022.
متى تختار YOLO11
- مشاريع المهام المتعددة: عندما يتطلب تطبيقك مزيجاً من المهام مثل تقدير الوضعية وتجزئة النسخ باستخدام واجهة برمجة تطبيقات موحدة واحدة.
- نشر الحافة (Edge Deployments): لسيناريوهات حوسبة الحافة حيث يكون الحصول على أقصى دقة mAP مقابل ميزانية حسابية معينة (FLOPs) أمراً بالغ الأهمية.
- حلول الذكاء الاصطناعي التجارية: مثالية لتطبيقات المؤسسات في البيع بالتجزئة والأمن، مع الاستفادة من الدعم القوي لـ منصة Ultralytics.
الجيل القادم: Ultralytics YOLO26
بينما يمثل YOLO11 توازناً رائعاً بين السرعة والدقة، فإن مجال الذكاء الاصطناعي يتطور بسرعة. بالنسبة للمطورين الذين يبدأون مشاريع جديدة اليوم، نوصي بشدة باستكشاف المعيار الأحدث في رؤية الذكاء الاصطناعي: Ultralytics YOLO26.
تم إصداره في يناير 2026، ويقدم YOLO26 تطورات مغيرة للنموذج مصممة خصيصاً لاحتياجات النشر الحديثة:
- تصميم من طرف إلى طرف بدون NMS: بناءً على المفاهيم التي تم تقديمها لأول مرة في YOLOv10، فإن YOLO26 هو نموذج متكامل من طرف إلى طرف. إنه يلغي الحاجة إلى معالجة ما بعد الاستبعاد غير الأقصى (NMS)، مما يبسط خطوط أنابيب النشر بشكل كبير ويقلل من زمن الاستجابة.
- محسن MuSGD: مستوحى من ابتكارات تدريب النماذج اللغوية الكبيرة (LLM) من نماذج مثل Kimi K2 لشركة Moonshot AI، يضمن هذا الهجين من SGD و Muon تدريباً مستقراً للغاية وتقارباً أسرع بشكل كبير.
- سرعة CPU غير مسبوقة: من خلال إزالة توزيع فقدان التركيز (DFL)، يحقق YOLO26 استدلالاً أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية، مما يجعله الخيار الأفضل تماماً لأجهزة الحافة والبيئات التي لا تحتوي على وحدات GPU مخصصة.
- وظائف خسارة متقدمة: يؤدي دمج ProgLoss و STAL إلى تحسينات ملحوظة في التعرف على الأشياء الصغيرة، وهو أمر بالغ الأهمية لتحليلات الطائرات بدون طيار، وإنترنت الأشياء (IoT)، والروبوتات.
- تحسينات خاصة بالمهام: يقدم تحسينات متخصصة، مثل تقدير احتمالية السجل المتبقي (RLE) للوضعية وفقدان الزاوية المتخصص لـ مربعات الإحاطة الموجهة، مما يضمن أداءً متفوقاً عبر جميع مهام الرؤية الحاسوبية.
بالنسبة للمستخدمين المهتمين ببنيات متخصصة تتجاوز اكتشاف الأشياء القياسي، قد ترغب أيضاً في استكشاف نماذج مثل RT-DETR للاكتشاف القائم على المحولات (Transformer)، أو YOLO-World للتتبع والاكتشاف المفتوح للمفردات. إن تبني هذه الأدوات المدارة جيداً والمحسنة للغاية يضمن بقاء خطوط أنابيب الرؤية الحاسوبية الخاصة بك فعالة وقابلة للتطوير ومواكبة لأحدث التطورات.