تطور اكتشاف الأجسام: YOLOv5 مقابل YOLOv7
لقد تطور مشهد الرؤية الحاسوبية بسرعة على مدار السنوات القليلة الماضية، مدفوعاً بالحاجة إلى اكتشاف أسرع وأكثر دقة للأجسام في الوقت الفعلي. عند اختيار البنية المناسبة لمشروع الرؤية الحاسوبية الخاص بك، يعد فهم الفروق الدقيقة بين النماذج الشائعة مثل Ultralytics YOLOv5 وYOLOv7 أمراً بالغ الأهمية. تتعمق هذه المقارنة التقنية الشاملة في بنياتها، ومنهجيات التدريب، ومقاييس الأداء، وسيناريوهات النشر المثالية لمساعدتك على اتخاذ قرار مستنير.
لمحة سريعة: أصول النماذج
إن فهم أصول وفلسفات التصميم الكامنة وراء هذه النماذج يوفر سياقاً لاختياراتها المعمارية.
تفاصيل YOLOv5:
- المؤلفون: Glenn Jocher
- المؤسسة: Ultralytics
- التاريخ: 2020-06-26
- GitHub: مستودع YOLOv5
- المستندات: YOLOv5 Documentation
تفاصيل YOLOv7:
- المؤلفون: Chien-Yao Wang وAlexey Bochkovskiy وHong-Yuan Mark Liao
- المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
- التاريخ: 2022-07-06
- Arxiv: ورقة بحث YOLOv7
- GitHub: مستودع YOLOv7
- المستندات: توثيق YOLOv7
هل أنت مهتم بكيفية مقارنة هذه النماذج بغيرها؟ تحقق من مقارناتنا مثل YOLOv5 مقابل YOLO11 أو YOLOv7 مقابل EfficientDet لتوسيع فهمك لنظام اكتشاف الأجسام.
الابتكارات والاختلافات المعمارية
YOLOv5: المعيار لإمكانية الوصول
قدمت Ultralytics نموذج YOLOv5 في عام 2020، وأحدثت تحولاً جذرياً من خلال الاستفادة بشكل أصلي من إطار عمل PyTorch، مما أدى إلى خفض حاجز الدخول بشكل كبير للباحثين والمطورين. تعتمد بنيته على هيكل أساسي (Backbone) معدل من CSPDarknet53، والذي يدمج شبكات Cross Stage Partial (CSP) لتقليل عدد المعلمات مع الحفاظ على تدفق التدرج.
تعد متطلبات الذاكرة واحدة من أكبر نقاط قوته. فمقارنة بكاشفات المرحلتين القديمة أو نماذج المحولات (Transformers) الثقيلة مثل RT-DETR، يتطلب YOLOv5 ذاكرة CUDA أقل بشكل ملحوظ أثناء التدريب، مما يسمح بأحجام دفعات أكبر على وحدات معالجة الرسومات (GPUs) الاستهلاكية القياسية. علاوة على ذلك، فإن تعدد استخداماته المتكامل أصلياً يدعم تصنيف الصور، واكتشاف الأجسام، وتجزئة الصور بسلاسة.
YOLOv7: دفع حدود الدقة في الوقت الفعلي
تم إصدار YOLOv7 في منتصف عام 2022، وركز على دفع حدود الحالة الراهنة (state-of-the-art) للاكتشاف في الوقت الفعلي على معايير MS COCO. قدم المؤلفون شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN)، والتي تعمل على تحسين قدرة الشبكة على التعلم دون تدمير مسار التدرج الأصلي.
يشتهر YOLOv7 أيضاً بـ "مجموعة الهدايا القابلة للتدريب"، وتحديداً تقنيات إعادة المعلمات (re-parameterization) أثناء التدريب التي تحول وحدات متعددة إلى طبقة تلافيفية واحدة للاستدلال، مما يعزز السرعة دون التضحية بالدقة. ومع ذلك، غالباً ما تؤدي منهجية التدريب المعقدة هذه إلى منحنيات تعلم أكثر حدة وخطوط تصدير أقل مباشرة مقارنة بنظام Ultralytics الأصلي.
مقارنة الأداء
عند تقييم هذه النماذج، يعد توازن الأداء بين السرعة والدقة والتكلفة الحسابية أمراً بالغ الأهمية. فيما يلي مقارنة تفصيلية لمقاييس أدائهم بناءً على مجموعة بيانات MS COCO val2017.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ملي ثانية) | السرعة T4 TensorRT10 (ملي ثانية) | المعلمات (مليون) | FLOPs (مليار) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
بينما يحقق YOLOv7 درجات mAP مطلقة أعلى في المتغيرات الأكبر، يقدم YOLOv5 طيفاً لا مثيل له من النماذج—بدءاً من Nano (YOLOv5n) خفيف الوزن للغاية لأجهزة الحافة (Edge devices) وصولاً إلى Extra-Large (YOLOv5x) للاستدلال السحابي.
ميزة نظام Ultralytics البيئي
تمتد فائدة النموذج إلى ما هو أبعد من بنيته الخام؛ حيث يحدد النظام البيئي المحيط به مدى سرعة نشره في بيئة الإنتاج. وهنا تتألق نماذج Ultralytics.
- سهولة الاستخدام: توفر منصة Ultralytics وواجهة برمجة تطبيقات Python الموحدة الخاصة بها تجربة مستخدم مبسطة، وبناء جملة بسيط، وتوثيقاً شاملاً. يتطلب تدريب مجموعة بيانات مخصصة صفراً من تعليمات البرمجة النمطية.
- نظام بيئي مُصان جيداً: تستفيد Ultralytics من التطوير النشط، والتحديثات المتكررة، ودعم المجتمع القوي. كما أن عمليات التكامل مع أدوات مثل Comet ML وWeights & Biases مدمجة بالفعل.
- كفاءة التدريب: تجعل محمّلات البيانات، والتخزين المؤقت الذكي، ودعم تعدد وحدات معالجة الرسومات (multi-GPU) نماذج Ultralytics فعالة للغاية في التدريب. كما تعمل الأوزان المدربة مسبقاً والمتاحة بسهولة على تسريع التعلم بنقل المعرفة بشكل كبير.
مثال على الكود: البدء
باستخدام Ultralytics، يتطلب نشر النموذج بضعة أسطر فقط من التعليمات البرمجية. يوضح مقتطف Python التالي مدى سهولة تحميل وتدريب وتشغيل الاستدلال باستخدام حزمة ultralytics الموصى بها.
from ultralytics import YOLO
# Load a pretrained YOLOv5s model
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 example dataset
# Ultralytics automatically handles data downloading and augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the predictions
predictions[0].show()على النقيض من ذلك، يتضمن استخدام مستودع YOLOv7 الأصلي عموماً استنساخ مستودعات معقدة، وإدارة التبعيات يدوياً، واستخدام وسيطات سطر أوامر طويلة.
التطبيقات الواقعية وحالات الاستخدام المثالية
متى تختار YOLOv7
يظل YOLOv7 مرشحاً قوياً للمقارنة الأكاديمية أو خطوط أنابيب GPU القديمة المحددة حيث يكون تحقيق أقصى mAP هو الهدف الوحيد ويكون النظام مصمماً بالفعل لمخرجات الموتر القائمة على المرساة (anchor-based). غالباً ما يستخدم الباحثون الذين يستكشفون تحليل مسار التدرج YOLOv7 كخط أساس.
متى تختار YOLOv5
يفضل استخدام YOLOv5 بكثرة في بيئات الإنتاج نظراً لاستقراره الاستثنائي. وهو الخيار المفضل لـ:
- حوسبة الهاتف المحمول والحافة: نشر YOLOv5n على iOS عبر CoreML أو Android عبر TFLite.
- الشركات الناشئة المرنة: تستفيد الفرق التي تحتاج إلى دورات تكرار سريعة من التكامل السلس مع منصة Ultralytics لإدارة مجموعة البيانات والتدريب السحابي.
- بيئات المهام المتعددة: الأنظمة التي تتطلب اكتشاف الأجسام والتصنيف والتجزئة في وقت واحد.
المستقبل: الانتقال إلى YOLO26
على الرغم من أن مقارنة YOLOv5 وYOLOv7 هي تمرين ممتاز لفهم تطور ذكاء الرؤية، إلا أن الحالة الراهنة استمرت في التقدم. ففي يناير 2026، تم إصدار Ultralytics YOLO26 الذي يمثل قفزة هائلة إلى الأمام، مما يجعل البنيات القديمة عتيقة إلى حد كبير بالنسبة للمشاريع الجديدة.
بالنسبة للمطورين الذين يسعون للحصول على ذروة الأداء، يوفر YOLO26 العديد من المزايا الرائدة مقارنة بكل من YOLOv5 وYOLOv7:
- تصميم من طرف إلى طرف (End-to-End) خالٍ من NMS: من خلال التخلص من معالجة ما بعد الاستدلال Non-Maximum Suppression، يوفر YOLO26 نشراً أبسط بكثير وزمن استجابة أسرع وأكثر اتساقاً.
- مُحسِّن MuSGD: مستوحى من ابتكارات النماذج اللغوية الكبيرة (LLM) من Moonshot AI، يوفر هذا المُحسِّن الهجين تدريباً مستقراً للغاية وتقارباً سريعاً.
- سرعة حافة غير مسبوقة: تم تحسينه خصيصاً لبيئات الحافة، حيث يتميز متغير النانو بسرعة استدلال أسرع على وحدة المعالجة المركزية (CPU) بنسبة تصل إلى 43% عن طريق إزالة Distribution Focal Loss (DFL).
- دقة فائقة: تعمل دوال الخسارة (Loss functions) الجديدة مثل ProgLoss + STAL على تحسين التعرف على الأجسام الصغيرة بشكل كبير، مما يجعله مثالياً لتصوير الطائرات بدون طيار والروبوتات.
سواء كنت تحافظ على خط أنابيب YOLOv5 موجود أو تتطلع إلى تنفيذ YOLO26 المتطور، توفر منصة Ultralytics جميع الأدوات اللازمة للنجاح في الرؤية الحاسوبية الحديثة.