Link to this sectionYOLOv5 مقابل YOLOv8#
عند بناء تطبيقات رؤية حاسوبية قابلة للتوسع وعالية الكفاءة، يعد اختيار البنية الصحيحة أمراً حاسماً. لقد دفع تطور نظام Ultralytics البيئي باستمرار حدود السرعة والدقة، مما يوفر للمطورين أدوات قوية لعمليات النشر في العالم الحقيقي. تتعمق هذه المقارنة التقنية في الاختلافات بين YOLOv5 و YOLOv8، وتستكشف بنيتيهما، والمقايضات في الأداء، وحالات الاستخدام المثالية لمساعدتك في اتخاذ قرار مستنير لمشروعك التالي في مجال الذكاء الاصطناعي.
يمثل كلا النموذجين معالم هامة في تاريخ كشف الأشياء اللحظي، ويستفيد كلاهما من متطلبات الذاكرة المحسنة للغاية وسهولة الاستخدام التي تميز نظام Ultralytics البيئي.
Link to this sectionYOLOv5: معيار الصناعة الموثوق#
تم طرح YOLOv5 في عام 2020، وسرعان ما أصبح معيار الصناعة للكشف السريع والميسر والموثوق عن الأشياء. من خلال الاستفادة من تنفيذ أصلي لـ PyTorch، قام بتبسيط دورة حياة التدريب والنشر للمهندسين على مستوى العالم.
- المؤلفون: Glenn Jocher
- المؤسسة: Ultralytics
- التاريخ: 2020-06-26
- GitHub: ultralytics/yolov5
- التوثيق: توثيق YOLOv5
Link to this sectionنقاط القوة المعمارية#
يعمل YOLOv5 وفق نموذج كشف يعتمد على المرساة (anchor-based)، والذي يعتمد على صناديق مرساة محددة مسبقاً للتنبؤ بحدود الأشياء. تتضمن بنيته هيكلاً أساسياً من نوع Cross-Stage Partial (CSP)، مما يحسن تدفق التدرج ويقلل من التكرار الحسابي. ينتج عن ذلك بصمة ذاكرة خفيفة الوزن بشكل لا يصدق، مما يجعل التدريب سريعاً جداً حتى على GPUs الاستهلاكية القياسية.
Link to this sectionحالات الاستخدام المثالية#
يُنصح بشدة باستخدام YOLOv5 للمشاريع التي تكون فيها الإنتاجية القصوى والحد الأدنى من استهلاك الموارد أمراً بالغ الأهمية. إنه يتفوق في بيئات الذكاء الاصطناعي عند الحافة، مثل النشر على Raspberry Pi أو الأجهزة المحمولة. نضجه يعني أنه تم اختباره بدقة في آلاف عمليات النشر التجارية، مما يوفر استقراراً لا مثيل له لسير عمل كشف الأشياء التقليدي.
Link to this sectionYOLOv8: إطار الرؤية الموحد#
تم إصدار YOLOv8 في يناير 2023، وهو يمثل تحولاً معمارياً هائلاً، حيث تطور من كاشف أشياء مخصص إلى إطار عمل رؤية متعدد المهام ومتعدد الاستخدامات.
- المؤلفون: Glenn Jocher، وAyush Chaurasia، وJing Qiu
- المؤسسة: Ultralytics
- التاريخ: 2023-01-10
- GitHub: ultralytics/ultralytics
- المستندات: توثيق YOLOv8
Link to this sectionالابتكارات المعمارية#
على عكس سابقه، يقدم YOLOv8 رأساً للكشف خالٍ من المراسي (anchor-free). وهذا يلغي الحاجة إلى ضبط تكوينات المرساة يدوياً بناءً على توزيعات مجموعات البيانات، مما يعزز التعميم عبر مجموعات بيانات مخصصة متنوعة مثل مجموعة بيانات COCO الشهيرة.
تقوم البنية أيضاً بترقية الهيكل الأساسي باستخدام وحدة C2f (عنق زجاجة Cross-Stage Partial مع التفافين)، لتحل محل وحدة C3 الأقدم. يعمل هذا التحسين على تعزيز تمثيل الميزات دون إثقال كاهل الذاكرة بشكل كبير. بالإضافة إلى ذلك، فإن تنفيذ رأس مفصول (decoupled head) — يفصل مهام تحديد الكائن، والتصنيف، والانحدار — يحسن التقارب بشكل كبير أثناء تدريب النموذج.
Link to this sectionتعدد الاستخدامات وواجهة Python البرمجية#
قدم YOLOv8 واجهة برمجة تطبيقات ultralytics الحديثة لـ Python، مما وحد سير العمل عبر مهام الرؤية الحاسوبية المختلفة. سواء كنت تقوم بـ تجزئة الصور، أو تصنيف الصور، أو تقدير الوضعية، فإن واجهة برمجة التطبيقات الموحدة تتطلب تغييرات طفيفة فقط في التكوين.
from ultralytics import YOLO
# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")
# Train on a custom dataset with built-in memory efficiency
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference and easily parse results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()Link to this sectionمقارنة مفصلة للأداء#
عند مقارنة الجيلين، نلاحظ مقايضة كلاسيكية: يحقق YOLOv8 دقة متوسط متوسط أعلى (mAP) بشكل عام، بينما يحتفظ YOLOv5 بميزة طفيفة في سرعة الاستدلال الخام المطلقة وعدد المعلمات لأصغر متغيراته.
فيما يلي مقارنة مفصلة لمقاييس أدائهما على مجموعة بيانات COCO بحجم صورة 640 بكسل.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
تكشف البيانات أن YOLOv8 يوفر دفعة كبيرة في الدقة. على سبيل المثال، يحقق YOLOv8s دقة 44.9 mAP مقارنة بـ YOLOv5s عند 37.4 mAP، وهي قفزة هائلة تعمل على تحسين الأداء بشكل كبير في البيئات الكثيفة أو عند تحديد الأشياء الصغيرة. ومع ذلك، بالنسبة للبيئات محدودة الموارد للغاية، يظل YOLOv5n فعالاً بشكل لا يصدق، حيث يتميز بأقل عدد من المعلمات وعمليات الفاصلة العائمة (FLOPs).
كلا النموذجين محسّنان للغاية لاستخدام ذاكرة CUDA أقل أثناء التدريب مقارنة بالبنى الأثقل مثل نماذج Transformer. وهذا يسمح للممارسين باستخدام أحجام دفعات أكبر على GPUs قياسية، مما يسرع دورة حياة البحث.
Link to this sectionميزة النظام البيئي#
اختيار YOLOv5 أو YOLOv8 يمنح المطورين حق الوصول إلى منصة Ultralytics التي تتم صيانتها جيداً. توفر هذه البيئة المتكاملة أدوات بسيطة لتعليق مجموعات البيانات، وضبط المعلمات الفائقة، والتدريب السحابي، ومراقبة النماذج. يضمن التطوير النشط ودعم المجتمع القوي أن المطورين يمكنهم حل المشكلات بسرعة والتكامل مع أدوات خارجية مثل Weights & Biases و ClearML.
بينما قد تعاني أطر العمل الأخرى من منحنيات تعلم حادة، تعطي Ultralytics الأولوية لتجربة مستخدم مبسطة، مما يضمن مقايضة مواتية بين السرعة والدقة مناسبة لسيناريوهات النشر المتنوعة في العالم الحقيقي.
Link to this sectionما بعد v8: استكشاف YOLO11 و YOLO26#
بينما يعد YOLOv8 إطار عمل ذا قدرات عالية، فإن مجال الذكاء الاصطناعي يتطور بسرعة. يجب على المطورين المهتمين بأحدث الأداء استكشاف YOLO11، الذي يبني على v8 بدقة وسرعة محسنتين.
بالنسبة لأولئك الذين يسعون للحصول على أحدث تقنيات الرؤية الحاسوبية، نوصي بشدة بـ Ultralytics YOLO26. الذي تم إصداره في عام 2026، يمثل YOLO26 قفزة هائلة إلى الأمام:
- تصميم شامل خالٍ من NMS: رائد في البنى التجريبية، يلغي YOLO26 محلياً معالجة ما بعد الكشف غير الأقصى (Non-Maximum Suppression)، مما يؤدي إلى خطوط أنابيب نشر أبسط وأسرع بكثير.
- مُحسِّن MuSGD: مستوحى من ابتكارات تدريب النماذج اللغوية الكبيرة (LLM) التي شوهدت في نماذج مثل Kimi K2، يستخدم YOLO26 مُحسِّناً هجيناً لتدريب أكثر استقراراً وتقارباً سريعاً.
- إتقان الحوسبة عند الحافة: مع سرعة تصل إلى 43% أسرع في استدلال CPU مقارنة بالأجيال السابقة، فهو النموذج الأمثل للأجهزة التي تفتقر إلى وحدات GPU مخصصة.
- دقة محسنة: باستخدام وظائف الخسارة الجديدة ProgLoss + STAL، فإنه يحسن بشكل كبير التعرف على الأشياء الصغيرة، وهو أمر بالغ الأهمية لـ الروبوتات وصور الطائرات بدون طيار.
سواء كنت تحافظ على نظام قديم باستخدام YOLOv5، أو توسع تطبيقاً متعدد الاستخدامات باستخدام YOLOv8، أو تبتكر بقدرات YOLO26 المتطورة، فإن مجموعة Ultralytics توفر الأدوات الشاملة اللازمة للنجاح في الذكاء الاصطناعي الرؤيوي الحديث.