YOLOv5 YOLOv8: تقييم تطور الذكاء الاصطناعي Ultralytics من Ultralytics
عند إنشاء تطبيقات رؤية حاسوبية قابلة للتطوير وفعالة، فإن اختيار البنية المناسبة أمر بالغ الأهمية. تطور Ultralytics دائمًا حدود السرعة والدقة، مما يوفر للمطورين أدوات قوية للاستخدامات العملية. تتعمق هذه المقارنة الفنية في الاختلافات بين YOLOv5 و YOLOv8، وتستكشف هياكلهما، ومفاضلات الأداء، وحالات الاستخدام المثالية لمساعدتك في اتخاذ قرار مستنير بشأن مشروع الذكاء الاصطناعي التالي.
يمثل كلا النموذجين إنجازات هامة في تاريخ اكتشاف الكائنات في الوقت الفعلي، وكلاهما يستفيد من متطلبات الذاكرة المحسّنة للغاية وسهولة الاستخدام التي تميز نظام Ultralytics البيئي.
YOLOv5: المعيار الصناعي الموثوق به
تم طرح YOLOv5 في عام 2020، YOLOv5 أصبح المعيار الصناعي للكشف السريع والمتاح والموثوق عن الأجسام. من خلال الاستفادة من PyTorch ، قام بتبسيط دورة حياة التدريب والنشر للمهندسين على مستوى العالم.
- المؤلفون: Glenn Jocher
- المؤسسة:Ultralytics
- التاريخ: 2020-06-26
- GitHub:ultralytics/yolov5
- الوثائق:وثائق YOLOv5
نقاط القوة المعمارية
YOLOv5 على نموذج الكشف القائم على المرجع، والذي يعتمد على مربعات مرجعية محددة مسبقًا للتنبؤ بحدود الكائنات. تضم بنيته شبكة أساسية عبر المراحل الجزئية (CSP)، مما يؤدي إلى تحسين تدفق التدرج وتقليل التكرار الحسابي. وينتج عن ذلك استهلاك ذاكرة خفيف للغاية، مما يجعله سريعًا للغاية في التدريب حتى على وحدات معالجة الرسومات القياسية للمستهلكين.
حالات الاستخدام المثالية
YOLOv5 بشدة YOLOv5 في المشاريع التي تتطلب أقصى إنتاجية وأدنى استخدام للموارد. وهو يتفوق في بيئات الذكاء الاصطناعي المتطورة، مثل النشر على Raspberry Pi أو الأجهزة المحمولة. ونضجه يعني أنه تم اختباره بشكل شامل في آلاف من عمليات النشر التجارية، مما يوفر استقرارًا لا مثيل له لعمليات الكشف عن الكائنات التقليدية.
ميزة النشر القديم
نظرًا لانتشاره الواسع، YOLOv5 بمسارات تصدير مستقرة للغاية إلى أطر النشر القديمة مثل TensorRT و ONNX، مما يجعل التكامل مع مجموعات التقنيات القديمة سلسًا.
YOLOv8: إطار الرؤية الموحد
صدر YOLOv8 في يناير 2023، YOLOv8 تحولًا معماريًا هائلاً، حيث تطور من كاشف كائنات مخصص إلى إطار رؤية متعدد المهام ومتعدد الاستخدامات.
- المؤلفون: Glenn Jocher و Ayush Chaurasia و Jing Qiu
- المؤسسة:Ultralytics
- التاريخ: 2023-01-10
- GitHub:ultralytics/ultralytics
- الوثائق:وثائق YOLOv8
الابتكارات المعمارية
على عكس سابقه، YOLOv8 رأس كشف بدون مرساة. وهذا يلغي الحاجة إلى ضبط تكوينات المرساة يدويًا بناءً على توزيعات مجموعات البيانات، مما يعزز التعميم عبر مجموعات بيانات مخصصة متنوعة مثل COCO الشهيرة.
كما تعمل البنية على ترقية العمود الفقري باستخدام وحدة C2f (عنق زجاجة جزئي عبر المراحل مع اثنين من التلافيف)، لتحل محل الوحدة C3 القديمة. يعمل هذا التحسين على تحسين تمثيل الميزات دون إجهاد الذاكرة بشكل كبير. بالإضافة إلى ذلك، فإن تنفيذ رأس منفصل — يفصل بين مهام الكائنات والتصنيف والانحدار — يحسن بشكل كبير من التقارب أثناء تدريب النموذج.
تعدد الاستخدامات Python
YOLOv8 الحديثة ultralytics Python التي تعمل على توحيد سير العمل عبر مختلف مهام الرؤية الحاسوبية. سواء كنت تقوم تقسيم الصور, تصنيف الصور، أو تقدير الوضعية، تتطلب واجهة برمجة التطبيقات الموحدة تغييرات طفيفة فقط في التكوين.
from ultralytics import YOLO
# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")
# Train on a custom dataset with built-in memory efficiency
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference and easily parse results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
مقارنة مفصلة للأداء
عند مقارنة الجيلين، نلاحظ مقايضة كلاسيكية: YOLOv8 متوسط دقة أعلى (mAP) أعلى بشكل عام، بينما YOLOv5 بميزة طفيفة في سرعة الاستدلال الأولية المطلقة وعدد المعلمات لأصغر متغيراته.
فيما يلي المقارنة التفصيلية لمقاييس أدائهم على مجموعة بيانات COCO بحجم صورة 640 بكسل.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
تكشف البيانات أن YOLOv8 تحسناً كبيراً في الدقة. على سبيل المثال، YOLOv8s يحقق 44.9 mAP مقارنة بـ YOLOv5s عند 37.4 mAP، وهي قفزة هائلة تحسن الأداء بشكل كبير في البيئات الكثيفة أو عند تحديد الكائنات الصغيرة. ومع ذلك، للبيئات شديدة التقييد، YOLOv5n لا يزال فعالاً بشكل لا يصدق، حيث يتميز بأقل عدد من المعلمات وعمليات FLOP.
متطلبات الذاكرة
تم تحسين كلا النموذجين بشكل كبير لاستخدام ذاكرة CUDA أقل أثناء التدريب مقارنة بالبنى الأثقل مثل نماذج المحولات. يتيح ذلك للممارسين استخدام أحجام دفعات أكبر على وحدات GPU القياسية، مما يسرع دورة حياة البحث.
ميزة النظام البيئي
يمنح اختيار YOLOv5 أو YOLOv8 المطورين إمكانية الوصول إلى منصة Ultralytics التي تتم صيانتها جيدًا. توفر هذه البيئة المتكاملة أدوات بسيطة لترقيم مجموعات البيانات، وضبط المعلمات الفائقة، والتدريب السحابي، ومراقبة النماذج. يضمن التطوير النشط والدعم المجتمعي القوي أن يتمكن المطورون من حل المشكلات بسرعة والتكامل مع الأدوات الخارجية مثل Weights & Biases و ClearML.
في حين أن الأطر الأخرى قد تعاني من منحنيات تعلم حادة، Ultralytics لتجربة مستخدم مبسطة، مما يضمن توازنًا مناسبًا بين السرعة والدقة بما يتناسب مع سيناريوهات النشر المتنوعة في العالم الواقعي.
ما وراء الإصدار 8: استكشاف YOLO11 و YOLO26
على الرغم من أن YOLOv8 إطار عمل عالي الكفاءة، إلا أن مجال الذكاء الاصطناعي يتطور بسرعة. يجب على المطورين المهتمين بأحدث الأداء أن يستكشفوا أيضًا YOLO11، الذي يعتمد على v8 مع تحسين الدقة والسرعة.
لأولئك الذين يبحثون عن أحدث ما توصلت إليه تكنولوجيا الرؤية الحاسوبية، نوصي بشدة باستخدام Ultralytics . تم إصدار YOLO26 في عام 2026، وهو يمثل قفزة هائلة إلى الأمام:
- تصميم شامل خالٍ من NMS: يلغي YOLO26 بطبيعته المعالجة اللاحقة لقمع غير الأقصى (Non-Maximum Suppression)، الذي كان رائداً في الأصل في البنى التجريبية، مما يؤدي إلى مسارات نشر أبسط وأسرع بكثير.
- مُحسِّن MuSGD: مستوحى من ابتكارات تدريب نماذج LLM التي شوهدت في نماذج مثل Kimi K2، يستخدم YOLO26 مُحسِّنًا هجينًا لتدريب أكثر استقرارًا وتقاربًا سريعًا.
- إتقان الحوسبة الحافة: مع استدلال أسرع بنسبة تصل إلى 43% على CPU مقارنة بالأجيال السابقة، إنه النموذج الأمثل للأجهزة التي تفتقر إلى GPUs مخصصة.
- دقة محسنة: باستخدام دوال الخسارة الجديدة ProgLoss + STAL، يحسن بشكل كبير التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية للروبوتات وتصوير الطائرات بدون طيار الجوي.
سواء كان ذلك للحفاظ على نظام قديم باستخدام YOLOv5 أو توسيع نطاق تطبيق متعدد الاستخدامات باستخدام YOLOv8 أو الابتكار باستخدام الإمكانات المتطورة لـ YOLO26، توفر Ultralytics الأدوات الشاملة اللازمة للنجاح في مجال الذكاء الاصطناعي البصري الحديث.