YOLOv5 YOLOv8: تقييم تطور الذكاء الاصطناعي Ultralytics من Ultralytics
عند إنشاء تطبيقات رؤية حاسوبية قابلة للتطوير وفعالة، فإن اختيار البنية المناسبة أمر بالغ الأهمية. تطور Ultralytics دائمًا حدود السرعة والدقة، مما يوفر للمطورين أدوات قوية للاستخدامات العملية. تتعمق هذه المقارنة الفنية في الاختلافات بين YOLOv5 و YOLOv8، وتستكشف هياكلهما، ومفاضلات الأداء، وحالات الاستخدام المثالية لمساعدتك في اتخاذ قرار مستنير بشأن مشروع الذكاء الاصطناعي التالي.
يمثل هذان النموذجان علامتين فارقتين في تاريخ الكشف عن الكائنات في الوقت الفعلي، ويستفيد كلاهما من متطلبات الذاكرة المُحسّنة للغاية وسهولة الاستخدام التي تتميز بها Ultralytics .
YOLOv5: المعيار الصناعي الموثوق به
تم طرح YOLOv5 في عام 2020، YOLOv5 أصبح المعيار الصناعي للكشف السريع والمتاح والموثوق عن الأجسام. من خلال الاستفادة من PyTorch ، قام بتبسيط دورة حياة التدريب والنشر للمهندسين على مستوى العالم.
- المؤلفون: Glenn Jocher
- المؤسسة:Ultralytics
- التاريخ: 2020-06-26
- GitHub:ultralytics/yolov5
- الوثائق:وثائق YOLOv5
نقاط القوة المعمارية
YOLOv5 على نموذج الكشف القائم على المرجع، والذي يعتمد على مربعات مرجعية محددة مسبقًا للتنبؤ بحدود الكائنات. تضم بنيته شبكة أساسية عبر المراحل الجزئية (CSP)، مما يؤدي إلى تحسين تدفق التدرج وتقليل التكرار الحسابي. وينتج عن ذلك استهلاك ذاكرة خفيف للغاية، مما يجعله سريعًا للغاية في التدريب حتى على وحدات معالجة الرسومات القياسية للمستهلكين.
حالات الاستخدام المثالية
YOLOv5 بشدة YOLOv5 في المشاريع التي تتطلب أقصى إنتاجية وأدنى استخدام للموارد. وهو يتفوق في بيئات الذكاء الاصطناعي المتطورة، مثل النشر على Raspberry Pi أو الأجهزة المحمولة. ونضجه يعني أنه تم اختباره بشكل شامل في آلاف من عمليات النشر التجارية، مما يوفر استقرارًا لا مثيل له لعمليات الكشف عن الكائنات التقليدية.
ميزة النشر القديم
نظرًا لانتشاره الواسع، YOLOv5 بمسارات تصدير مستقرة للغاية إلى أطر النشر القديمة مثل TensorRT و ONNX، مما يجعل التكامل مع مجموعات التقنيات القديمة سلسًا.
YOLOv8: إطار الرؤية الموحد
صدر YOLOv8 في يناير 2023، YOLOv8 تحولًا معماريًا هائلاً، حيث تطور من كاشف كائنات مخصص إلى إطار رؤية متعدد المهام ومتعدد الاستخدامات.
- المؤلفون: Glenn Jocher و Ayush Chaurasia و Jing Qiu
- المؤسسة:Ultralytics
- التاريخ: 2023-01-10
- GitHub:ultralytics/ultralytics
- الوثائق:وثائق YOLOv8
الابتكارات المعمارية
على عكس سابقه، YOLOv8 رأس كشف بدون مرساة. وهذا يلغي الحاجة إلى ضبط تكوينات المرساة يدويًا بناءً على توزيعات مجموعات البيانات، مما يعزز التعميم عبر مجموعات بيانات مخصصة متنوعة مثل COCO الشهيرة.
كما تعمل البنية على ترقية العمود الفقري باستخدام وحدة C2f (عنق زجاجة جزئي عبر المراحل مع اثنين من التلافيف)، لتحل محل الوحدة C3 القديمة. يعمل هذا التحسين على تحسين تمثيل الميزات دون إجهاد الذاكرة بشكل كبير. بالإضافة إلى ذلك، فإن تنفيذ رأس منفصل — يفصل بين مهام الكائنات والتصنيف والانحدار — يحسن بشكل كبير من التقارب أثناء تدريب النموذج.
تعدد الاستخدامات Python
YOLOv8 الحديثة ultralytics Python التي تعمل على توحيد سير العمل عبر مختلف مهام الرؤية الحاسوبية. سواء كنت تقوم تقسيم الصور, تصنيف الصور، أو تقدير الوضعية، لا تتطلب واجهة برمجة التطبيقات الموحدة سوى تغييرات طفيفة في التكوين.
from ultralytics import YOLO
# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")
# Train on a custom dataset with built-in memory efficiency
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference and easily parse results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
مقارنة مفصلة للأداء
عند مقارنة الجيلين، نلاحظ مقايضة كلاسيكية: YOLOv8 متوسط دقة أعلى (mAP) أعلى بشكل عام، بينما YOLOv5 بميزة طفيفة في سرعة الاستدلال الأولية المطلقة وعدد المعلمات لأصغر متغيراته.
فيما يلي مقارنة مفصلة لمقاييس أدائها على COCO بحجم صورة 640 بكسل.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
تكشف البيانات أن YOLOv8 تحسناً كبيراً في الدقة. على سبيل المثال، YOLOv8s يحقق 44.9 mAP بـ YOLOv5s بمعدل 37.4 mAP وهو قفزة هائلة تحسن الأداء بشكل كبير في البيئات المكتظة أو عند تحديد الأجسام الصغيرة. ومع ذلك، بالنسبة للبيئات شديدة التقييد، YOLOv5n لا يزال فعالاً بشكل لا يصدق، حيث يتميز بأقل عدد من المعلمات وعمليات FLOP.
متطلبات الذاكرة
كلا النموذجين مُحسّنان بشكل كبير لاستخدام CUDA أقل أثناء التدريب مقارنة بالبنى الأثقل مثل نماذج المحولات. وهذا يسمح للممارسين باستخدام أحجام دفعات أكبر على وحدات معالجة الرسومات القياسية، مما يسرع دورة حياة البحث.
ميزة النظام البيئي
YOLOv8 اختيار YOLOv5 YOLOv8 للمطورين الوصول إلى Ultralytics التي تتمتع بصيانة جيدة. توفر هذه البيئة المتكاملة أدوات بسيطة لتعليق مجموعات البيانات، وضبط المعلمات الفائقة، والتدريب السحابي، ومراقبة النماذج. يضمن التطوير النشط والدعم القوي من المجتمع أن يتمكن المطورون من حل المشكلات بسرعة والتكامل مع أدوات خارجية مثل Weights & Biases و ClearML.
في حين أن الأطر الأخرى قد تعاني من منحنيات تعلم حادة، Ultralytics لتجربة مستخدم مبسطة، مما يضمن توازنًا مناسبًا بين السرعة والدقة بما يتناسب مع سيناريوهات النشر المتنوعة في العالم الواقعي.
ما بعد v8: استكشاف YOLO11 YOLO26
على الرغم من أن YOLOv8 إطار عمل عالي الكفاءة، إلا أن مجال الذكاء الاصطناعي يتطور بسرعة. يجب على المطورين المهتمين بأحدث الأداء أن يستكشفوا أيضًا YOLO11، الذي يعتمد على v8 مع تحسين الدقة والسرعة.
لأولئك الذين يبحثون عن أحدث ما توصلت إليه تكنولوجيا الرؤية الحاسوبية، نوصي بشدة باستخدام Ultralytics . تم إصدار YOLO26 في عام 2026، وهو يمثل قفزة هائلة إلى الأمام:
- تصميم شامل NMS: تم ابتكاره في الأصل في البنى التجريبية، ويقوم YOLO26 بإلغاء المعالجة اللاحقة لـ Non-Maximum Suppression بشكل أصلي، مما يؤدي إلى خطوط إنتاج أبسط وأسرع بشكل كبير.
- مُحسّن MuSGD: مستوحى من ابتكارات تدريب LLM التي شوهدت في نماذج مثل Kimi K2، يستخدم YOLO26 مُحسّنًا هجينًا لتدريب أكثر استقرارًا وتقاربًا سريعًا.
- إتقان الحوسبة الطرفية: مع CPU أسرع بنسبة تصل إلى 43٪ مقارنة بالأجيال السابقة، فهو النموذج المثالي للأجهزة التي تفتقر إلى وحدات معالجة رسومات (GPU) مخصصة.
- دقة محسّنة: باستخدام وظائف الخسارة الجديدة ProgLoss + STAL، يتم تحسين التعرف على الأجسام الصغيرة بشكل كبير، وهو أمر بالغ الأهمية في مجال الروبوتات وصور الطائرات بدون طيار.
سواء كان ذلك للحفاظ على نظام قديم باستخدام YOLOv5 أو توسيع نطاق تطبيق متعدد الاستخدامات باستخدام YOLOv8 أو الابتكار باستخدام الإمكانات المتطورة لـ YOLO26، توفر Ultralytics الأدوات الشاملة اللازمة للنجاح في مجال الذكاء الاصطناعي البصري الحديث.