YOLOv5 YOLOv7: تطور أجهزة الكشف عن الأجسام في الوقت الفعلي
يتطلب اختيار بنية الكشف عن الكائنات المناسبة تحقيق التوازن بين الدقة وسرعة الاستدلال وسهولة النشر. يقدم هذا الدليل مقارنة تقنية مفصلة بين Ultralytics YOLOv5 و YOLOv7، وهما نموذجان مؤثران في مجال الرؤية الحاسوبية. نحن نحلل الاختلافات في البنية ومعايير الأداء وحالات الاستخدام المثالية لمساعدتك في اتخاذ قرار مستنير لمشاريع الرؤية الحاسوبية الخاصة بك.
ملخص تنفيذي
في حين أن كلا النموذجين قادران على ذلك، YOLOv5 يظل المعيار الصناعي من حيث سهولة الاستخدام وتنوع التطبيقات ودعم المجتمع. إن نظامه البيئي الناضج وتكامله السلس مع Ultralytics يجعلانه خيارًا ممتازًا لبيئات الإنتاج. YOLOv7، الذي تم إصداره لاحقًا، ابتكارات معمارية مثل E-ELAN لتحقيق دقة قصوى أعلى على GPU ولكنه يفتقر إلى الدعم الشامل للمهام المتعددة والأدوات المبسطة الموجودة في Ultralytics .
بالنسبة للمطورين الذين يبدؤون مشاريع جديدة في عام 2026، نوصي بشدة بتقييم YOLO26، الذي يتفوق على كلا النموذجين من حيث السرعة والدقة بفضل تصميمه الأصلي الشامل NMS.
Ultralytics YOLOv5: معيار الإنتاج
YOLOv5 أحدثت ثورة في هذا المجال ليس فقط من خلال المقاييس الأولية، ولكن من خلال إعطاء الأولوية لتجربة المطور. كان هذا أول YOLO يتم تنفيذه أصلاً في PyTorch، مما جعله متاحًا لمجتمع واسع من الباحثين والمهندسين. وقد رسخت فلسفته القائمة على "سهولة التدريب وسهولة النشر" مكانته كحل مثالي للتطبيقات الواقعية التي تتراوح من المركبات ذاتية القيادة إلى التفتيش الصناعي.
Author: Glenn Jocher
Organization:Ultralytics
Date: 2020-06-26
GitHub:ultralytics/yolov5
Docs:YOLOv5 Documentation
الهندسة المعمارية والتصميم
YOLOv5 شبكة أساسية CSP-Darknet53 مع طبقة Focus (تم استبدالها لاحقًا بـ 6x6 convolution) لتقليل الحساب مع الحفاظ على المعلومات. ويستخدم عنق شبكة تجميع المسارات (PANet) لدمج الميزات والتنبؤ متعدد المقاييس. تشمل الميزات الرئيسية للهندسة ما يلي:
- زيادة بيانات الفسيفساء: تقنية تدريب تجمع أربع صور في صورة واحدة، مما يحسن قدرة النموذج على detect الأجسام detect ويقلل الحاجة إلى مجموعات صغيرة كبيرة.
- مثبتات مربعات الحدود للتعلم التلقائي: يقوم النموذج تلقائيًا بتكييف مربعات التثبيت مع الشكل الهندسي المحدد لمجموعات البيانات المخصصة أثناء التدريب.
- تنشيط SiLU: استخدام وظيفة تنشيط الوحدة الخطية السينيّة (SiLU) لانتشار أكثر سلاسة للانحدار.
نقاط القوة الرئيسية
- سهولة الاستخدام: تتيح واجهة برمجة التطبيقات المبسطة والوثائق القوية للمطورين تدريب نموذج مخصص في بضع أسطر من التعليمات البرمجية.
- تنوع الاستخدامات: دعم تصدير مدمج لـ ONNXو TensorRTو CoreML و TFLite و OpenVINO نشرًا سلسًا عبر الأهداف الطرفية والسحابية.
- قدرات متعددة المهام: بالإضافة إلى الكشف، YOLOv5 تقسيم الحالات وتصنيف الصور، مما يوفر مجموعة أدوات شاملة لمهام الرؤية المتنوعة.
YOLOv7: تعزيز GPU
YOLOv7 تم تصميمه لرفع مستوى السرعة والدقة على GPU . وهو يقدم عدة استراتيجيات "bag-of-freebies" — وهي طرق تزيد من الدقة دون زيادة تكلفة الاستدلال — مما يجعله منافسًا قويًا في سيناريوهات الحوسبة عالية الأداء.
المؤلفون: Chien-Yao Wang، Alexey Bochkovskiy، Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، أكاديمية سينكا، تايوان
التاريخ: 2022-07-06
Arxiv:2207.02696
GitHub:WongKinYiu/yolov7
YOLOv7 :YOLOv7
الهيكلة والابتكار
YOLOv7 على تصميم بنية فعالة وتوسيع نطاق النموذج. وتتمثل ابتكاره الأساسي في شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN)، التي تتيح للنموذج تعلم ميزات أكثر تنوعًا من خلال التحكم في أقصر وأطول مسارات التدرج.
- تحجيم النموذج: YOLOv7 طريقة تحجيم مركبة تعمل على تعديل العمق والعرض في وقت واحد للنماذج القائمة على التسلسل، مما يؤدي إلى تحسين البنية الهندسية لمختلف قيود الأجهزة.
- رأس مساعد من الخشن إلى الناعم: يستخدم رأسًا مساعدًا للتدريب يوجه عملية التعلم، ثم يتم إعادة تحديد معلماته في الرأس الرئيسي للاستدلال، مما يضمن عدم حدوث أي تأثير سلبي على السرعة عند النشر.
- إعادة تحديد المعلمات المخطط لها: تستخدم البنية التحتية التلافيف المعاد تحديد معلماتها (RepConv) بشكل استراتيجي لتحقيق التوازن بين السرعة والدقة، وتجنب الاتصالات المتطابقة التي تدمر التعلم المتبقي.
مقارنة معايير الأداء
يُقارن الجدول التالي أداء YOLOv5 YOLOv7 COCO . في حين YOLOv7 قوة في mAP الخام mAP GPU YOLOv5 سرعة تنافسية، خاصة على CPU وعدد معلمات أقل بكثير للنماذج الأصغر حجمًا.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
تحليل النتائج
- الكفاءة: YOLOv5n (Nano) خفيف الوزن بشكل استثنائي، مما يجعله مثاليًا للأجهزة الطرفية شديدة التقييد حيث كل ميغابايت من الذاكرة مهم.
- الدقة: يحقق YOLOv7x دقة أعلى mAP (53.1٪) مقارنةً بـ YOLOv5x (50.7٪)، مما يدل على مزايا بنية E-ELAN في مهام GPU المتطورة GPU .
- النشر:ONNX CPU ONNX لـ YOLOv5 جيدًا ومُحسّنة، YOLOv5 يوفر أداءً موثوقًاGPU .
الاختيار من أجل التميز
بالنسبة للأجهزة الطرفية مثل Raspberry Pi أو الهواتف المحمولة، غالبًا ما يكون YOLOv5n أو YOLOv5s خيارات أفضل نظرًا لاستهلاكهما الأقل للذاكرة وتوافقهما المثبت TFLite .
التدريب والنظام البيئي
أحد أهم العوامل المميزة هو النظام البيئي المحيط بالنماذج. تستفيدYOLO Ultralytics YOLO من منصة يتم صيانتها باستمرار وتبسط دورة حياة عمليات التعلم الآلي (MLOps) بأكملها.
ميزة النظام الإيكولوجي لـ Ultralytics
- منصة متكاملة: تتيح Ultralytics للمستخدمين إدارة مجموعات البيانات وتصور عمليات التدريب ونشر النماذج بسلاسة من خلال واجهة ويب.
- كفاءة التدريب: YOLOv5 محملات بيانات فعالة وتخزين مؤقت ذكي، مما يقلل بشكل كبير من وقت التدريب على مجموعات البيانات المخصصة مقارنة بالبنى القديمة.
- دعم المجتمع: بفضل الآلاف من المساهمين والمناقشات النشطة على GitHub و Discord، أصبح إيجاد حلول للحالات الاستثنائية أسرع مع Ultralytics .
مثال على الكود: التدريب باستخدام Ultralytics
Ultralytics توحيد تدريب YOLO باستخدام Ultralytics عبر الإصدارات المختلفة. يمكنك التبديل بين YOLOv5 و YOLO11 و YOLO26 الموصى به بمجرد تغيير اسم النموذج.
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model
model = YOLO("yolov5s.pt")
# Train the model on a custom dataset
# The API handles data downloading and configuration automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a new image
predictions = model("path/to/image.jpg")
المستقبل: لماذا الانتقال إلى YOLO26؟
في حين YOLOv7 مقارنة YOLOv5 YOLOv7 مفيدة لفهم الأنظمة القديمة، إلا أن أحدث التقنيات قد تطورت بشكل كبير. تم إصدار Ultralytics في يناير 2026، وهو يمثل تحولًا جذريًا في مجال اكتشاف الأجسام.
- نهاية إلى نهاية أصلاً: على عكس YOLOv5 YOLOv7 اللذين يتطلبان معالجة لاحقة لـ Non-Maximum Suppression (NMS)، فإن YOLO26 NMS أصلاً. وهذا يبسط خطوط النشر ويقلل من تقلب زمن الاستجابة.
- مُحسّن MuSGD: بالاستفادة من الابتكارات في تدريب LLM، يضمن مُحسّن MuSGD تقاربًا أكثر استقرارًا وأداءً قويًا عبر مجموعات بيانات متنوعة.
- سرعة محسّنة: يوفر YOLO26 CPU أسرع CPU تصل إلى 43٪ مقارنة بالأجيال السابقة، مما يجعله الخيار الأفضل لتطبيقات الذكاء الاصطناعي الحديثة.
- تعدد الاستخدامات: يدعم بشكل أساسي Oriented Bounding Box (OBB) وتقدير الوضع والتجزئة باستخدام وظائف خسارة متخصصة مثل ProgLoss و STAL لتحسين اكتشاف الأجسام الصغيرة.
الخلاصة
YOLOv7 كل من YOLOv5 YOLOv7 مكانة مهمة في تاريخ الرؤية الحاسوبية. YOLOv7 هي أداة بحثية قوية لتعظيم mAP GPU محددة. ومع ذلك، YOLOv5 يظل الخيار العملي للكثيرين بسبب سهولة استخدامه التي لا مثيل لها، واستقراره، ودعمه الواسع للنشر.
بالنسبة للمشاريع المستقبلية، فإن التوصية واضحة: اعتماد Ultralytics . فهو يجمع YOLOv5 النظام البيئي سهل الاستخدام لـ YOLOv5 ابتكارات المعمارية التي تتفوق على سابقيها من حيث السرعة والدقة والبساطة.
قم بزيارة مركزUltralytics لاستكشاف هذه البنى بشكل أكثر تفصيلاً وتنزيل الأوزان المدربة مسبقًا لمشروعك التالي.