تطور اكتشاف الأجسام: YOLOv5 YOLOv7
تطورت رؤية الكمبيوتر بسرعة كبيرة خلال السنوات القليلة الماضية، مدفوعة بالحاجة إلى اكتشاف الأجسام في الوقت الفعلي بشكل أسرع وأكثر دقة. عند اختيار البنية المناسبة لمشروع رؤية الكمبيوتر الخاص بك، من المهم فهم الفروق الدقيقة بين النماذج الشائعة مثل Ultralytics YOLOv5 و YOLOv7 بالغ الأهمية. تتعمق هذه المقارنة التقنية الشاملة في هياكلها ومنهجيات التدريب ومقاييس الأداء وسيناريوهات النشر المثالية لمساعدتك على اتخاذ قرار مستنير.
لمحة سريعة: أصول النموذج
فهم الأصول والفلسفات التصميمية الكامنة وراء هذه النماذج يوفر سياقًا لخياراتها المعمارية.
YOLOv5 :
- المؤلفون: Glenn Jocher
- المؤسسة:Ultralytics
- التاريخ: 2020-06-26
- GitHub:مستودع YOLOv5
- الوثائق:وثائق YOLOv5
تفاصيل YOLOv7:
- المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
- المؤسسة:معهد علوم المعلومات، أكاديميا سينيكا، تايوان
- التاريخ: 2022-07-06
- Arxiv:YOLOv7
- GitHub:مستودع YOLOv7
- الوثائق:وثائق YOLOv7
اكتشف المزيد من الهياكل المعمارية
هل أنت مهتم بمقارنة هذه النماذج مع غيرها؟ اطلع على مقارناتنا مثل YOLOv5 YOLO11 أو YOLOv7 EfficientDet لتوسيع فهمك لنظام الكشف عن الكائنات.
الابتكارات والاختلافات المعمارية
YOLOv5: معيار إمكانية الوصول
قدمت Ultralytics عام 2020، YOLOv5 تحولًا جذريًا من خلال استخدامها الأصلي لـ PyTorch ، مما أدى إلى خفض حاجز الدخول بشكل كبير للباحثين والمطورين. تعتمد بنيته على العمود الفقري CSPDarknet53 المعدل، ويدمج شبكات Cross Stage Partial (CSP) لتقليل عدد المعلمات مع الحفاظ على تدفق التدرج.
واحدة من أكبر نقاط قوتها هي متطلبات الذاكرة. مقارنةً بأجهزة الكشف القديمة ذات المرحلتين أو نماذج المحولات الثقيلة مثل RT-DETR، YOLOv5 CUDA أقل بكثير أثناء التدريب، مما يسمح بأحجام دفعات أكبر على وحدات معالجة الرسومات القياسية للمستهلكين. علاوة على ذلك، يدعم تنوعه المدمج أصلاً تصنيف الصور وكشف الكائنات وتقسيم الصور بسلاسة.
YOLOv7: تجاوز حدود الدقة في الوقت الفعلي
صدر YOLOv7 في منتصف عام 2022، YOLOv7 على تخطي حدود أحدث التقنيات في مجال الكشف في الوقت الفعلي على COCO MS COCO . قدم المؤلفون شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN)، التي تعمل على تحسين قدرة الشبكة على التعلم دون إتلاف مسار التدرج الأصلي.
YOLOv7 أيضًا بـ "حقيبة الهدايا القابلة للتدريب"، ولا سيما تقنيات إعادة المعلمات أثناء التدريب التي تحول وحدات متعددة إلى طبقة تلافيفية واحدة للاستدلال، مما يزيد السرعة دون التضحية بالدقة. ومع ذلك، غالبًا ما تؤدي منهجية التدريب المعقدة هذه إلى منحنيات تعلم أكثر حدة وخطوط أنابيب تصدير أقل بساطة مقارنة Ultralytics الأصلي Ultralytics .
مقارنة الأداء
عند تقييم هذه النماذج، فإن التوازن بين السرعة والدقة والتكلفة الحسابية هو أمر بالغ الأهمية. فيما يلي مقارنة مفصلة لمقاييس أدائها استنادًا إلى مجموعة بيانات MS COCO .
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
بينما YOLOv7 mAP مطلقة أعلى على المتغيرات الأكبر حجماً، YOLOv5 مجموعة لا مثيل لها من النماذج — بدءاً من Nano (YOLOv5n) فائق الخفة للأجهزة المتطورة وصولاً إلى Extra-Large (YOLOv5x) للاستدلال السحابي.
ميزة النظام البيئي لـ Ultralytics
تتجاوز فائدة النموذج بنيته الخام؛ فالنظام البيئي المحيط به يحدد مدى سرعة نشره في الإنتاج. وهنا تتألق نماذج Ultralytics.
- سهولة الاستخدام: توفر منصة Ultralytics وواجهة برمجة تطبيقات Python الموحدة الخاصة بها تجربة مستخدم مبسطة، وبناء جملة بسيطًا، ووثائق شاملة. يتطلب تدريب مجموعة بيانات مخصصة صفرًا من التعليمات البرمجية المتكررة.
- نظام بيئي يتم صيانته جيدًا: تستفيد Ultralytics من التطوير النشط والتحديثات المتكررة والدعم المجتمعي القوي. يتم تضمين التكاملات مع أدوات مثل Comet ML و Weights & Biases بشكل مباشر.
- كفاءة التدريب: تجعل محملات البيانات، والتخزين المؤقت الذكي، ودعم متعدد GPU نماذج Ultralytics فعالة بشكل استثنائي في التدريب. تسرع الأوزان المدربة مسبقًا المتاحة بسهولة بشكل كبير التعلم بالنقل.
مثال برمجي: الشروع في العمل
باستخدام Ultralytics لا يتطلب نشر نموذج سوى بضع أسطر من التعليمات البرمجية. يوضح Python التالي Python مدى سهولة تحميل وتدريب وتشغيل الاستدلال باستخدام ultralytics .
from ultralytics import YOLO
# Load a pretrained YOLOv5s model
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 example dataset
# Ultralytics automatically handles data downloading and augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the predictions
predictions[0].show()
في المقابل، يتضمن استخدام مستودع YOLOv7 الأصلي عادةً استنساخ المستودعات المعقدة، وإدارة التبعيات يدويًا، واستخدام وسائط سطر الأوامر الطويلة.
تطبيقات في العالم الحقيقي وحالات استخدام مثالية
متى تختار YOLOv7
YOLOv7 مرشحًا قويًا للمقارنة الأكاديمية أو GPU القديمة المحددة حيث mAP الحد الأقصى mAP الهدف الوحيد ويكون النظام مخصصًا بالفعل لمتجهات الإخراج القائمة على المراسي. غالبًا ما يستخدم الباحثون الذين يستكشفون تحليل مسار التدرج YOLOv7 .
متى تختار YOLOv5
YOLOv5 بشعبية كبيرة في بيئات الإنتاج بفضل استقراره الاستثنائي. وهو الخيار المفضل في الحالات التالية:
- الحوسبة المتنقلة والحافة: نشر YOLOv5n على iOS عبر CoreML أو Android عبر TFLite.
- الشركات الناشئة المرنة: تستفيد الفرق التي تحتاج إلى دورات تكرار سريعة من التكامل السلس لمنصة Ultralytics Platform لإدارة مجموعات البيانات والتدريب السحابي.
- بيئات المهام المتعددة: الأنظمة التي تتطلب اكتشاف الكائنات، التصنيف، والتجزئة المتزامنة.
المستقبل: الانتقال إلى YOLO26
في حين أن مقارنة YOLOv5 YOLOv7 ممارسة ممتازة لفهم تطور الذكاء الاصطناعي في مجال الرؤية، إلا أن أحدث التقنيات في هذا المجال استمرت في التقدم. تم إصدار Ultralytics في يناير 2026، وهو يمثل قفزة هائلة إلى الأمام، مما يجعل البنى القديمة عديمة الفائدة إلى حد كبير للمشاريع الجديدة.
للمطورين الباحثين عن أعلى مستويات الأداء، يقدم YOLO26 العديد من المزايا الرائدة مقارنةً بكل من YOLOv5 YOLOv7:
- تصميم خالٍ من NMS وشامل: من خلال إلغاء معالجة قمع غير الحد الأقصى اللاحقة، يوفر YOLO26 نشرًا أبسط بشكل كبير وزمن انتقال أسرع ومتسق.
- مُحسِّن MuSGD: مستوحى من ابتكارات نماذج اللغة الكبيرة (LLM) من Moonshot AI، يقدم هذا المحسِّن الهجين تدريبًا مستقرًا للغاية وتقاربًا سريعًا.
- سرعة طرفية (Edge) غير مسبوقة: مُحسّنة خصيصًا للبيئات الطرفية، تتميز نسخة النانو بسرعة استدلال على CPU أسرع بنسبة تصل إلى 43% عن طريق إزالة Distribution Focal Loss (DFL).
- دقة فائقة: دوال خسارة جديدة مثل ProgLoss + STAL تحسن بشكل كبير التعرف على الكائنات الصغيرة، مما يجعله مثاليًا لقطات الطائرات بدون طيار والروبوتات.
سواء كنت تقوم بصيانة YOLOv5 موجود بالفعل أو تبحث عن تطبيق YOLO26 المتطور، توفر Ultralytics جميع الأدوات اللازمة للنجاح في مجال الرؤية الحاسوبية الحديثة.