YOLOv7 YOLOv10: مقارنة بين هياكل الكشف في الوقت الفعلي
تميز تطور نماذج الكشف عن الأجسام بالسعي المستمر لتحقيق دقة أعلى ووقت استجابة أقل. ومن المعالم البارزة في هذه الرحلة YOLOv7، الذي تم إصداره في منتصف عام 2022، و YOLOv10، الذي تم طرحه في منتصف عام 2024. ورغم أن كلا الهيكلين قد حققا تقدمًا كبيرًا عند طرحهما، إلا أنهما يمثلان فلسفتين تصميميتين مختلفتين تمامًا. YOLOv7 على تحسين عملية التدريب من خلال "حقيبة الهدايا المجانية"، بينما YOLOv10 نهج شامل يلغي الحاجة إلى القمع غير الأقصى (NMS).
يقدم هذا الدليل مقارنة تقنية مفصلة لمساعدة الباحثين والمهندسين على اختيار الأداة المناسبة لمشاريع الرؤية الحاسوبية الخاصة بهم. نحن نحلل البنية ومقاييس الأداء وسير عمل النشر، ونوضح سبب تفضيل الإصدارات الحديثة مثل Y YOLOv10v10—والأحدث منها YOLO26— غالبًا ما تكون الخيار المفضل لحلول الذكاء الاصطناعي القابلة للتطوير.
مقارنة أداء النموذج
يوضح الجدول أدناه الاختلافات في الأداء بين النموذجين. يوفر YOLOv10 زمن انتقال أقل وكفاءة أعلى (عدد أقل من المعلمات وعمليات FLOP) مقارنةً بـ YOLOv7 لا سيما في النماذج الأصغر حجمًا.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv7: محطة القوة لـ "حقيبة الميزات المجانية"
صدر في يوليو 2022، YOLOv7 لتحسين عملية التدريب دون زيادة تكاليف الاستدلال. قدم المؤلفون مفهومًا يسمى "trainable bag-of-freebies" (حقيبة الهدايا القابلة للتدريب)، والذي يشير إلى طرق التحسين التي تعمل على تحسين الدقة أثناء التدريب ولكن يتم التخلص منها أثناء الاستدلال، مما يحافظ على سرعة النموذج.
التفاصيل التقنية الرئيسية:
- المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
- الجهة المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
- التاريخ: 2022-07-06
- روابط:ورقة بحثية على ArXiv | مستودع GitHub
YOLOv7 شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN). تسمح هذه البنية للنموذج بتعلم ميزات أكثر تنوعًا من خلال التحكم في أقصر وأطول مسارات التدرج بشكل فعال. بالإضافة إلى ذلك، استخدمت تقنيات قياس النموذج التي تعدل سمات البنية (مثل العمق والعرض) في وقت واحد، مما يضمن الأداء الأمثل عبر الأحجام المختلفة. على الرغم من أدائه العالي على COCO YOLOv7 في الأساس كاشف قائم على المراسي، مما قد يعقد أحيانًا ضبط المعلمات الفائقة مقارنة بالبدائل الحديثة الخالية من المراسي.
YOLOv10: الكشف الشامل عن الأجسام في الوقت الفعلي
صدر في مايو 2024 من قبل باحثين من جامعة تسينغهوا، YOLOv10 تحولًا كبيرًا في YOLO من خلال إدخال التدريب NMS.
التفاصيل التقنية الرئيسية:
- المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
- المؤسسة:جامعة تسينغ - هوا
- التاريخ: 2024-05-23
- روابط:ورقة بحثية على ArXiv | مستودع GitHub
YOLOv10 عقبة طويلة الأمد في الكشف في الوقت الفعلي: الاعتماد على Non-Maximum Suppression (NMS) للمعالجة اللاحقة. من خلال استخدام التعيينات المزدوجة المتسقة، YOLOv10 تدريبًا شاملاً، مما يسمح للنموذج بإخراج التنبؤات النهائية مباشرةً. يؤدي إزالة NMS إلى تقليل زمن الاستدلال NMS وتبسيط خطوط الإنتاج، خاصةً على الأجهزة الطرفية حيث تكون تكلفة المعالجة اللاحقة باهظة. علاوة على ذلك، يعمل تصميم النموذج الشامل الذي يحركه الكفاءة والدقة على تحسين مختلف المكونات، مثل رأس التصنيف خفيف الوزن وتقليل الدقة المقسمة للقنوات المكانية، لتقليل التكرار الحسابي.
مقارنة نقدية: الهندسة المعمارية وسهولة الاستخدام
على الرغم من أن كلا النموذجين قويان، إلا أن الاختلافات في بنيتهما تحدد حالات الاستخدام المثالية لكل منهما.
خالٍ من NMS مقابل قائم على المراسٍ
الاختلاف الأكثر تحديدًا هو متطلبات المعالجة اللاحقة. YOLOv7 على NMS المربعات المتداخلة. على الرغم من فعالية NMS تأخيرًا يتناسب مع عدد الكائنات المكتشفة، مما يجعل وقت التنبؤ متغيرًا. في المقابل، يوفر تصميم YOLOv10 الشامل أوقات استدلال حتمية، وهو أمر بالغ الأهمية للتطبيقات الحرجة من حيث السلامة في الوقت الفعلي مثل المركبات ذاتية القيادة.
الكفاءة واستخدام الموارد
YOLOv10 بكفاءة فائقة. كما هو موضح في جدول المقارنة، يحقق YOLOv10b دقة مماثلة لـ YOLOv7 ولكن مع معلمات أقل بنسبة 65٪ تقريبًا. هذا التخفيض الكبير في حجم النموذج يؤدي إلى انخفاض استهلاك الذاكرة، مما يجعل YOLOv10 مناسبًا YOLOv10 للبيئات المحدودة الذاكرة مثل تطبيقات الأجهزة المحمولة أو أجهزة إنترنت الأشياء.
كفاءة الذاكرة
بالنسبة للمطورين الذين يستهدفون الأجهزة الطرفية، فإن انخفاض عدد المعلمات في YOLOv10 انخفاضًا كبيرًا في استخدام ذاكرة الوصول العشوائي (RAM) أثناء الاستدلال. وهذا يسمح بتشغيل أحجام دفعات أكبر أو القيام بمهام متعددة جنبًا إلى جنب مع نماذج الذكاء الاصطناعي الأخرى على نفس الأجهزة.
التدريب والنظام البيئي
يحدد النظام البيئي المحيط بالنموذج مدى عمليته بالنسبة للمطورين. وهنا تبرز أهمية Ultralytics . يمكن الوصول إلى كلا النموذجين عبرPython Ultralytics Python التي توحد تجربة المستخدم.
- سهولة الاستخدام: يمكنك التبديل بين النماذج عن طريق تغيير سلسلة واحدة (على سبيل المثال،
model = YOLO("yolov10n.pt")). - الأوضاع الموحدة: Ultralytics الأوامر للتدريب والتحقق والتصدير إلى تنسيقات مثل ONNX و TensorRT و CoreML.
- كفاءة التدريب: تم تحسين Ultralytics لتقليل استخدام CUDA مقارنة PyTorch الأولية، مما يسمح بأحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) الاستهلاكية.
from ultralytics import YOLO
# Load a pre-trained YOLOv10 model (swappable with YOLOv7)
model = YOLO("yolov10n.pt")
# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference
results = model("path/to/image.jpg")
المستقبل: YOLO26
على الرغم من أن YOLOv7 YOLOv10 هذا المجال يتطور بسرعة. يعتمد YOLO26 الذي تم إصداره مؤخرًا (يناير 2026) على أساس YOLOv10 NMS YOLOv10 يقدم المزيد من الابتكارات لزيادة السرعة والدقة.
- NMS من البداية إلى النهاية: مثل YOLOv10، YOLO26 هي بطبيعتها خالية من البداية إلى النهاية، مما يضمن زمن انتقال حتمي.
- MuSGD Optimizer: مستوحى من تدريب LLM، يضمن هذا المحسن الهجين تدريبًا مستقرًا وتقاربًا أسرع.
- تحسين الحافة: مع إزالة Distribution Focal Loss (DFL)، أصبح YOLO26 أسرع بنسبة تصل إلى 43٪ على CPU، مما يجعله الخيار الأفضل للحوسبة الطرفية.
- تعدد الاستخدامات: يدعم YOLO26 جميع المهام بما في ذلك OBB وتقدير الوضع والتجزئة.
الخلاصة
YOLOv10 الاختيار بين YOLOv7 YOLOv10 على القيود المحددة الخاصة بك.
- اختر YOLOv7 إذا كنت تقوم بصيانة أنظمة قديمة مُحسّنة لهيكلها المحدد أو إذا كنت بحاجة إلى ميزات "bag-of-freebies" المحددة لمقارنة الأبحاث.
- اختر YOLOv10 للعمليات الجديدة التي تتطلب زمن انتقال منخفض وكفاءة عالية. تصميمه NMS وعدد المعلمات المنخفض يجعله مثاليًا للتطبيقات الحديثة في الوقت الفعلي.
ومع ذلك، للحصول على أفضل توازن بين السرعة والدقة وسهولة الاستخدام، نوصي بالاطلاع على أحدث إصدار من YOLO26. بدعم من Ultralytics القوية، يوفر هذا الإصدار الحل الأكثر استعدادًا للمستقبل لتطوير الرؤية الحاسوبية.