YOLOv7 YOLO11: مقارنة فنية بين أجهزة الكشف في الوقت الحقيقي
تميز تطور بنى الكشف عن الأجسام بتقدم سريع في السرعة والدقة وسهولة النشر. يقدم هذا الدليل مقارنة تقنية متعمقة بين YOLOv7، وهو نموذج متطور من عام 2022، و YOLO11، وهو إصدار متطور من Ultralytics عام 2024. نحن نحلل الاختلافات في البنية ومقاييس الأداء ومدى ملاءمتها لتطبيقات الرؤية الحاسوبية الحديثة.
ملخص تنفيذي
بينما YOLOv7 تحسينات معمارية مهمة مثل E-ELAN، YOLO11 قفزة جيلية في قابلية الاستخدام ودعم النظام البيئي والكفاءة. YOLO11 أداءً فائقًا على الأجهزة الحديثة، وسير عمل تدريب أسهل بكثير، ودعمًا أصليًا لمجموعة واسعة من المهام تتجاوز الكشف البسيط.
| ميزة | YOLOv7 | YOLO11 |
|---|---|---|
| البنية | E-ELAN، قائم على التسلسل | C3k2، SPPF، مُحسّن لـ GPU |
| المهام | الكشف، الوضعية، التجزئة (محدود) | Detect, Segment, Classify, Pose, OBB, Track |
| سهولة الاستخدام | تعقيد شديد (نصوص متعددة) | مبسطة ( Python موحدة) |
| النظام البيئي | مشتت (محور البحث) | متكامل (Ultralytics ) |
| النشر | يتطلب نصوص تصدير يدوية | تصدير سطر واحد إلى أكثر من 10 تنسيقات |
تحليل مفصل
YOLOv7: بنية "حقيبة الهدايا المجانية"
تم إصدار YOLOv7 في يوليو 2022، YOLOv7 تصميمه لتجاوز حدود الكشف عن الكائنات في الوقت الفعلي من خلال تحسين عملية التدريب دون زيادة تكلفة الاستدلال — وهو مفهوم يُعرف باسم "bag-of-freebies".
الميزات التقنية الرئيسية:
- E-ELAN (شبكة تجميع الطبقات الفعالة الموسعة): تسمح هذه البنية للشبكة بتعلم ميزات أكثر تنوعًا من خلال التحكم في أقصر وأطول مسارات التدرج، مما يحسن التقارب.
- تحجيم النموذج: YOLOv7 طرق تحجيم مركبة تعمل على تعديل العمق والعرض في وقت واحد لمختلف قيود الموارد.
- الرأس المساعد: يستخدم مخصص تسمية موجه بالرصاص "من الخشن إلى الناعم"، حيث يساعد الرأس المساعد في الإشراف على عملية التعلم في الطبقات الأعمق.
تفاصيل YOLOv7:
- المؤلفون: تشين-ياو وانغ، أليكسي بوتشكوفسكي، وهونغ-يوان مارك لياو
- المنظمة: معهد علوم المعلومات، أكاديمية سينيكا
- التاريخ: 2022-07-06
- Arxiv: 2207.02696
- GitHub: WongKinYiu/yolov7
YOLO11: الكفاءة المحسنة والتنوع
YOLO11 على Ultralytics في إعطاء الأولوية لتجربة المطورين إلى جانب الأداء الخام. ويقدم تحسينات معمارية تقلل من الأعباء الحسابية مع الحفاظ على دقة عالية، مما يجعله سريعًا بشكل استثنائي على كل من الأجهزة الطرفية ووحدات معالجة الرسومات السحابية.
الميزات التقنية الرئيسية:
- كتلة C3k2: تطور لعنق الزجاجة CSP (Cross Stage Partial) المستخدم في الإصدارات السابقة، ويوفر استخراجًا أفضل للميزات مع عدد أقل من المعلمات.
- SPPF محسّن: تم تحسين طبقة Spatial Pyramid Pooling - Fast لالتقاط السياق متعدد المقاييس بشكل أكثر كفاءة.
- تنوع المهام: على عكس YOLOv7 الذي هو في الأساس نموذج كشف مع بعض قدرات تحديد الوضع، YOLO11 تصميم YOLO11 من الألف إلى الياء للتعامل مع تقسيم الحالات، وتقدير الوضع، والمربعات المحددة الاتجاه (OBB)، والتصنيف بشكل أصلي.
- تدريب محسّن: YOLO11 استراتيجيات متقدمة لتعزيز البيانات ووظائف خسارة محسّنة تعمل على استقرار التدريب، مما يتطلب ضبط أقل للمعلمات الفائقة من قبل المستخدم.
YOLO11 :
- المؤلفون: جلين جوشر وجينغ تشيو
- المنظمة: Ultralytics
- التاريخ: 2024-09-27
- المستندات: الوثائق الرسمية
مقارنة الأداء
عند مقارنة هذه النماذج، من الضروري النظر إلى التوازن بين السرعة (الكمون) والدقة (mAP). يوفر YOLO11 توازنًا أفضل، حيث يقدم دقة عالية مع متطلبات حسابية أقل بكثير (FLOPs) وسرعات استدلال أسرع على وحدات معالجة الرسومات الحديثة مثل NVIDIA .
أهمية الكفاءة
YOLO11 دقة مماثلة أو أفضل من النماذج القديمة مع عدد أقل من المعلمات. هذه "كفاءة المعلمات" تترجم مباشرة إلى استخدام أقل للذاكرة أثناء التدريب وتنفيذ أسرع على الأجهزة الطرفية مثل NVIDIA Orin Nano.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
كما هو موضح في الجدول، يتفوق YOLO11x على YOLOv7 من حيث الدقة (54.7٪ مقابل 53.1٪) مع الحفاظ على سرعات GPU مماثلة. والأهم من ذلك، أن المتغيرات الأصغر من YOLO11 n/s/m) توفر مزايا سرعة مذهلة للتطبيقات التي تعتمد على المعالجة في الوقت الفعلي، مثل تحليلات الفيديو.
النظام البيئي وسهولة الاستخدام
أهم عامل تمييز للمطورين هو النظام البيئي المحيط بالنموذج. وهذا هو المجال الذي تتفوق فيه Ultralytics .
ميزة Ultralytics
تم دمج YOLO11 في حزمة ultralytics Python ، توفر واجهة موحدة لدورة حياة التعلم الآلي بأكملها.
- واجهة برمجة تطبيقات بسيطة: يمكنك تحميل النموذج وتدريبه والتحقق من صحته باستخدام بضع أسطر من Python .
- نظام بيئي جيد الصيانة: توفر Ultralytics دعماً نشطاً وتحديثات متكررة وتكاملاً سلساً مع أدوات مثل Ultralytics لإدارة البيانات.
- مرونة النشر: TFLite تصدير YOLO11 ONNX أو TensorRT أو CoreML أو TFLite أمرًا واحدًا فقط. في المقابل، YOLOv7 يتطلب YOLOv7 مستودعات معقدة تابعة لجهات خارجية أو تعديلات يدوية على البرامج النصية لتنسيقات التصدير المختلفة.
مقارنة الكود:
تدريب YOLO11:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt")
# Train on COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
تدريب YOLOv7: يتطلب عادةً استنساخ المستودع، وتثبيت تبعيات محددة، وتشغيل حجج سطر أوامر طويلة:
python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'
حالات الاستخدام في العالم الحقيقي
متى تختار YOLOv7
- مقارنة الأداء القديم: إذا كنت تجري بحثًا أكاديميًا وتحتاج إلى مقارنة البنى الجديدة بمعايير 2022 المتطورة.
- تطبيقات مخصصة محددة: إذا كان لديك خط أنابيب موجود مخصص بشكل كبير حول tensor YOLOv7 المحددة ولا يمكنك تحمل تكلفة إعادة الهيكلة.
متى تختار YOLO11
- نشر الإنتاج: للتطبيقات التجارية في مجال البيع بالتجزئة أو الأمن أو التصنيع حيث تعد الموثوقية وسهولة الصيانة أمرين بالغين الأهمية.
- الحوسبة الطرفية: إن كفاءة YOLO11n و YOLO11s تجعلهما مثاليين للتشغيل على Raspberry Pi أو الأجهزة المحمولة ذات الطاقة المحدودة.
- تطبيقات متعددة المهام: إذا كان مشروعك يتطلب اكتشاف الكائنات وتقسيمها وتقدير وضعها في وقت واحد، YOLO11 ذلك بشكل أساسي.
الحد الأقصى: YOLO26
في حين أن YOLO11 خيارًا ممتازًا لمعظم التطبيقات، Ultralytics الابتكار. ويوسع YOLO26 (يناير 2026) الذي تم إصداره مؤخرًا الحدود إلى أبعد من ذلك.
- NMS من البداية إلى النهاية: تزيل YOLO26 تقنية Non-Maximum Suppression (NMS)، مما يؤدي إلى تبسيط عمليات النشر وتقليل زمن الاستجابة.
- تحسين الحافة: من خلال إزالة خسارة التركيز التوزيعي (DFL)، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعله الخيار الأفضل للذكاء الاصطناعي الحافة.
- مُحسِّن MuSGD: مستوحى من تدريب نماذج اللغات الكبيرة (LLM)، يضمن هذا المُحسِّن الهجين تقاربًا مستقرًا.
بالنسبة للمطورين الذين يبدؤون اليوم مشروعًا جديدًا عالي الأداء، يوصى بشدة باستكشاف YOLO26.
الخلاصة
YOLO11 كل من YOLOv7 YOLO11 علامتين فارقتين في تاريخ الرؤية الحاسوبية. YOLOv7 مفاهيم معمارية قوية أدت إلى تقدم هذا المجال. ومع ذلك، YOLO11 يحسن هذه الأفكار ليجعلها أكثر عملية وسرعة وسهولة في الاستخدام.
بالنسبة للغالبية العظمى من المستخدمين — من الباحثين إلى مهندسي المؤسسات — يوفرYOLO11 أو YOLO26 الأحدث) أفضل مزيج من الدقة والسرعة وتجربة المطورين، مدعومًا Ultralytics القوية.
نماذج أخرى للاستكشاف
- YOLO26: أحدث طراز NMS لتوفير السرعة والدقة القصوى.
- YOLOv10: رائد التدريب NMS للكشف في الوقت الفعلي.
- RT-DETR: كاشف قائم على محول لسيناريوهات عالية الدقة.
- SAM : نموذج Meta's Segment Anything Model للتقسيم بدون تدريب.