Link to this sectionYOLO11 مقابل YOLOv7#
يستمر مشهد الرؤية الحاسوبية في التطور بوتيرة سريعة، مع بقاء اكتشاف الكائنات في الوقت الفعلي في طليعة تطبيقات الذكاء الاصطناعي. يتطلب اختيار البنية المناسبة لمشروعك التعامل مع مفاضلة معقدة بين السرعة والدقة وسهولة النشر. في هذا الدليل، نقدم مقارنة تقنية شاملة بين بنيتين بارزتين: Ultralytics YOLO11 و YOLOv7.
Link to this sectionخلفية النموذج والتفاصيل التقنية#
ترك كلا النموذجين تأثيراً كبيراً على مجتمع التعلم العميق، لكنهما ينبعان من فلسفات تطوير وعصور مختلفة.
تفاصيل YOLO11: المؤلفون: Glenn Jocher و Jing Qiu المؤسسة: Ultralytics التاريخ: 2024-09-27 GitHub: https://github.com/ultralytics/ultralytics التوثيق: https://docs.ultralytics.com/models/yolo11/
تفاصيل YOLOv7: المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao المؤسسة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان التاريخ: 2022-07-06 Arxiv: https://arxiv.org/abs/2207.02696 GitHub: https://github.com/WongKinYiu/yolov7 التوثيق: https://docs.ultralytics.com/models/yolov7/
Link to this sectionالاختلافات المعمارية#
عند تحليل الآليات الداخلية، يستخدم كلا الكاشفين مفاهيم متطورة، ومع ذلك تختلف أسسهما الهيكلية.
قدمت YOLOv7 مفهوم شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN). صُممت هذه البنية لتعزيز قدرة الشبكة على التعلم باستمرار دون تدمير مسار التدرج الأصلي، وهو اختراق حاسم ورد في ورقتهم البحثية. تعتمد YOLOv7 بشكل كبير على إعادة تحديد المعلمات الهيكلية ومنهجية "حقيبة الهدايا" القوية أثناء التدريب، مما يحسن الدقة الإجمالية على مجموعة بيانات COCO دون زيادة تكاليف الاستنتاج.
في المقابل، تم بناء YOLO11 على بنية Ultralytics المحسنة للغاية. وهي تركز على خط أنابيب أكثر دقة لـ استخراج الميزات مع عدد أقل من المعلمات، مما يؤدي إلى انخفاض استهلاك الذاكرة أثناء التدريب. تحقق YOLO11 توازناً ممتازاً في الأداء، مستخدمةً موارد حوسبة أقل (FLOPs) مع مطابقة أو تجاوز دقة اكتشاف النماذج الأثقل. علاوة على ذلك، تدعم YOLO11 بشكل جوهري مجموعة متنوعة من المهام، مما يجعلها خياراً متعدد الاستخدامات لتطبيقات الرؤية الحاسوبية الحديثة.
إحدى الميزات البارزة في نماذج Ultralytics YOLO هي متطلبات الذاكرة المنخفضة أثناء التدريب مقارنة بنماذج أخرى متطورة، مما يسمح للمطورين بتدريب شبكات قوية على أجهزة PyTorch الموجهة للمستهلكين.
Link to this sectionمقارنة الأداء والمقاييس#
لقياس الجدوى في العالم الحقيقي بدقة، يعد تقييم مقاييس مثل متوسط دقة متوسط (mAP)، وسرعة الاستنتاج، ومعلمات النموذج، وتعقيد الحوسبة (FLOPs) أمراً ضرورياً. يوضح الجدول التالي كيف تقارن متغيرات توسيع YOLO11 بنماذج YOLOv7 الأكبر.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
كما لوحظ، يحقق نموذج مثل YOLO11x درجة 54.7 mAP أعلى مقارنة بـ 53.1 mAP لنموذج YOLOv7x، مع استخدام معلمات أقل بكثير (56.9 مليون مقابل 71.3 مليون). يسلط هذا الضوء على كفاءة بنية YOLO11 الفائقة.
Link to this sectionكفاءة التدريب وقابلية الاستخدام في النظام البيئي#
إحدى أكثر الخصائص تميزاً التي تفصل بين هاتين البنيتين هي تجربة المطور والنظام البيئي المحيط.
YOLOv7 هي أساساً مستودع أبحاث أكاديمي. غالباً ما يتطلب تدريب النماذج إعدادات بيئة معقدة، وإدارة يدوية للتبعيات، واستخدام وسائط سطر أوامر طويلة. وبينما تدعم التجارب المتطورة، فإن تكييف كود مستودع YOLOv7 GitHub لبيئات الإنتاج المخصصة يمكن أن يستغرق وقتاً طويلاً.
تعيد YOLO11 تعريف سهولة الاستخدام بالكامل. فهي مدمجة بالكامل في منصة Ultralytics، وهي نظام بيئي شامل ومصان جيداً يقدم تدفقات عمل سلسة من البداية إلى النهاية. من تعليق البيانات والتدريب المحلي إلى النشر، تعمل واجهة برمجة تطبيقات Python الموحدة وواجهة سطر الأوامر البسيطة على تبسيط العملية برمتها.
Link to this sectionمقارنة الكود#
يتطلب تدريب نموذج اكتشاف الكائنات باستخدام YOLO11 بضعة أسطر فقط من الكود، مما يقلل بشكل كبير من حاجز الدخول:
from ultralytics import YOLO
# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model effortlessly using the unified API
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Quickly export to ONNX format
model.export(format="onnx")في المقابل، يبدو أمر تدريب YOLOv7 المعتاد كما يلي، ويتطلب إعداداً دقيقاً للمسارات وملفات التكوين وscripts باش:
python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'توفر YOLO11 أيضاً تنوعاً هائلاً. بينما تتطلب YOLOv7 قواعد كود مختلفة تماماً أو تعديلات ثقيلة لدعم مهام تتجاوز الاكتشاف (مثل الوضع أو التجزئة)، تعالج YOLO11 اكتشاف الكائنات، و تجزئة المثيلات، و تصنيف الصور، و تقدير الوضع، و صندوق التحديد الموجه (OBB) من خلال إطار عمل واحد متماسك.
Link to this sectionتطبيقات العالم الحقيقي وحالات الاستخدام المثالية#
يعتمد الاختيار بين YOLOv7 و YOLO11 كلياً على نطاق المشروع وقيود النشر.
متى تفكر في YOLOv7:
- قياس أداء النماذج القديمة: قد يستخدم الباحثون الأكاديميون الذين يستكشفون تصميمات مسار التدرج YOLOv7 كخط أساس لتقييم الشبكات العصبية التلافيفية الأحدث.
- خطوط الأنابيب المخصصة الحالية: الفرق التي لديها خطوط أنابيب C++ أو CUDA مخصصة للغاية مبنية خصيصاً حول منطق فك تشفير صندوق التحديد الفريد لـ YOLOv7.
متى تختار YOLO11:
- الإنتاج التجاري: تستفيد التطبيقات في تجار التجزئة الذكية أو تشخيص الرعاية الصحية كثيراً من قاعدة كود YOLO11 المصانة والاستقرار العالي.
- البيئات ذات الموارد المحدودة: البصمة الخفيفة لـ YOLO11n تجعلها مناسبة بشكل استثنائي للنشر على الأجهزة المحمولة وأجهزة الحافة عبر ONNX.
- مشاريع المهام المتعددة: إذا كان تطبيق واحد يحتاج إلى تحديد شخص، ورسم هيكله العظمي (الوضع)، وتجزئة كائن يحمله، توفر YOLO11 حلاً موحداً.
Link to this sectionالطليعة: المضي قدماً مع YOLO26#
بينما تعد YOLO11 خياراً قوياً للغاية، فإن الابتكار في الذكاء الاصطناعي لا يتوقف أبداً. للمهندسين الذين يبدأون مشاريع جديدة اليوم، يوصى بشدة باستكشاف Ultralytics YOLO26.
تم إصدار YOLO26 في يناير 2026، وهي تقدم تصميماً خالياً من NMS من البداية إلى النهاية، مما يلغي تماماً اختناقات زمن الوصول المرتبطة بمعالجة Non-Maximum Suppression. علاوة على ذلك، تدمج YOLO26 مُحسِّن MuSGD الثوري، المستوحى من منهجيات تدريب LLM، لضمان تقارب أسرع. مع تحسينات الخسارة المستهدفة عبر ProgLoss + STAL وسرعة استنتاج وحدة المعالجة المركزية أسرع بنسبة تصل إلى 43% بسبب إزالة DFL، تم تحسين YOLO26 خصيصاً لحوسبة الحافة وتمثل قمة الذكاء الاصطناعي للرؤية حالياً.
للمستخدمين المهتمين بهياكل بديلة متخصصة، قد يؤدي استكشاف RT-DETR القائم على Transformer أو نماذج YOLO-World الديناميكية مفتوحة المفردات إلى نتائج مفيدة لنشر الرؤية الحاسوبية المتنوعة.