Link to this sectionمقارنة بين YOLOv7 و YOLOv8#
أدى التطور السريع في الرؤية الحاسوبية إلى إنتاج مجموعة من الأدوات القوية للمطورين والباحثين. عند اتخاذ قرار بشأن البنية الصحيحة لخط أنابيب اكتشاف الكائنات، تصبح مقارنة النماذج الراسخة أمراً ضرورياً. يقدم هذا الدليل التقني نظرة متعمقة على البنيات، ومقاييس الأداء، وحالات الاستخدام المثالية لنموذجين مؤثرين للغاية: YOLOv7 و Ultralytics YOLOv8.
Link to this sectionمقدمة إلى البنيات#
يمثل كلا النموذجين قفزات كبيرة في الأداء، لكنهما يتعاملان مع تحدي تحسين الشبكات العصبية العميقة بفلسفات هيكلية مختلفة.
Link to this sectionYOLOv7: الرائد في مفهوم حقيبة الهدايا#
ركز نموذج YOLOv7، الذي تم تقديمه في منتصف عام 2022، بشكل كبير على تحسين مسار تدرج البنية ومفهوم "حقيبة الهدايا القابلة للتدريب" (trainable bag-of-freebies) لدفع حدود الكشف في الوقت الفعلي على الأجهزة المتطورة.
- المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
- المنظمة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان
- التاريخ: 2022-07-06
- Arxiv: 2207.02696
- GitHub: WongKinYiu/yolov7
- التوثيق: توثيق Ultralytics YOLOv7
أبرز ملامح البنية: يستخدم YOLOv7 بشكل أساسي رأس اكتشاف يعتمد على المرساة (على الرغم من أنه جرب فروعاً خالية من المرساة) ويقدم شبكات تجميع الطبقات الفعالة الموسعة (E-ELAN). يعمل هذا التصميم على تحسين قدرة الشبكة على التعلم دون تدمير مسار التدرج الأصلي. إنه يعمل بشكل استثنائي على وحدات معالجة الرسومات (GPUs) المخصصة للخوادم، مما يجعله مناسباً للغاية لتحليلات الفيديو الثقيلة.
نقاط القوة والضعف: بينما يحقق YOLOv7 زمن وصول ممتازاً على الأجهزة المخصصة، إلا أن نظامه البيئي مجزأ للغاية. يتطلب التدريب وسائط سطر أوامر معقدة، واستنساخاً يدوياً للمستودعات، وإدارة صارمة للتبعيات في PyTorch. علاوة على ذلك، يمكن أن تكون متطلبات الذاكرة أثناء التدريب باهظة على أجهزة المستهلكين.
Link to this sectionUltralytics YOLOv8: المعيار متعدد الاستخدامات#
تم إصدار YOLOv8 في أوائل عام 2023، وقد أعاد تعريف تجربة المطور بالكامل، مع التركيز ليس فقط على أحدث مستويات الدقة، ولكن على تقديم إطار عمل موحد وجاهز للإنتاج.
- المؤلفون: Glenn Jocher و Ayush Chaurasia و Jing Qiu
- المؤسسة: Ultralytics
- التاريخ: 2023-01-10
- GitHub: ultralytics/ultralytics
- المنصة: Ultralytics YOLOv8
أبرز ملامح البنية: قدم YOLOv8 رأس اكتشاف خالٍ من المرساة بشكل أصلي، مما يلغي الحاجة إلى تكوين صناديق المرساة يدوياً بناءً على مجموعة بيانات MS COCO أو توزيعات البيانات المخصصة. وهو يدمج وحدة C2f لتحسين تدفق التدرج ويستخدم بنية رأس مفككة تفصل مهام الكائن، والتصنيف، والانحدار. هذا يسرع التقارب ويعزز الدقة بشكل كبير.
نقاط القوة والضعف: يفتخر YOLOv8 بكفاءة استثنائية في متطلبات الذاكرة. فهو يتطلب ذاكرة CUDA أقل بكثير أثناء التدريب مقارنة بـ YOLOv7 ونماذج المحولات الأثقل، مما يسمح للمطورين باستخدام أحجام دفعات أكبر. تكمن قوته الأساسية في تعدد استخداماته، حيث يدعم أصلياً تجزئة المثيلات، وتصنيف الصور، وتقدير الوضع، وصناديق التقييد الموجهة (OBB). العيب البسيط الوحيد هو أن خطوط الأنابيب القديمة المتخصصة للغاية والمبنية حصرياً لموترات YOLOv7 قد تتطلب فترة إعادة هيكلة قصيرة.
يستفيد Ultralytics YOLOv8 من نظام بيئي مُدار جيداً. مع واجهة برمجة تطبيقات Python بديهية، وتطوير نشط، ودعم مجتمعي قوي، فإن نقل نموذج من الاختبار المحلي إلى النشر العالمي يستغرق جزءاً بسيطاً من الوقت مقارنة بالمستودعات المستقلة.
Link to this sectionمقارنة مفصلة للأداء#
يوضح الجدول التالي مقاييس الأداء عبر أحجام النماذج الرئيسية. لاحظ توازن الأداء المميز الذي يحققه YOLOv8، حيث يعمل على التحسين بشكل كبير للاستدلال السريع على أجهزة الحافة مع الحفاظ على دقة عالمية المستوى.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
ملاحظة: يحقق YOLOv8x أعلى mAP في هذه المجموعة، بينما يهيمن YOLOv8n في كفاءة المعلمات وسرعة الاستدلال، مما يجعله البطل بلا منازع لـ نشر الرؤية الحاسوبية على أجهزة الذكاء الاصطناعي الطرفية.
Link to this sectionسهولة الاستخدام وكفاءة التدريب#
عندما يتعلق الأمر بـ سهولة الاستخدام، يعمل Ultralytics YOLOv8 في دوري خاص به. تتطلب البنيات القديمة مثل YOLOv7 استنساخ مستودعات محددة وتشغيل نصوص سطر أوامر مطولة لتكوين مجموعات البيانات والمسارات.
على العكس من ذلك، توفر حزمة ultralytics الخاصة بـ YOLOv8 تجربة مطور مبسطة للغاية. يتم تعظيم كفاءة التدريب من خلال التنزيل التلقائي للبيانات، والأوزان المدربة مسبقاً الجاهزة للاستخدام، وقدرات التصدير السلسة إلى تنسيقات مثل ONNX و TensorRT.
إليك مدى سهولة التحميل والتدريب وتشغيل الاستدلال باستخدام واجهة برمجة تطبيقات Ultralytics Python:
from ultralytics import YOLO
# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")
# Train the model efficiently on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the predictions
predictions[0].show()يتكامل YOLOv8 أصلياً مع أدوات MLOps الشهيرة مثل Weights & Biases و ClearML، مما يسمح لك بمراقبة ضبط المعلمات التشعبية ومقاييس التدريب في الوقت الفعلي.
Link to this sectionحالات الاستخدام المثالية#
غالباً ما يعتمد الاختيار بين هذه البنيات على القيود المحددة لبيئة النشر الخاصة بك.
Link to this sectionمتى تختار YOLOv7#
- قياس الأداء القديم (Legacy Benchmarking): مناسب للباحثين الذين يحتاجون إلى خط أساس ثابت للمقارنة بمعايير عام 2022 الهيكلية.
- البنية التحتية الثقيلة الموجودة مسبقاً: البيئات المستثمرة بكثافة في وحدات معالجة الرسومات NVIDIA V100 أو A100 حيث تكون تكوينات الموتر المحددة لـ YOLOv7 مدمجة بعمق في خط أنابيب C++ قديم.
Link to this sectionمتى تختار YOLOv8#
- الإنتاج عبر المنصات: مثالي للفرق التي تحتاج إلى النشر بسلاسة عبر وحدات معالجة الرسومات السحابية، والأجهزة المحمولة، والمتصفحات.
- متطلبات المهام المتعددة: إذا كان مشروعك يحتاج إلى تجاوز صناديق التقييد والاستفادة من أقنعة تجزئة المثيلات الغنية أو نقاط مفاتيح الوضع.
- الحافة محدودة الموارد: يوفر YOLOv8 Nano (
yolov8n) نسب دقة إلى سرعة مذهلة للروبوتات، والطائرات بدون طيار، وأجهزة إنترنت الأشياء (IoT).
Link to this sectionنتطلع إلى المستقبل: القفزة الجيلية إلى YOLO26#
بينما يظل YOLOv8 خياراً قوياً للغاية، فإن مجال الرؤية الحاسوبية يتحرك بسرعة. بالنسبة للمطورين الذين يبدأون مشاريع جديدة تماماً وعالية الأداء، قدمت Ultralytics مؤخراً التطور التالي لنماذج الذكاء الاصطناعي. يوصى بشدة باستكشاف كل من YOLO11 المحسّن بعمق و YOLO26 الذي تم إصداره حديثاً.
تم إطلاق YOLO26 في يناير 2026، وهو يدفع حدود ما هو ممكن على أجهزة الحافة:
- تصميم من طرف إلى طرف (End-to-End) خالٍ من NMS: يعتبر YOLO26 أصلياً من طرف إلى طرف، مما يلغي تماماً المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يضمن خطوط أنابيب نشر أبسط وأسرع بكثير دون اختناقات زمن الوصول لنماذج التنبؤ الكثيفة التقليدية.
- إزالة DFL: من خلال إزالة Distribution Focal Loss، يحقق YOLO26 خيارات نشر نموذج أبسط بكثير وتوافقاً فائقاً مع الحافة.
- استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): محسن بشكل كبير للبيئات المقيدة مثل Raspberry Pi والأنظمة المدمجة، متفوقاً على جميع الأجيال السابقة في إنتاجية وحدة المعالجة المركزية.
- مُحسِّن MuSGD: مستوحى من نماذج تدريب النماذج اللغوية الكبيرة (LLM)، يدمج YOLO26 مزيجاً من SGD و Muon. وهذا يوفر استقراراً غير مسبوق في التدريب وتقارباً سريعاً للغاية.
- ProgLoss + STAL: تحقق وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو أمر بالغ الأهمية للصور الجوية، والزراعة المؤتمتة، والروبوتات.
سواء كنت تتوسع إلى مجموعات تحليلات الفيديو الضخمة باستخدام YOLOv8 أو تدفع الاستدلال إلى أجهزة الحافة الصغيرة باستخدام YOLO26 المتطور، فإن منصة Ultralytics توفر الأدوات اللازمة لإدارة دورة حياة الذكاء الاصطناعي الخاصة بك بسلاسة.