YOLOv8 YOLOv7: تطور البنية وتحليل الأداء

في مجال الرؤية الحاسوبية سريع التطور، وضعت مجموعة نماذج "You Only Look Once" (YOLO) معيارًا ثابتًا للكشف عن الأجسام في الوقت الفعلي. تستكشف هذه المقارنة الفروق الفنية بين Ultralytics YOLOv8 و YOLOv7. ورغم أن كلا النموذجين يمثلان معلمتين هامتين في تاريخ الذكاء الاصطناعي، إلا أنهما يلبيان احتياجات مراحل مختلفة من التطوير والنشر.

بالنسبة للمطورين الذين يبحثون عن تجربة أكثر سلاسة، يوفر Ultralytics بيئة عمل موحدة. ومع ذلك، فإن فهم التحول المعماري من نهج YOLOv7 القائم على التسلسل إلى تصميم YOLOv8 الخالي من المراسي أمر بالغ الأهمية لاختيار الأداة المناسبة لمهام الرؤية الحاسوبية الخاصة بك.

مقارنة مقاييس الأداء

يوضح الجدول التالي المفاضلات في الأداء. YOLOv8 يوفر بشكل عام توازنًا فائقًا بين السرعة والدقة، لا سيما عند النظر إلى كفاءة Ultralytics للتدريب والنشر.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

Ultralytics YOLOv8: المعيار الحديث

YOLOv8 تحولًا محوريًا في YOLO من خلال اعتماد رأس كشف بدون مرساة وبنية منفصلة. يبسط هذا الاختيار التصميمي عملية التدريب من خلال إزالة الحاجة إلى الحساب اليدوي لمربع المرساة، مما يجعل النموذج أكثر قوة عبر مجموعات البيانات المتنوعة.

تفاصيل YOLOv8:

المؤلفون: Glenn Jocher و Ayush Chaurasia و Jing Qiu
المؤسسة:Ultralytics
التاريخ: 2023-01-10
GitHub:Ultralytics Repository

الهيكلة والابتكار

YOLOv8 وحدة C2f (عنق الزجاجة الجزئي عبر المراحل مع اثنين من التلافيف)، والتي تحل محل وحدة C3 المستخدمة في الإصدارات السابقة. تعمل وحدة C2f على تحسين تدفق التدرج وتسمح للنموذج بتعلم تمثيلات أكثر تعقيدًا للميزات مع الحفاظ على خصائصه الخفيفة.

YOLOv8 إحدى نقاط القوة الرئيسية لـ YOLOv8 تنوعها الأصلي. على عكس المستودعات القديمة التي كانت تتطلب فروعًا منفصلة لمهام مختلفة، YOLOv8 اكتشاف الكائنات وتجزئة الحالات وتقدير الوضع والتصنيف والمربعات المحددة الاتجاه (OBB) ضمن إطار عمل واحد.

تعرف على المزيد حول YOLOv8

YOLOv7: معلم بارز في مجال البحث

صدر YOLOv7 في منتصف عام 2022، YOLOv7 بشكل كبير على تحسين البنية من خلال "Trainable bag-of-freebies". وقد دفع حدود ما كان ممكنًا في ذلك الوقت باستخدام أجهزة الكشف القائمة على المراسي.

تفاصيل YOLOv7:

المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2022-07-06
Arxiv:YOLOv7: Trainable bag-of-freebies sets new state-of-the-art
GitHub:WongKinYiu/yolov7

النهج المعماري

YOLOv7 بنية E-ELAN (شبكة تجميع الطبقات الفعالة الموسعة). يركز هذا التصميم على التحكم في أقصر وأطول مسارات التدرج للسماح للشبكة بالتعلم بشكل أكثر فعالية. على الرغم من دقتها العالية، إلا أن البنية معقدة وتعتمد على مربعات الربط، والتي قد تتطلب ضبطًا محددًا للحصول على الأداء الأمثل على البيانات المخصصة.

تعرف على المزيد حول YOLOv7

المقارنة التقنية وحالات الاستخدام

1. سهولة الاستخدام والنظام البيئي

أهم عامل تمييز هو النظام البيئي. YOLOv8 يتم توزيعه عبر ultralytics حزمة pip، التي توفر تجربة "من الصفر إلى القمة". يمكن للمطورين الوصول إلى نماذج مدربة مسبقًا وابدأ التدريب في غضون دقائق.

في المقابل، YOLOv7 في المقام الأول مستودع للأبحاث. على الرغم من قوته، إلا أنه يفتقر إلى واجهة برمجة التطبيقات القياسية، والتكامل السلس مع أدوات مثل TensorBoard، والوثائق الشاملة التي Ultralytics .

2. كفاءة التدريب والذاكرة

تشتهر Ultralytics بكفاءتها في التدريب. YOLOv8 استخدام CUDA مما يتيح في كثير من الأحيان أحجام دفعات أكبر مقارنة بالنماذج القائمة على Transformer أو YOLOv7 الأقدم. وتُترجم هذه الكفاءة إلى انخفاض تكاليف الحوسبة السحابية وزيادة سرعة أوقات التكرار.

التصدير المتكامل

أحد أكبر الصعوبات في النشر هو تحويل النماذج. YOLOv8 هذه العملية من خلال أمر من سطر واحد للتصدير إلى ONNXو TensorRTو CoreML و TFLite، مما يضمن تشغيل نموذجك على أي جهاز طرفي.

3. حالات الاستخدام المثالية

اختر YOLOv8 إذا كنت بحاجة إلى حل جاهز للإنتاج وسهل الصيانة ويدعم مهام الرؤية الحاسوبية المتعددة (مثل التتبع والتجزئة) ويسهل نشره على الأجهزة الطرفية مثل Raspberry Pi.
اختر YOLOv7 إذا كنت تجري بحثًا أكاديميًا يقارن بشكل خاص بين البنى القديمة القائمة على المراسي أو تحتاج إلى إعادة إنتاج نتائج معايير 2022.

المستقبل: YOLO26

على الرغم من أن YOLOv8 YOLOv7 نموذجان YOLOv7 هذا المجال يتطور بسرعة. أصدرت Ultralytics YOLO26، وهو النموذج الموصى به لجميع المشاريع الجديدة.

يقدم YOLO26 تصميمًا شاملاً NMS ، مما يلغي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression. وينتج عن ذلك خطوط أنابيب نشر أبسط بكثير ووقت استجابة أقل. علاوة على ذلك، يزيل YOLO26 Distribution Focal Loss (DFL) ويستخدم MuSGD Optimizer—وهومزيج من SGD Muon مستوحى من تدريب LLM—لتحقيق تدريب مستقر وتقارب أسرع.

بفضل ProgLoss و STAL (Soft-Target Anchor Loss)، يوفر YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعله الخيار الأمثل للحوسبة المتطورة والتحليلات في الوقت الفعلي.

تعرف على المزيد حول YOLO26

أمثلة برمجية

توحد Ultralytics سير العمل. يمكنك تدريب YOLOv8 المتطور أو حتى تحميل التكوينات القديمة باستخدام الحد الأدنى من التعليمات البرمجية.

from ultralytics import YOLO

# Load the recommended model (YOLO26 or YOLOv8)
model = YOLO("yolov8n.pt")

# Train the model on the COCO8 dataset
# The unified API handles data augmentation and memory management automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for deployment
model.export(format="onnx")

بالنسبة للباحثين المهتمين بالبنى الأخرى، تغطي Ultralytics أيضًا YOLOv5و YOLOv9و YOLO11، مما يضمن حصولك على أفضل الأدوات لكل سيناريو.