Ultralytics YOLOv8 YOLO11: تطور الهندسة المعمارية وتحليل الأداء
تطورت بنى الكشف عن الأجسام بسرعة كبيرة، حيث حققت كل نسخة تحسينات كبيرة في الدقة والسرعة وسهولة الاستخدام. Ultralytics YOLOv8، الذي تم إصداره في أوائل عام 2023، معيارًا جديدًا للتنوع وسهولة الاستخدام في الرؤية الحاسوبية. في أواخر عام 2024، Ultralytics YOLO11 ، مما أدى إلى تحسين البنية لتحقيق كفاءة وأداء أكبر في مجموعة واسعة من المهام.
يقارن هذا الدليل الشامل هذين النموذجين القويين، ويحلل الاختلافات المعمارية بينهما ومقاييس الأداء وحالات الاستخدام المثالية لمساعدتك في اختيار الأداة المناسبة لمشروع الرؤية الحاسوبية التالي.
نظرة عامة على النموذج
قبل الخوض في المواصفات الفنية، من الضروري فهم السياق والأهداف الكامنة وراء تطوير كل نموذج. وكلاهما نتاج التزام Ultralytics بإنشاء تقنية ذكاء اصطناعي متطورة وسهلة الاستخدام.
Ultralytics YOLOv8
صدر YOLOv8 في يناير 2023، YOLOv8 علامة فارقة مهمة من خلال توحيد مهام متعددة — الكشف والتجزئة والتصنيف وتقدير الوضع و OBB — تحت واجهة برمجة تطبيقات واحدة سهلة الاستخدام. وقد أدخل نظامًا أساسيًا جديدًا ورأس كشف بدون مرساة، مما يجعله متعدد الاستخدامات للغاية لتطبيقات متنوعة.
التفاصيل الرئيسية:
- المؤلفون: Glenn Jocher و Ayush Chaurasia و Jing Qiu
- المؤسسة:Ultralytics
- التاريخ: 10 يناير 2023
- الوثائق:وثائق YOLOv8
- GitHub:Ultralytics Repository
Ultralytics YOLO11
تم إطلاق YOLO11 في سبتمبر 2024، YOLO11 على الأساس المتين لـ YOLOv8. ويركز على تحسينات معمارية لتعزيز كفاءة استخراج الميزات وسرعة المعالجة. YOLO11 تصميم YOLO11 لتوفير دقة أعلى مع عدد أقل من المعلمات، مما يجعله فعالاً بشكل خاص للتطبيقات المتطورة في الوقت الفعلي.
التفاصيل الرئيسية:
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 27 سبتمبر 2024
- المستندات:توثيق YOLO11
- GitHub:Ultralytics Repository
أحدث الابتكارات: YOLO26
بينما YOLO11 قفزة كبيرة مقارنة بـ YOLOv8، يجب على المطورين الباحثين عن أحدث التقنيات استكشاف YOLO26. تم إصداره في عام 2026، ويقدم تصميمًا شاملاً NMS، ومحسّن MuSGD، CPU أسرع بنسبة تصل إلى 43٪، مما يضع معيارًا جديدًا للذكاء الاصطناعي على مستوى الإنتاج.
الاختلافات المعمارية
YOLO11 الانتقال من YOLOv8 YOLO11 عدة تغييرات هندسية رئيسية تهدف إلى تحسين التوازن بين التكلفة الحسابية والدقة.
العمود الفقري واستخراج الميزات
YOLOv8 هيكل CSPDarknet53 معدل مع وحدات C2f، التي حلت محل وحدات C3 من الأجيال السابقة. أدى هذا التصميم إلى تحسين تدفق التدرج وغنى الميزات.
YOLO11 هذا الأمر بشكل أكبر من خلال تحسين هياكل الاختناقات وآليات الانتباه داخل الهيكل الأساسي. تسمح هذه التغييرات للنموذج بالتقاط أنماط أكثر تعقيدًا وتسلسلات هرمية مكانية مع تقليل الأعباء الحسابية. وهذا مفيد بشكل خاص للمهام الصعبة مثل اكتشاف الأجسام الصغيرة في الصور الجوية أو مراقبة جودة التصنيع.
رئيس قسم الهندسة المعمارية
يستخدم كلا النموذجين رؤوسًا خالية من المثبتات، مما يبسط عملية التدريب ويحسن التعميم عبر أشكال الكائنات المختلفة. ومع ذلك، YOLO11 تقنيات دمج ميزات أكثر تقدمًا في الرقبة والرأس، مما يؤدي إلى دقة تحديد الموقع وفصل الفئات بشكل أفضل مقارنةً بـ YOLOv8.
تحليل الأداء
عند اختيار نموذج للإنتاج، تعتبر المقاييس مثل متوسط الدقة (mAP) وسرعة الاستدلال وحجم النموذج عوامل حاسمة. يقدم الجدول أدناه مقارنة مفصلة للأوزان المدربة مسبقًا على COCO .
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
أهم النقاط المتعلقة بالأداء
- الكفاءة: تتميز YOLO11 بأنها أخف وزناً (معلمات أقل) وأسرع (زمن انتقال أقل) من YOLOv8 مع تحقيق دقة أعلى. على سبيل المثال، YOLO11n أسرع بنسبة 22٪ تقريباً فيONNX CPU ONNX من YOLOv8n تحقيق mAP أعلى.
- الحوسبة: YOLO11 انخفاض عدد عمليات FLOPs في YOLO11 خيارًا ممتازًا للأجهزة التي تعمل بالبطارية أو ذات الموارد المحدودة، مثل الهواتف المحمولة أو أجهزة استشعار إنترنت الأشياء المدمجة.
- الدقة: تعتبر mAP في YOLO11 لا سيما في النماذج الأصغر حجماً (Nano و Small)، مهمة للتطبيقات التي تتطلب موثوقية عالية دون الحاجة إلى أجهزة ثقيلة.
التدريب وسهولة الاستخدام
تتمثل إحدى نقاط القوة المميزة Ultralytics في تجربة المستخدم الموحدة والمبسطة. YOLO11 كل YOLOv8 YOLO11 نفس واجهة برمجة التطبيقات البديهية، مما يتيح للمطورين التبديل بين البنى الهندسية بتغيير سطر واحد من التعليمات البرمجية.
ميزة Ultralytics
على عكس نماذج المحولات المعقدة التي تتطلب غالبًا كميات هائلة من GPU وتكوينًا معقدًا، تم تحسين Ultralytics من أجل كفاءة التدريب. يمكن تدريبها بفعالية على وحدات GPU الاستهلاكية، مما يتيح الوصول إلى الذكاء الاصطناعي عالي الأداء للجميع.
تشمل الميزات المشتركة بين كلا الطرازين ما يلي:
- Python بسيطة: قم بتحميل النماذج وتدريبها ونشرها في دقائق.
- وثائق شاملة: أدلة شاملة حول ضبط المعلمات الفائقة، وزيادة البيانات، والنشر.
- تكامل النظام البيئي: توافق تام مع Ultralytics لإدارة مجموعات البيانات والتدريب عن بُعد وتصدير النماذج بنقرة واحدة.
مثال تدريبي:
يوضح الكود التالي مدى سهولة التبديل بين تدريب YOLOv8 YOLO11.
from ultralytics import YOLO
# Load a YOLOv8 model
model_v8 = YOLO("yolov8n.pt")
# Train YOLOv8
model_v8.train(data="coco8.yaml", epochs=100, imgsz=640)
# Load a YOLO11 model - Same API!
model_11 = YOLO("yolo11n.pt")
# Train YOLO11
model_11.train(data="coco8.yaml", epochs=100, imgsz=640)
حالات الاستخدام المثالية
على الرغم من أن كلا النموذجين يتمتعان بقدرات عالية، إلا أن نقاط قوتهما المحددة تجعلهما مناسبين لسيناريوهات مختلفة.
متى تختار YOLOv8
YOLOv8 خيارًا قويًا وموثوقًا، خاصةً في الحالات التالية:
- المشاريع القديمة: خطوط الأنابيب الحالية التي تم تحسينها بالفعل لـ YOLOv8 تتطلب الاستقرار دون الحاجة الفورية إلى تحديثات معمارية.
- موارد مجتمعية واسعة النطاق: نظرًا لوجوده في السوق منذ فترة طويلة، YOLOv8 بمكتبة واسعة من البرامج التعليمية ومقاطع الفيديو والتطبيقات المجتمعية من جهات خارجية.
- رؤية للأغراض العامة: ممتازة لمهام الكشف عن الأجسام القياسية حيث لا يمثل تحسين الحواف القصوى القيد الأساسي.
متى تختار YOLO11
YOLO11 الخيار الموصى به لمعظم عمليات النشر الجديدة، خاصةً في الحالات التالية:
- الحوسبة الطرفية: عدد معلماتها الأقل وسرعة استنتاجها الأعلى تجعلها مثالية لاستخدامات Raspberry Pi و Jetson Nano والأجهزة المحمولة.
- التطبيقات في الوقت الفعلي: ضرورية لمهام مثل القيادة الذاتية أو خطوط الإنتاج عالية السرعة حيث كل مللي ثانية من زمن الاستجابة مهمة.
- المهام المعقدة: تعمل التحسينات المعمارية على تحسين الأداء في السيناريوهات الصعبة، مثل تقدير الوضع لتحليلات الرياضة أو تقسيم الحالات للتصوير الطبي.
تعدد الاستخدامات عبر المهام
YOLO11 كل من YOLOv8 YOLO11 مجموعة واسعة من المهام التي تتجاوز الكشف البسيط عن المربعات المحيطة، بما في ذلك تقسيم الحالات، وتقدير الوضع، والمربعات المحيطة الموجهة (OBB)، والتصنيف. تتيح هذه المرونة للمطورين حل مشكلات متعددة الأوجه باستخدام إطار عمل واحد.
الخلاصة
YOLO11 كل من YOLOv8 YOLO11 قمة الكفاءة في مجال الرؤية الحاسوبية. YOLOv8 وضع معيارًا متعدد الاستخدامات وسهل الاستخدام دعم عدد لا يحصى من تطبيقات الذكاء الاصطناعي على مستوى العالم. YOLO11 يحسن هذا الإرث، ويقدم بنية مبسطة وأسرع وأكثر دقة تدفع حدود ما هو ممكن على الأجهزة المتطورة.
بالنسبة للمطورين الذين يبدؤون مشاريع جديدة اليوم، YOLO11 توازنًا فائقًا بين السرعة والدقة. ومع ذلك، بالنسبة لأولئك الذين يطلبون أحدث الابتكارات على الإطلاق، مثل الكشف الشامل NMS ووظائف الخسارة المحسّنة، نوصي بشدة باستكشاف الإصدار الجديد YOLO26، الذي يمثل مستقبل الذكاء الاصطناعي للرؤية في الوقت الفعلي.
مزيد من القراءة
- شرح مقاييس YOLO
- دليل تصدير النماذج (ONNX، TensorRT، CoreML)
- Ultralytics : تدريب ونشر دون عناء
- تطبيقات الذكاء الاصطناعي في العالم الواقعي
نماذج أخرى للاستكشاف
- YOLO26: أحدث نموذج متطور من Ultralytics يناير 2026) يتميز بتصميم NMS.
- RT-DETR: كاشف يعتمد على المحولات (Transformer) يوفر دقة عالية للسيناريوهات التي تكون فيها السرعة أقل أهمية.
- SAM 2: نموذج Segment Anything من Meta، مثالي لمهام التجزئة بدون تدريب مسبق (zero-shot segmentation).