YOLO11 YOLOv8: مقارنة تقنية شاملة لنماذج الرؤية في الوقت الفعلي
شهد مجال الرؤية الحاسوبية تطورات ملحوظة مع التطور المستمر لهياكل الكشف عن الأشياء. عند تقييم النماذج من أجل النشر في العالم الحقيقي، غالبًا ما يقارن المطورون بين نقاط القوة في Ultralytics YOLO11 وسلفه الناجح للغاية Ultralytics YOLOv8. وقد وضع كلا النموذجين معايير صناعية للسرعة والدقة وتجربة المطورين، ولكنهما يلبيان احتياجات دورات حياة المشاريع وعتبات الأداء المختلفة قليلاً.
يقدم هذا الدليل تحليلاً متعمقاً لهيكلها ومنهجيات التدريب وحالات الاستخدام المثالية لمساعدتك في اختيار أفضل الحلول لمبادراتك في مجال الذكاء الاصطناعي.
الابتكارات المعمارية
YOLO11 الانتقال من YOLOv8 YOLO11 العديد من التحسينات المعمارية الرئيسية التي تهدف إلى تعظيم كفاءة استخراج الميزات مع تقليل الأعباء الحسابية إلى الحد الأدنى.
معمارية YOLO11
YOLO11 قفزة كبيرة إلى الأمام في تحسين استخدام المعلمات. فهو يستبدل الوحدات النمطية C2f التقليدية بكتل C3k2 المتقدمة، التي تعزز معالجة الميزات المكانية دون زيادة عدد المعلمات. بالإضافة إلى ذلك، YOLO11 وحدة C2PSA (الانتباه المكاني الجزئي عبر المراحل) ضمن هيكله الأساسي. تسمح آلية الانتباه هذه للنموذج بالتركيز على المناطق المهمة ذات الأهمية، مما يحسن بشكل كبير من اكتشاف الأجسام الصغيرة والتعامل مع حالات الحجب المعقدة.
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2024-09-27
- GitHub:Ultralytics Repository
- التوثيق:وثائق YOLO11
بنية YOLOv8
أطلق YOLOv8 قبل عام، YOLOv8 الانتقال إلى رأس كشف بدون مرساة، مما أزال الحاجة إلى ضبط مربعات المرساة يدويًا وبسط صيغة الخسارة. تعتمد بنيته بشكل كبير على كتلة C2f، وهو تصميم نجح في تحقيق التوازن بين عمق الشبكة وتدفق التدرج، مما يجعله قويًا للغاية عبر مجموعة واسعة من تطبيقات الرؤية الحاسوبية.
- المؤلفون: Glenn Jocher و Ayush Chaurasia و Jing Qiu
- المؤسسة:Ultralytics
- التاريخ: 2023-01-10
- GitHub:Ultralytics Repository
- الوثائق:YOLOv8
فلسفة التصميم
بينما YOLOv8 الأساس للكشف بدون مرساة في Ultralytics YOLO11 هذا النهج من خلال آليات الانتباه المكاني، محققًا دقة أعلى بموارد حاسوبية أقل.
الأداء والمعايير
عند نشر النماذج على أجهزة طرفية مثل Raspberry Pi أو الخوادم عالية الأداء التي تعمل بنظام NVIDIA TensorRT، فإن فهم التوازن بين السرعة والدقة أمر بالغ الأهمية. يوضح الجدول أدناه كيف يتفوق YOLO11 على YOLOv8 جميع المتغيرات الحجمية.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
تحليل المقاييس
YOLO11 متوسط دقة أعلى بشكل ملحوظ (mAP) مع تقليل عدد المعلمات وعمليات النقاط العائمة (FLOPs) في نفس الوقت. على سبيل المثال، يتطلب نموذج YOLO11m معلمات أقل بنسبة 22٪ من YOLOv8m يوفر mAP أعلى بنسبة 1.3٪ mAP COCO . علاوة على ذلك، تظهر سرعات CPU عند تصديرها إلى ONNX أن YOLO11 ، مما يجعله خيارًا ممتازًا لعمليات النشر التي تفتقر إلى GPU مخصص.
ميزة النظام البيئي لـ Ultralytics
بغض النظر عما إذا كنت تختار YOLO11 YOLOv8 فإن كلا النموذجين يستفيدان من Ultralytics الشامل، الذي يبسط بشكل كبير دورة حياة التعلم الآلي.
سهولة الاستخدام وواجهة برمجة تطبيقات بسيطة
في ultralytics توفر Python واجهة برمجة تطبيقات مبسطة تتيح للمهندسين والباحثين تدريب النماذج والتحقق من صحتها وتصديرها باستخدام بضع أسطر من التعليمات البرمجية. وهذا يزيل التعقيدات النموذجية المرتبطة بإعداد بيئات التعلم العميق في PyTorch.
كفاءة التدريب ومتطلبات الذاكرة
على عكس محولات الرؤية الثقيلة (مثل RT-DETR)، تشتهرYOLO Ultralytics YOLO باستخدامها المنخفض للذاكرة أثناء التدريب. تتيح كفاءة الذاكرة هذه للمطورين تدريب شبكات متطورة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين أو بيئات السحابة مثل Google دون مواجهة أخطاء نفاد الذاكرة.
تعدد الاستخدامات في مهام الرؤية
كل من YOLO11 وYOLOv8 هما متعلمان حقيقيان متعدد المهام. بالإضافة إلى اكتشاف الكائنات القياسي باستخدام الصناديق المحيطة، يدعمان أصلاً تجزئة الكائنات، وتصنيف الصور، وتقدير وضعية الجسم البشري، والصناديق المحيطة الموجهة (OBB) للصور الجوية.
حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLO11 و YOLOv8 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
متى تختار YOLO11
YOLO11 خيار قوي لـ:
- النشر الإنتاجي على الحافة: التطبيقات التجارية على أجهزة مثل Raspberry Pi أو NVIDIA Jetson حيث الموثوقية والصيانة النشطة أمران بالغا الأهمية.
- تطبيقات الرؤية متعددة المهام: المشاريع التي تتطلب الكشف (detect)، والـsegmentation، وتقدير الوضعية (pose estimation)، وOBB ضمن إطار عمل موحد واحد.
- النماذج الأولية والنشر السريع: الفرق التي تحتاج إلى الانتقال بسرعة من جمع البيانات إلى الإنتاج باستخدام واجهة برمجة تطبيقات Ultralytics Python المبسطة.
متى تختار YOLOv8
YOLOv8 في الحالات التالية:
- نشر متعدد المهام ومتعدد الاستخدامات: المشاريع التي تتطلب نموذجًا مثبتًا لـ الكشف، والتجزئة، والتصنيف، وتقدير الوضعيات ضمن بيئة Ultralytics.
- أنظمة إنتاج راسخة: بيئات الإنتاج الحالية المبنية بالفعل على بنية YOLOv8 مع مسارات نشر مستقرة ومختبرة جيدًا.
- دعم واسع للمجتمع والنظام البيئي: التطبيقات التي تستفيد من البرامج التعليمية الشاملة لـ YOLOv8، وعمليات التكامل مع الجهات الخارجية، وموارد المجتمع النشطة.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
- بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
- اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.
مثال برمجي: الشروع في العمل
يعد نشر وتدريب نموذج Ultralytics بديهيًا للغاية. يوضح المثال التالي كيفية تحميل نموذج YOLO11 مُدرب مسبقًا، وضبطه بدقة على مجموعة بيانات مخصصة، وتصديره للنشر على الأجهزة الطرفية باستخدام Apple CoreML:
from ultralytics import YOLO
# Initialize the YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model efficiently with optimized memory requirements
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Evaluate the validation performance
metrics = model.val()
# Run real-time inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export to CoreML for fast mobile deployment
export_path = model.export(format="coreml")
تحديثات سلسة
نظرًا لأن واجهة برمجة تطبيقات Ultralytics موحدة، فإن ترقية مسار عمل قديم من YOLOv8 إلى YOLO11 تتطلب عادةً فقط تغيير سلسلة الأوزان من "yolov8n.pt" إلى "yolo11n.pt".
التطلع إلى المستقبل: قمة الذكاء الاصطناعي الطرفي مع YOLO26
في حين أن YOLO11 بنية ناضجة وعالية الكفاءة، فإن وتيرة الابتكار في مجال الذكاء الاصطناعي مستمرة. بالنسبة للمطورين الذين يبدؤون مشاريع جديدة ويتطلبون أحدث ما توصلت إليه التكنولوجيا من حيث الأداء، فإن Ultralytics (التي تم إصدارها في يناير 2026) هي الخيار الأمثل.
يوسع YOLO26 حدود الرؤية الحاسوبية بفضل العديد من الميزات الرائدة:
- تصميم شامل خالٍ من NMS: استنادًا إلى المفاهيم التي تم استكشافها في YOLOv10، يلغي YOLO26 بشكل أصيل معالجة ما بعد التثبيط غير الأقصى (NMS)، مما يؤدي إلى زمن انتقال أقل وأكثر قابلية للتنبؤ به عبر جميع أجهزة النشر.
- سرعة استدلال على CPU أسرع بنسبة تصل إلى 43%: عن طريق إزالة فرع Distribution Focal Loss (DFL) بالكامل، تم تحسين YOLO26 خصيصًا لـ أجهزة الحوسبة الطرفية التي تفتقر إلى GPUs قوية.
- مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (LLM)، يستخدم YOLO26 مُحسِّن MuSGD هجينًا، مما يضمن تقاربًا مستقرًا وسريعًا بشكل ملحوظ في التدريب.
- ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة جدًا والمحجوبة بشدة، وهو أمر ضروري للروبوتات المستقلة والتحليلات المعتمدة على الطائرات بدون طيار.
سواء كنت تعتمد على الموثوقية المثبتة لـ YOLOv8 أو البنية المُحسّنة لـ YOLO11 أو إمكانات الجيل التالي لـ YOLO26، فإن Ultralytics تضمن لك الحصول على الأدوات اللازمة لتحويل تطبيقات الذكاء الاصطناعي الخاصة بك من مرحلة المفهوم إلى مرحلة الإنتاج بسلاسة. تأكد من استكشاف التكاملات الشاملة المتاحة لربط نماذجك بسير عمل المؤسسة ولوحات التحليلات.