تخطي إلى المحتوى

YOLO11 YOLOv8: مقارنة تقنية شاملة لنماذج الرؤية في الوقت الفعلي

شهد مجال الرؤية الحاسوبية تطورات ملحوظة مع التطور المستمر لهياكل الكشف عن الأشياء. عند تقييم النماذج من أجل النشر في العالم الحقيقي، غالبًا ما يقارن المطورون بين نقاط القوة في Ultralytics YOLO11 وسلفه الناجح للغاية Ultralytics YOLOv8. وقد وضع كلا النموذجين معايير صناعية للسرعة والدقة وتجربة المطورين، ولكنهما يلبيان احتياجات دورات حياة المشاريع وعتبات الأداء المختلفة قليلاً.

يقدم هذا الدليل تحليلاً متعمقاً لهيكلها ومنهجيات التدريب وحالات الاستخدام المثالية لمساعدتك في اختيار أفضل الحلول لمبادراتك في مجال الذكاء الاصطناعي.

الابتكارات المعمارية

YOLO11 الانتقال من YOLOv8 YOLO11 العديد من التحسينات المعمارية الرئيسية التي تهدف إلى تعظيم كفاءة استخراج الميزات مع تقليل الأعباء الحسابية إلى الحد الأدنى.

معمارية YOLO11

YOLO11 قفزة كبيرة إلى الأمام في تحسين استخدام المعلمات. فهو يستبدل الوحدات النمطية C2f التقليدية بكتل C3k2 المتقدمة، التي تعزز معالجة الميزات المكانية دون زيادة عدد المعلمات. بالإضافة إلى ذلك، YOLO11 وحدة C2PSA (الانتباه المكاني الجزئي عبر المراحل) ضمن هيكله الأساسي. تسمح آلية الانتباه هذه للنموذج بالتركيز على المناطق المهمة ذات الأهمية، مما يحسن بشكل كبير من اكتشاف الأجسام الصغيرة والتعامل مع حالات الحجب المعقدة.

تعرف على المزيد حول YOLO11

بنية YOLOv8

أطلق YOLOv8 قبل عام، YOLOv8 الانتقال إلى رأس كشف بدون مرساة، مما أزال الحاجة إلى ضبط مربعات المرساة يدويًا وبسط صيغة الخسارة. تعتمد بنيته بشكل كبير على كتلة C2f، وهو تصميم نجح في تحقيق التوازن بين عمق الشبكة وتدفق التدرج، مما يجعله قويًا للغاية عبر مجموعة واسعة من تطبيقات الرؤية الحاسوبية.

تعرف على المزيد حول YOLOv8

فلسفة التصميم

بينما YOLOv8 الأساس للكشف بدون مرساة في Ultralytics YOLO11 هذا النهج من خلال آليات الانتباه المكاني، محققًا دقة أعلى بموارد حاسوبية أقل.

الأداء والمعايير

عند نشر النماذج على أجهزة طرفية مثل Raspberry Pi أو الخوادم عالية الأداء التي تعمل بنظام NVIDIA TensorRT، فإن فهم التوازن بين السرعة والدقة أمر بالغ الأهمية. يوضح الجدول أدناه كيف يتفوق YOLO11 على YOLOv8 جميع المتغيرات الحجمية.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

تحليل المقاييس

YOLO11 متوسط دقة أعلى بشكل ملحوظ (mAP) مع تقليل عدد المعلمات وعمليات النقاط العائمة (FLOPs) في نفس الوقت. على سبيل المثال، يتطلب نموذج YOLO11m معلمات أقل بنسبة 22٪ من YOLOv8m يوفر mAP أعلى بنسبة 1.3٪ mAP COCO . علاوة على ذلك، تظهر سرعات CPU عند تصديرها إلى ONNX أن YOLO11 ، مما يجعله خيارًا ممتازًا لعمليات النشر التي تفتقر إلى GPU مخصص.

ميزة النظام البيئي لـ Ultralytics

بغض النظر عما إذا كنت تختار YOLO11 YOLOv8 فإن كلا النموذجين يستفيدان من Ultralytics الشامل، الذي يبسط بشكل كبير دورة حياة التعلم الآلي.

سهولة الاستخدام وواجهة برمجة تطبيقات بسيطة

في ultralytics توفر Python واجهة برمجة تطبيقات مبسطة تتيح للمهندسين والباحثين تدريب النماذج والتحقق من صحتها وتصديرها باستخدام بضع أسطر من التعليمات البرمجية. وهذا يزيل التعقيدات النموذجية المرتبطة بإعداد بيئات التعلم العميق في PyTorch.

كفاءة التدريب ومتطلبات الذاكرة

على عكس محولات الرؤية الثقيلة (مثل RT-DETR)، تشتهرYOLO Ultralytics YOLO باستخدامها المنخفض للذاكرة أثناء التدريب. تتيح كفاءة الذاكرة هذه للمطورين تدريب شبكات متطورة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين أو بيئات السحابة مثل Google دون مواجهة أخطاء نفاد الذاكرة.

تعدد الاستخدامات في مهام الرؤية

YOLOv8 كل من YOLO11 YOLOv8 برامج التعلم متعددة المهام الحقيقية. وبالإضافة إلى الكشف القياسي عن الكائنات داخل المربعات المحددة، فإنهما يدعمان بشكل أساسي تقسيم المثيلات وتصنيف الصور وتقدير وضعية الإنسان والمربعات المحددة الموجهة (OBB) للصور الجوية.

حالات الاستخدام والتوصيات

YOLOv8 الاختيار بين YOLO11 YOLOv8 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار YOLO11

YOLO11 خيار قوي لـ:

  • نشر حافة الإنتاج: التطبيقات التجارية على أجهزة مثل Raspberry Pi أو NVIDIA حيث الموثوقية والصيانة النشطة أمران بالغا الأهمية.
  • تطبيقات الرؤية متعددة المهام: المشاريع التي تتطلب الكشف والتجزئة وتقدير الوضع و OBB ضمن إطار موحد واحد.
  • النماذج الأولية السريعة والنشر: الفرق التي تحتاج إلى الانتقال بسرعة من جمع البيانات إلى الإنتاج باستخدام Python Ultralytics Python المبسطة.

متى تختار YOLOv8

YOLOv8 في الحالات التالية:

  • نشر متعدد المهام متعدد الاستخدامات: المشاريع التي تتطلب نموذجًا مثبتًا للكشف والتجزئة والتصنيف وتقدير الوضع داخل نظام Ultralytics .
  • أنظمة الإنتاج الراسخة: بيئات الإنتاج الحالية المبنية بالفعل على YOLOv8 مع خطوط إنتاج مستقرة ومختبرة جيدًا.
  • دعم واسع من المجتمع والنظام البيئي: تطبيقات تستفيد من البرامج التعليمية الشاملة YOLOv8OLOv8، وعمليات الدمج مع أطراف ثالثة، وموارد المجتمع النشطة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

مثال على الكود: البدء

يعد نشر Ultralytics وتدريبه أمرًا بديهيًا للغاية. يوضح المثال التالي كيفية تحميل YOLO11 المدرب مسبقًا، وضبطه على مجموعة بيانات مخصصة، وتصديره للنشر المتطور باستخدام Apple CoreML:

from ultralytics import YOLO

# Initialize the YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model efficiently with optimized memory requirements
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Evaluate the validation performance
metrics = model.val()

# Run real-time inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to CoreML for fast mobile deployment
export_path = model.export(format="coreml")

تحديثات سلسة

نظرًا لأن Ultralytics موحدة، فإن ترقية خط أنابيب قديم من YOLOv8 YOLO11 تتطلب YOLO11 تغيير سلسلة الأوزان من "yolov8n.pt" إلى "yolo11n.pt".

التطلع إلى المستقبل: قمة الذكاء الاصطناعي الطرفي مع YOLO26

في حين أن YOLO11 بنية ناضجة وعالية الكفاءة، فإن وتيرة الابتكار في مجال الذكاء الاصطناعي مستمرة. بالنسبة للمطورين الذين يبدؤون مشاريع جديدة ويتطلبون أحدث ما توصلت إليه التكنولوجيا من حيث الأداء، فإن Ultralytics (التي تم إصدارها في يناير 2026) هي الخيار الأمثل.

يوسع YOLO26 حدود الرؤية الحاسوبية بفضل العديد من الميزات الرائدة:

  • تصميم شامل NMS: بناءً على المفاهيم التي تم استكشافها في YOLOv10، يزيل YOLO26 بشكل أساسي المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، مما يؤدي إلى زمن انتقال أقل وأكثر قابلية للتنبؤ عبر جميع أجهزة النشر.
  • CPU أسرع بنسبة تصل إلى 43٪ CPU : من خلال إزالة فرع Distribution Focal Loss (DFL) تمامًا، تم تحسين YOLO26 خصيصًا لأجهزة الحوسبة الطرفية التي تفتقر إلى وحدات معالجة رسومات قوية.
  • مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (LLM)، يستخدم YOLO26 مُحسِّن MuSGD هجينًا، مما يضمن تقاربًا تدريبيًا سريعًا ومستقرًا بشكل ملحوظ.
  • ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة والمحجوبة بشدة، وهو أمر ضروري للروبوتات المستقلة والتحليلات القائمة على الطائرات بدون طيار.

سواء كنت تعتمد على الموثوقية المثبتة لـ YOLOv8 أو البنية المُحسّنة لـ YOLO11 أو إمكانات الجيل التالي لـ YOLO26، فإن Ultralytics تضمن لك الحصول على الأدوات اللازمة لتحويل تطبيقات الذكاء الاصطناعي الخاصة بك من مرحلة المفهوم إلى مرحلة الإنتاج بسلاسة. تأكد من استكشاف التكاملات الشاملة المتاحة لربط نماذجك بسير عمل المؤسسة ولوحات التحليلات.


تعليقات