تخطي إلى المحتوى

YOLOv8 YOLO: مقارنة تقنية شاملة لنماذج الكشف عن الكائنات

يتطور مجال الرؤية الحاسوبية باستمرار، حيث توسع البنى الجديدة حدود الإمكانيات المتاحة على الأجهزة الطرفية ومجموعات السحابة الضخمة. في هذا التحليل التقني المتعمق، نقارن بين نموذجين بارزين للكشف عن الكائنات في الوقت الفعلي: YOLOv8 و YOLO. من خلال دراسة هندستهما ومقاييس أدائهما ومنهجيات تدريبهما، يمكن لمهندسي التعلم الآلي اتخاذ قرارات مستنيرة بشأن خطوط إنتاجهما.

خلفيات وأصول النماذج

تم طرح كلا النموذجين في نفس الوقت تقريبًا، ولكنهما ينبعان من فلسفات تصميم وأهداف بحثية مختلفة.

تفاصيل YOLOv8

تعرف على المزيد حول YOLOv8

YOLO

تعرف على المزيد حول DAMO-YOLO

الابتكارات المعمارية

YOLOv8: تصميم متعدد الاستخدامات بدون مرساة

Ultralytics YOLOv8 أدخلت تحسينات كبيرة على سابقاتها، مما عزز مكانتها كنموذج متطور وموثوق للغاية. تتميز برأس كشف بدون مرساة، مما يقلل من عدد تنبؤات الصندوق ويسرع الاستدلال. تستخدم البنية رأسًا منفصلًا، يفصل بين مهام الكائنات والتصنيف والانحدار، مما يؤدي إلى تنبؤات أكثر دقة للصندوق المحيط.

علاوة على ذلك، YOLOv8 خسارة التركيز التوزيعي (DFL) جنبًا إلى جنب مع CIoU مما يعزز قدرة النموذج على تحديد حدود الكائنات بدقة، خاصة بالنسبة للأهداف الأصغر حجمًا أو المحجوبة. تم تحسين هيكله الأساسي بشكل كبير CPU كل من GPU CPU .

YOLO نهجًا مختلفًا، حيث يعتمد بشكل كبير على البحث عن البنية العصبية (NAS) لتصميم هيكله الأساسي تلقائيًا. قدم فريق Alibaba "MAE-NAS" للعثور على الهياكل التي توفر التوازن الأمثل بين زمن الاستجابة والدقة، خاصة في ظل TensorRT .

يشتمل النموذج على شبكة RepGFPN (شبكة هرمية عامة معاد تقييم معلماتها) من أجل دمج المعلمات بكفاءة وتصميم "ZeroHead" لتقليل العبء الحسابي لرأس الكشف. أثناء التدريب، يستفيد النموذج من AlignedOTA لتعيين التسميات ويعتمد بشكل كبير على عملية تقطير المعرفة المعقدة، مما يتطلب نموذجًا تعليميًا أكبر للإشراف على النموذج الطلابي المستهدف.

تعقيد التدريب

بينماYOLO مقاييس زمن انتقال مذهلة عبر NAS والتقطير، إلا أن هذا يتطلب CUDA ووقت حسابي أكبر بكثير أثناء التدريب مقارنةً بخط أنابيب التدريب أحادي المرحلة والمُحسّن للغاية في YOLOv8.

الأداء والمقاييس

عند نشر نماذج الرؤية الحاسوبية في الإنتاج، من الضروري تحقيق التوازن بين الدقة (mAP) وسرعة الاستدلال. يوضح الجدول أدناه أداء كلا النموذجين عبر أحجام مختلفة.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

YOLOv8 توازنًا استثنائيًا في الأداء. YOLOv8n (نانو) لا يتطلب سوى 3.2 مليون معلمة مقارنة بـ 8.5 مليون معلمة في DAMO-YOLOt، مما يجعله أفضل بكثير للأجهزة المحمولة أو البيئات ذات متطلبات الذاكرة الصارمة. علاوة على ذلك، YOLOv8 نطاقًا أوسع من الأحجام، حيث يصل إلى دقة عالية للغاية. YOLOv8x لأعباء العمل المستندة إلى السحابة.

تجربة المطورين والنظام البيئي

سهولة الاستخدام وكفاءة التدريب

أحد أكبر العوامل المميزة هو تجربة المستخدم. تم تصميم Ultralytics لسرعة المطورين. يتطلب تدريب YOLOv8 المخصص استخدام ذاكرة منخفضة للغاية ويمكن تنفيذه عبر Python موحدة أو واجهة سطر الأوامر.

على العكس من ذلك، فإن إعادة إنتاج التدريب المعزز بالتقطير لـYOLO يتطلبYOLO التنقل بين ملفات التكوين المعقدة والتعامل مع تتبع تجارب المعلم والطالب متعددة المراحل.

فيما يلي مثال على مدى سهولة تدريب YOLOv8 والتحقق من صحته وتصديره YOLOv8 Python:

from ultralytics import YOLO

# Load a pre-trained YOLOv8 nano model
model = YOLO("yolov8n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="cpu")

# Export the trained model to ONNX format
path = model.export(format="onnx")

تعدد الاستخدامات في مهام الرؤية

YOLO تصميمYOLO خصيصًا لاكتشاف الكائنات في الصندوق المحيط. في المقابل، تدعم YOLOv8 مهام متعددة بشكل أساسي. بمجرد تبديل أوزان النموذج، يمكن للمطورين إجراء تقسيم المثيلات وتصنيف الصور وتقدير الوضع دون تغيير قاعدة كود النشر الأساسية. هذه المرونة تجعل Ultralytics أكثر عملية للتطبيقات المعقدة.

حالات الاستخدام في العالم الحقيقي

متى يجب استخدام YOLOv8

إن الجمع بين السرعة والدقة وسهولة النشر YOLOv8 يجعله مثالياً لما يلي:

  • تحليلات البيع بالتجزئة الذكية: إجراء تتبع الكائنات لمراقبة سلوك العملاء أو أتمتة عمليات فحص المخزون.
  • الروبوتات الزراعية: الاستفادة من أدائها القوي على أجهزة متنوعة لتحديد المحاصيل أو الآفات في الوقت الفعلي.
  • التشخيصات الطبية: استخدام تقسيم الحالات لتعيين الحالات الشاذة في الصور الطبية بسرعة ودقة.
  • عمليات النشر على الحافة: التكامل السلس مع تنسيقات التصدير مثل OpenVINO و CoreML يتيح لـ YOLOv8 يتألق على الأجهزة المحدودة.

متى تستخدم DAMO-YOLO

YOLO يكونYOLO مفيدًا في سيناريوهات متخصصة، خاصةً:

  • أبحاث أكاديمية NAS: للفرق التي تدرس منهجيات تصميم البارامترات التمثيلية أو الهندسة المعمارية الآلية.
  • خطوط أنابيب GPU بشكل صارم: تطبيقات تعمل حصريًا على NVIDIA محددة حيث تم تحسين هياكل NAS بشكل كبير لتناسب حدود TensorRT .

حالات الاستخدام والتوصيات

YOLO الاختيار بين YOLOv8 YOLO على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار YOLOv8

YOLOv8 خيار قوي لـ:

  • نشر متعدد المهام متعدد الاستخدامات: المشاريع التي تتطلب نموذجًا مثبتًا للكشف والتجزئة والتصنيف وتقدير الوضع داخل نظام Ultralytics .
  • أنظمة الإنتاج الراسخة: بيئات الإنتاج الحالية المبنية بالفعل على YOLOv8 مع خطوط إنتاج مستقرة ومختبرة جيدًا.
  • دعم واسع من المجتمع والنظام البيئي: تطبيقات تستفيد من البرامج التعليمية الشاملة YOLOv8OLOv8، وعمليات الدمج مع أطراف ثالثة، وموارد المجتمع النشطة.

متى تختار DAMO-YOLO

YOLO في الحالات التالية:

  • تحليلات الفيديو عالية الإنتاجية: معالجة تدفقات الفيديو عالية معدل الإطارات في الثانية علىGPU NVIDIA GPU الثابتة حيث يكون إنتاجية الدفعة 1 هو المقياس الأساسي.
  • خطوط التصنيع الصناعي: سيناريوهات ذات قيود صارمة GPU على الأجهزة المخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
  • أبحاث البحث عن البنية العصبية: دراسة تأثيرات البحث الآلي عن البنية (MAE-NAS) والبنى الأساسية المعاد معايرتها بكفاءة على أداء الكشف.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

التطلع إلى المستقبل: Ultralytics الأحدث

بينما YOLOv8 أداة عمل موثوقة للغاية، فإن مجال الرؤية الحاسوبية يتطور بسرعة. يجب على المستخدمين أيضًا التفكير في استكشاف الأجيال الأحدث:

YOLO26: يمثل الجيل الأحدث، Ultralytics ، تحولًا جذريًا. فهو يقدم تصميمًا أصليًا شاملاً NMS، مما يزيل تمامًا اختناقات التأخير المرتبطة بمعالجة ما بعد عدم القمع الأقصى. مدعومًا بمحسن MuSGD الجديد (مزيج من SGD Muon) ووظائف الخسارة المتخصصة ProgLoss + STAL، يحقق YOLO26 تدريبًا مستقرًا بشكل ملحوظ وتحسينًا كبيرًا في التعرف على الأجسام الصغيرة. مع إزالة DFL (إزالة Distribution Focal Loss لتبسيط التصدير وتحسين التوافق مع الأجهزة ذات الحواف/الطاقة المنخفضة)، توفر التعديلات المعمارية CPU أسرع بنسبة تصل إلى 43٪ CPU مقارنة بالأجيال السابقة، مما يجعلها الخيار الأمثل للحوسبة الحديثة.

YOLO11: بديل ممتاز آخر، Ultralytics YOLO11 يقدم تحسينات معمارية تدريجية على YOLOv8 ظل نموذجًا قويًا ومستخدمًا على نطاق واسع في المجتمع.

تبسيط سير عملك

هل أنت مستعد لنقل نماذجك من مرحلة النموذج الأولي إلى مرحلة الإنتاج؟ استخدم Ultralytics لتعليق مجموعات البيانات تلقائيًا track ونشر النماذج بسلاسة على السحابة أو الأجهزة الطرفية.

في الختام، في حينYOLO رؤى أكاديمية مثيرة للاهتمام في مجال البحث عن البنية، توفر Ultralytics نظامًا بيئيًا أكثر نضجًا وتعددًا في الاستخدامات وسهولة في الاستخدام للمطورين. سواء اخترت الاستمرار في استخدام YOLOv8 الذي أثبت استقراره YOLOv8 الترقية إلى بنية YOLO26 فائقة السرعة NMS تظل Ultralytics الخيار الأول للذكاء الاصطناعي للرؤية في الوقت الفعلي.


تعليقات