تخطي إلى المحتوى

Ultralytics YOLOv8 YOLOv10: تطور الكشف في الوقت الفعلي

يتطور مجال الرؤية الحاسوبية بوتيرة سريعة للغاية، حيث تعيد البنى الجديدة تعريف أحدث ما توصلت إليه التكنولوجيا باستمرار. ومن بين المعالم البارزة في هذا المجال ما يلي Ultralytics YOLOv8 و YOLOv10. ورغم أن كلا النموذجين ينبعان من سلالة YOLO You Only Look Once) الأسطورية، إلا أنهما يمثلان فلسفتين مختلفتين في التصميم وتكاملين مختلفين في النظام البيئي.

يقدم هذا الدليل مقارنة تقنية مفصلة لمساعدة الباحثين والمطورين على اختيار الأداة المناسبة لاحتياجاتهم الخاصة، مع مراعاة عوامل مثل نضج النظام البيئي، وتعدد المهام، والابتكار المعماري.

ملخص تنفيذي: أي نموذج يجب أن تختار؟

قبل الخوض في تفاصيل البنية، إليك الفرق الأساسي:

  • Ultralytics YOLOv8 هو "سكين الجيش السويسري" القوي للرؤية الحاسوبية. وهو الخيار المفضل لنشره في المؤسسات بسبب نظامه البيئي الواسع، ودعمه للمهام المتعددة (الكشف، والتجزئة، والوضع، و OBB، والتصنيف)، وتكامله السلس مع Ultralytics .
  • YOLOv10 هو نموذج كشف متخصص قدم التدريب NMS إلى العالم. وهو ممتاز للبحث وسيناريوهات الكشف المحددة فقط حيث يكون الهدف الأساسي هو التخلص من المعالجة اللاحقة.

أحدث المعايير: YOLO26

في حين أن مقارنة YOLOv8 YOLOv10 مهم، إلا أن المستخدمين الذين يبحثون عن أفضل أداء على الإطلاق يجب أن يبحثوا عن YOLO26. تم إصدار YOLO26 في يناير 2026، وهو يدمج التصميم NMS الذي ابتكرته YOLOv10 النظام البيئي القوي وتعدد المهام في Ultralytics. يوفر CPU أسرع بنسبة تصل إلى 43٪ CPU وتحسينًا في اكتشاف الأجسام الصغيرة.

Ultralytics YOLOv8: معيار النظام البيئي

صدر YOLOv8 في أوائل عام 2023، YOLOv8 أصبح المعيار الصناعي للرؤية الحاسوبية العملية. ولا تكمن قوته الأساسية في المقاييس الأولية فحسب، بل في سهولة استخدامه وتعدد استخداماته.

الميزات الرئيسية

تفاصيل النموذج

  • المؤلفون: Glenn Jocher و Ayush Chaurasia و Jing Qiu
  • المؤسسة:Ultralytics
  • التاريخ: 2023-01-10
  • الوثائق:وثائق YOLOv8

تعرف على المزيد حول YOLOv8

YOLOv10: الرائد NMS

تم تطوير YOLOv10 من قبل باحثين في جامعة تسينغهوا، YOLOv10 بشكل كبير على كفاءة البنية وإزالة معوقات المعالجة اللاحقة.

الابتكارات الرئيسية

  • تدريب شامل: YOLOv10 مهام مزدوجة متسقة للتخلص من الحاجة إلى قمع غير أقصى (NMS) أثناء الاستدلال. وهذا يقلل من تقلب زمن الاستجابة في المشاهد المزدحمة.
  • تصميم كفاءة شامل: تتميز البنية الهندسية برؤوس تصنيف خفيفة الوزن وتقليل التردد المكاني للفصل بين القنوات لتقليل تكلفة الحوسبة (FLOPs).
  • التركيز: تم تصميمه بشكل أساسي لمهام الكشف عن الأجسام.

تفاصيل النموذج

  • المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
  • المنظمة: جامعة تسينغ هوا
  • التاريخ: 2024-05-23
  • Arxiv:2405.14458
  • الوثائق:وثائق YOLOv10

تعرف على المزيد حول YOLOv10

مقارنة تقنية: المقاييس والأداء

يوضح الجدول التالي مقارنة بين أداء كلا النموذجين على COCO .

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

تحليل البيانات

  1. الدقة مقابل الكفاءة: يحقق YOLOv10 قيمة mAPval أعلى مع عدد أقل من المعلمات وعمليات FLOP مقارنةً بـ YOLOv8. وتُعزى هذه الكفاءة إلى كتل هندسته المعمارية المُحسّنة.
  2. سرعة الاستدلال: بينما YOLOv10 NMS تظل YOLOv8 (خاصةً النسخة Nano) تنافسية للغاية في الإنتاجية الأولية على الأجهزة القياسية.
  3. ذاكرة التدريب:YOLOv8 تحسين Ultralytics YOLOv8 بشكل كبير من أجل كفاءة التدريب، وغالبًا ما يتطلب GPU أقل من التطبيقات الأكاديمية، مما يسمح بأحجام دفعات أكبر على الأجهزة الاستهلاكية.

الهندسة المعمارية وفلسفة التصميم

يكمن الاختلاف الأساسي في كيفية تعامل هذه النماذج مع التنبؤات النهائية.

بنية YOLOv8

YOLOv8 أداة تخصيص مهام متوافقة. وهو يتنبأ بمربعات الحدود ودرجات الفئات بشكل منفصل، ولكنه يوازن بينهما أثناء التدريب. والأهم من ذلك، أنه يعتمد على NMS لتصفية المربعات المكررة. وهذا يجعل النموذج قويًا ومتعدد الاستخدامات، مما يسمح بتكييفه بسهولة للتجزئة وتقدير الوضع.

بنية YOLOv10

YOLOv10 مهام التعيين المزدوجة. أثناء التدريب، يستخدم رأس واحد إلى عدة (مثل YOLOv8) لإشارات الإشراف الغنية ورأس واحد إلى واحد للاستدلال النهائي. تسمح هذه البنية للنموذج بتعلم اختيار أفضل مربع واحد لكائن ما، مما يجعل NMS .

تداعيات النشر

إزالة NMS خط أنابيب النشر بشكل كبير. عند تصدير النماذج إلى تنسيقات مثل TensorRT أو OpenVINO، لم يعد المهندسون بحاجة إلى تنفيذ NMS معقدة NMS مما يقلل من النفقات الهندسية.

سهولة الاستخدام والنظام البيئي

وهنا يصبح التمييز أكثر أهمية بالنسبة للمطورين.

Ultralytics YOLOv8 مدعوم من قبل مجتمع مفتوح المصدر ضخم ونشط. ويستفيد من:

YOLOv10، على الرغم من توفره عبر Ultralytics إلا أنه يمثل في المقام الأول مساهمة أكاديمية. وقد لا يحظى بنفس معدل الصيانة أو توسعات الميزات (مثل التتبع أو دعم OBB) مثل Ultralytics الأساسية.

مقارنة التعليمات البرمجية

يمكن تشغيل كلا النموذجين باستخدام Ultralytics الموحدة، مما يوضح سهولة الاستخدام التي يوفرها النظام البيئي.

from ultralytics import YOLO

# Load a pretrained YOLOv8 model (Official Ultralytics)
model_v8 = YOLO("yolov8n.pt")

# Load a pretrained YOLOv10 model (Community supported)
model_v10 = YOLO("yolov10n.pt")

# Train YOLOv8 on a custom dataset
model_v8.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference with YOLOv10 on an image
results = model_v10("https://ultralytics.com/images/bus.jpg")

تطبيقات عملية في أرض الواقع

متى يجب استخدام YOLOv8

  • الروبوتات المعقدة: إذا كان الروبوت الخاص بك بحاجة إلى التنقل (الكشف) والتلاعب بالأشياء (الوضع/التجزئة)، فإن قدرات YOLOv8 المتعددة المهام تعتبر أساسية.
  • المنتجات التجارية: بالنسبة للمنتجات التي تتطلب صيانة طويلة الأمد، تضمن استقرار Ultralytics استمرار صلاحية نموذجك لسنوات عديدة.
  • الصور الساتلية: YOLOv8 نماذج OBB المتخصصة في YOLOv8 مثالية للكشف عن الأجسام الدوارة مثل السفن أو المركبات في الصور الجوية.

متى تستخدم YOLOv10

  • التداول عالي التردد للبيانات المرئية: في السيناريوهات التي يكون فيها كل جزء من الثانية من تباين زمن الاستجابة مهمًا، فإن التخلص من NMS يوفر وقت استدلال حتمي.
  • الأجهزة المدمجة ذات CPU المحدودة: بالنسبة للأجهزة التي CPU NMS على و CPU عقبة، فإن تصميم YOLOv10 الشامل يخفف العبء عن المعالج.

الخلاصة

كلا البنيتين خياران ممتازان. YOLOv8 لا تزال هي البطل المتعدد الاستخدامات بالنسبة لمعظم المطورين، حيث توفر مسارًا آمنًا وقويًا وغنيًا بالميزات للإنتاج. YOLOv10 يقدم لمحة رائعة عن مستقبل الكشف NMS.

ومع ذلك، فقد حقق هذا المجال بالفعل تقدماً كبيراً. بالنسبة للمطورين الذين يبدؤون مشاريع جديدة اليوم، يعد YOLO26 هو الخيار الموصى به. فهو يعتمد مزايا YOLOv10 NMS YOLOv10 يحسنها باستخدام مُحسِّن MuSGD ووظائف الخسارة المحسّنة (ProgLoss)، مما يوفر أفضل ما في كلا العالمين: البنية المتطورة للبحوث الأكاديمية المدعومة بدعم Ultralytics على مستوى الصناعة.

مزيد من القراءة


تعليقات