تخطي إلى المحتوى

YOLOv10 YOLO: مقارنة تقنية بين أجهزة الكشف عن الأجسام في الوقت الفعلي

عند بناء خطوط أنابيب حديثة للرؤية الحاسوبية، من الأهمية بمكان اختيار بنية الكشف عن الأجسام في الوقت الفعلي المناسبة. في هذا التحليل التقني الشامل، نستكشف البنى ومقاييس الأداء وحالات الاستخدام المثالية لـ YOLOv10 و YOLO. يمثل كلا النموذجين قفزات كبيرة في قدرات الكشف عن الكائنات، لكنهما يتخذان مسارات معمارية مختلفة لتحقيق أهدافهما.

سواء كان مشروعك يتطلب النشر على أجهزة AI محدودة أو يتطلب أقصى دقة على وحدات معالجة الرسومات السحابية، فإن فهم الفروق الدقيقة بين هذه البنى سيساعدك على اتخاذ قرار مستنير.

استكشاف YOLOv10

قدمه باحثون في جامعة تسينغهوا، YOLOv10 ثورة في YOLO من خلال تقديم نهج شامل أصلي، مما أدى إلى القضاء بشكل فعال على الحاجة إلى القمع غير الأقصى (NMS) أثناء المعالجة اللاحقة.

YOLOv10 :

الميزات المعمارية الرئيسية

تتمثل الابتكار الرئيسي YOLOv10 في استراتيجية التعيينات المزدوجة المتسقة للتدريب NMS. تعتمد أجهزة الكشف عن الأجسام التقليدية بشكل كبير على NMS المربعات المحيطة المتداخلة، مما يؤدي إلى حدوث تأخير غير متوقع، وهو ما يمثل عقبة كبيرة للتطبيقات في الوقت الفعلي مثل المركبات ذاتية القيادة والروبوتات عالية السرعة. من خلال التنبؤ بمربع محيط واحد مثالي لكل جسم مباشرة، YOLOv10 استنتاجًا متوقعًا وبتأخير منخفض للغاية.

علاوة على ذلك، يستخدم النموذج تصميمًا شاملاً يعتمد على الكفاءة والدقة. تعمل البنية على تحسين مختلف المكونات، بما في ذلك رأس تصنيف خفيف الوزن وتقليل الدقة المكانية المنفصلة، مما يقلل بشكل كبير من التكرار الحسابي. وينتج عن ذلك بنية تتميز بعدد أقل من المعلمات وعدد أقل من عمليات FLOP مع الحفاظ على متوسط دقة تنافسي (mAP).

تصدير مبسط للإنتاج

نظرًا لأن YOLOv10 NMS من مخطط الاستدلال، فإن تصدير النموذج إلى تنسيقات مثل ONNX أو TensorRT أمرًا في غاية البساطة، مما يجعله مناسبًا بشكل استثنائي لعمليات النشر المتطورة.

تعرف على المزيد حول YOLOv10

مثال على الاستخدام

YOLOv10 بشكل عميق في Ultralytics مما يجعله سهل الاستخدام للغاية عبر Python Ultralytics Python .

from ultralytics import YOLO

# Load a pre-trained YOLOv10 nano model
model = YOLO("yolov10n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image
results = model("https://ultralytics.com/images/bus.jpg")

# Export the model to TensorRT format
model.export(format="engine", half=True)

استكشافYOLO

تم تطويرYOLO بواسطة مجموعة Alibaba،YOLO على اكتشاف هياكل شبكات عالية الكفاءة من خلال البحث الآلي في البنية العصبية (NAS)، بهدف دفع حدود باريتو للسرعة والدقة.

تفاصيل DAMO-YOLO:

الميزات المعمارية الرئيسية

YOLO عدة تقنيات جديدة مصممة خصيصًا للتطبيقات الصناعية. أساس النموذج هو MAE-NAS Backbone، الذي تم إنشاؤه عبر بحث تطوري متعدد الأهداف. تكتشف هذه العملية الآلية هياكل أساسية تلتزم بشكل صارم بالميزانيات الحسابية المحددة مسبقًا، مما يحقق توازنًا دقيقًا بين الدقة وزمن الاستدلال.

بالإضافة إلى ذلك، تستخدم البنية شبكة Efficient RepGFPN neck. تم تصميم شبكة هرمية الميزات هذه لتحسين دمج الميزات عبر مستويات مختلفة، وهو أمر بالغ الأهمية للمهام المعقدة مثل تحليل الصور الجوية حيث تختلف الأحجام بشكل كبير. لتكملة ذلك،YOLO ZeroHead، وهو رأس كشف بسيط يقلل بشكل كبير من تعقيد طبقات التنبؤ النهائية، مما يوفر وقت حسابي ثمين أثناء الاستدلال.

تعرف على المزيد حول DAMO-YOLO

مقارنة الأداء

عند تقييم بنى الكشف عن الأجسام، من الأهمية بمكان إيجاد التوازن الصحيح بين سرعة الاستدلال وكفاءة المعلمات ودقة الكشف. يقارن الجدول أدناه أداء YOLOv10 YOLO أحجام نماذجهما.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

كما لوحظ في المعايير المرجعية، يقدم YOLOv10 ملفات تعريف زمن انتقال استثنائية على TensorRT لا سيما في نسخته النانوية، التي تتطلب معلمات وعمليات FLOP أقل بكثير من النماذج المماثلةYOLO. في حينYOLO mAP قويًا mAP نسخته الصغيرة، فإن كفاءة المعلمات وزمن انتقال الاستدلال YOLOv10 يوفران ميزة واضحة لبيئات النشر المقيدة.

حالات الاستخدام والتوصيات

YOLO الاختيار بين YOLOv10 YOLO على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار YOLOv10

YOLOv10 خيار قوي لـ:

  • الكشف في الوقت الفعليNMS: تطبيقات تستفيد من الكشف الشامل بدون قمع غير أقصى، مما يقلل من تعقيد النشر.
  • التوازن بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر نماذج مختلفة.
  • تطبيقات ذات زمن انتقال ثابت: سيناريوهات النشر التي يكون فيها زمن الاستدلال المتوقع أمرًا بالغ الأهمية، مثل الروبوتات أو الأنظمة المستقلة.

متى تختار DAMO-YOLO

YOLO في الحالات التالية:

  • تحليلات الفيديو عالية الإنتاجية: معالجة تدفقات الفيديو عالية معدل الإطارات في الثانية علىGPU NVIDIA GPU الثابتة حيث يكون إنتاجية الدفعة 1 هو المقياس الأساسي.
  • خطوط التصنيع الصناعي: سيناريوهات ذات قيود صارمة GPU على الأجهزة المخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
  • أبحاث البحث عن البنية العصبية: دراسة تأثيرات البحث الآلي عن البنية (MAE-NAS) والبنى الأساسية المعاد معايرتها بكفاءة على أداء الكشف.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

ميزة Ultralytics

على الرغم من أن كلا النموذجين مثيران للإعجاب من الناحية التقنية، فإن اختيار بنية للإنتاج يتطلب النظر إلى ما هو أبعد من المقاييس الأولية. يوفر البناء باستخدام نماذج مدعومة أصلاً من قبل Ultralytics مزايا لا مثيل لها للمطورين والباحثين على حد سواء.

سهولة الاستخدام ونظام بيئي جيد الصيانة

على عكس المستودعات الأكاديمية المستقلة التي غالبًا ما تتعرض للإهمال، Ultralytics نظامًا بيئيًا قويًا يتم صيانته بشكل نشط. قد يكون إعداد بيئات معقدة للنماذج التي تعتمد بشكل كبير على خطوط أنابيب NAS أمرًا شاقًا. في المقابل، Ultralytics Python قياسية وبديهية CLI قوية، مدعومة بوثائق شاملة. وهذا يقلل بشكل جذري من وقت طرح حلول الرؤية المخصصة في السوق.

كفاءة التدريب ومتطلبات الذاكرة

يمكن أن يصبح تدريب النماذج الكبيرة مكلفًا من الناحية الحسابية بسرعة. تشتهرYOLO Ultralytics YOLO تاريخيًا بانخفاض استهلاكها CUDA أثناء التدريب والاستدلال. تتيح هذه الكفاءة للمطورين تدريب النماذج على أجهزة من فئة المستهلكين أو حالات سحابية فعالة من حيث التكلفة دون التعرض لأخطاء نفاد الذاكرة التي تحدث عادةً عند العمل مع نماذج قائمة على المحولات مثل RT-DETR.

تتبع التجارب

يتكامل Ultralytics مع أفضل أدوات MLOps. يمكنك بسهولة track تقدم تدريب النموذج track باستخدام التكامل مع Weights & Biasesو Cometأو ClearML بدون أي كود نمطي إضافي.

تعدد الاستخدامات عبر المهام

يتمثل أحد القيود المهمة للعديد من نماذج الكشف المتخصصة في تركيزها الضيق. ضمن Ultralytics لا تقتصر إمكانياتك على الكشف عن الأشياء فحسب. فهذه الأدوات تمتد بسلاسة لتشمل مهام متعددة للرؤية الحاسوبية، بما في ذلك تجزئة الحالات وتصنيف الصور وتقدير الوضع والكشف عن المربعات المحددة (OBB).

التطلع إلى المستقبل: تطور YOLO26

بينما YOLOv10 الاستدلال NMSYOLO قوة NAS، فإن مجال الرؤية الحاسوبية يتطور بسرعة. للمطورين الذين يبحثون عن أحدث الحلول المتطورة، نوصيهم بتجربة Ultralytics .

صدر كخليفة نهائي لـ YOLO11، ويستند YOLO26 إلى الأساس NMS الذي وضعه YOLOv10 يذهب إلى أبعد من ذلك بكثير.

تشمل التطورات الرئيسية في YOLO26 ما يلي:

  • CPU أسرع بنسبة تصل إلى 43٪ CPU : مُحسّن خصيصًا للحوسبة الطرفية والأجهزة منخفضة الطاقة.
  • إزالة DFL: تمت إزالة Distribution Focal Loss، مما يضمن عمليات تصدير أبسط وتوافقًا محسّنًا مع أهداف النشر المتنوعة.
  • MuSGD Optimizer: مزيج من SGD Muon، يوفر استقرارًا متقدمًا في تدريب LLM وتقاربًا أسرع مباشرة في الرؤية الحاسوبية.
  • ProgLoss + STAL: وظائف خسارة محسّنة بشكل كبير توفر تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر ضروري لحالات الاستخدام مثل الزراعة والاستشعار عن بعد.

من خلال استخدام Ultralytics التي تم تحديثها مؤخرًا، يمكن للمطورين إضافة تعليقات وتدريب ونشر نماذج الجيل التالي مثل YOLO26 بسلاسة وببضع نقرات فقط، مما يضمن أن تكون خطوط إنتاج الرؤية الحاسوبية الخاصة بك متطورة ومستقبلية.


تعليقات