تخطي إلى المحتوى

YOLO YOLOv10: استكشاف تطور اكتشاف الكائنات في الوقت الفعلي

تطور مجال الكشف عن الأجسام في الوقت الفعلي بسرعة كبيرة، مدفوعًا بالسعي الدؤوب لتحقيق زمن استجابة أقل ودقة أعلى. ومن المعالم البارزة في هذه الرحلة تطوير YOLO من قبل مجموعة Alibaba و YOLOv10الذي طوره باحثون في جامعة تسينغهوا. في حينYOLO تقنيات متقدمة للبحث في البنية العصبية (NAS) إلى هذا المجال، YOLOv10 خط أنابيب النشر من خلال القضاء على القمع غير الأقصى (NMS). تستكشف هذه المقارنة الشاملة البنى التقنية ومقاييس الأداء لهذين النظامين، ولماذا تمثل أحدث Ultralytics مثل YOLO26 قمة هذه التطورات في بيئات الإنتاج.

مقارنة مقاييس الأداء

يقدم الجدول التالي مقارنة مباشرة بين مؤشرات الأداء الرئيسية. لاحظ الفرق في سرعات الاستدلال، خاصةً حيث تساهم التصميمات NMS في تقليل زمن الاستجابة.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

YOLO: الهندسة المعمارية والمنهجية

تم اقتراح YOLO في نوفمبر 2022 من قبل باحثين من مجموعة Alibaba. وكان الهدف منه هو توسيع حدود الأداء من خلال دمج أحدث التقنيات في إطار عمل متماسك للكشف.

  • المؤلفون: شيانزه شو، يي تشي جيانغ، وي هوا تشن، ييلون هوانغ، يوان تشانغ، وشيو يو صن
  • المنظمة: مجموعة علي بابا
  • التاريخ: 2022-11-23
  • الورقة:arXiv:2211.15444
  • GitHub:tinyvision/DAMO-YOLO

الميزات المعمارية الرئيسية

YOLO باستخدامه لـ Neural Architecture Search (NAS). على عكس النماذج ذات الهياكل الأساسية المصممة يدويًا،YOLO Method-Awareness Efficient NAS (MAE-NAS) لاكتشاف الهياكل الشبكية المثلى في ظل قيود محددة. وينتج عن ذلك هيكل أساسي عالي الكفاءة للأجهزة المحددة التي تم تصميمه من أجلها.

بالإضافة إلى ذلك، فإنه يشتمل على شبكة RepGFPN (شبكة هرمية عامة معاد تقييمها) فعالة لدمج الميزات ورأس خفيف الوزن يُعرف باسم "ZeroHead". أحد المكونات الأساسية لاستراتيجية التدريب هو AlignedOTA، وهو آلية ديناميكية لتعيين التسميات تعمل على تحسين التوافق بين مهام التصنيف والانحدار. ومع ذلك، فإن تحقيق أعلى أداء معYOLO يتطلب عملية تقطير معقدة، مما يستلزم نموذجًا تعليميًا ثقيلًا أثناء التدريب، مما قد يزيد العبء الحسابي بشكل كبير مقارنة بنهج "bag-of-freebies" المستخدم في YOLOv8.

تعقيد التدريب

على الرغم من قوتها، إلا أن عملية التدريب لـYOLO تستهلك موارد كثيرة. غالبًا ما تتطلب مرحلة التقطير تدريب نموذج معلم أكبر أولاً، مما يعقد سير العمل للمطورين الذين يحتاجون إلى تكرارات سريعة على مجموعات البيانات المخصصة.

YOLOv10: الاختراق الشامل

صدر في مايو 2024 عن جامعة تسينغهوا، YOLOv10 تحولًا جذريًا في النموذج السائد من خلال معالجة أحد أقدم العقبات في مجال الكشف عن الأجسام: عدم القمع الأقصى (NMS).

  • المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
  • المنظمة: جامعة تسينغ هوا
  • التاريخ: 2024-05-23
  • ورقة بحثية:arXiv:2405.14458
  • GitHub:THU-MIG/yolov10

الابتكارات المعمارية

السمة المميزة لـ YOLOv10 تصميمها الشامل NMS. تولد أجهزة الكشف التقليدية مربعات حدودية زائدة عن الحاجة يجب تصفيةها بواسطة NMS وهي خطوة معالجة لاحقة تسبب تأخيرًا وتعقّد عملية النشر. YOLOv10 التعيينات المزدوجة المتسقة أثناء التدريب — باستخدام كل من المطابقة واحد إلى كثير (للإشراف الغني) وواحد إلى واحد (للاستدلال من البداية إلى النهاية). وهذا يسمح للنموذج بالتنبؤ بأفضل مربع واحد لكل كائن مباشرة، مما يلغي الحاجة إلى NMS .

علاوة على ذلك، YOLOv10 تصميم نموذج شامل قائم على الكفاءة والدقة. ويشمل ذلك رؤوس تصنيف خفيفة الوزن، وتقليل الدقة المقسمة إلى قنوات مكانية، وتصميم كتل موجهة بالترتيب، مما ينتج عنه نموذج أصغر حجماً وأسرع من سابقيه مثل YOLOv9 مع الحفاظ على دقة تنافسية.

تعرف على المزيد حول YOLOv10

ميزة Ultralytics: لماذا تختار YOLO26؟

في حين أنYOLO YOLOv10 مساهمات أكاديمية مهمة، فإن Ultralytics يوفر جسراً بين الأبحاث المتطورة والبرمجيات العملية والموثوقة. ويستند YOLO26 الذي تم إصداره مؤخراً إلى الاختراق الذي حققه YOLOv10 NMS YOLOv10 يدمجه في إطار عمل قوي على مستوى المؤسسات.

أداء وكفاءة فائقان

YOLO26 هو الخيار الموصى به للمشاريع الجديدة، حيث يقدم مزايا واضحة مقارنة YOLOv10 YOLO YOLOv10 البحتة:

  • NMS من البداية إلى النهاية: مثل YOLOv10، YOLO26 هي بطبيعتها خالية من NMS من البداية إلى النهاية. فهي تلغي الحاجة إلى NMS ، مما يبسط عمليات النشر ويقلل بشكل كبير من تقلب زمن الاستجابة.
  • استقرار تدريب محسّن: يستخدم YOLO26 مُحسّن MuSGD، وهو مزيج من SGD Muon مستوحى من تدريب نموذج اللغة الكبيرة (LLM). يضمن هذا الابتكار تقاربًا أسرع واستقرارًا أكبر أثناء التدريب، مما يقلل من GPU المطلوبة مقارنة بالبنى الثقيلة المحوّلة.
  • تحسين الحافة: من خلال إزالة Distribution Focal Loss (DFL)، يعمل YOLO26 على تبسيط طبقة الإخراج، مما يجعلها أسرع بنسبة تصل إلى 43٪ في CPU . وهذا أمر بالغ الأهمية للأجهزة الطرفية التي لا تتوفر فيها GPU .

YOLO26 قفزات تكنولوجية

YOLO26 ليس مجرد إصدار جديد، بل هو ترقية شاملة.

  • ProgLoss + STAL: وظائف خسارة محسّنة تعزز بشكل كبير التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لصور الطائرات بدون طيار والروبوتات.
  • تعدد الاستخدامات: على عكسYOLO، الذي هو في الأساس جهاز كشف، يدعم YOLO26 تقدير الوضع، والتجزئة، والتصنيف، و OBB.

سهولة الاستخدام والنظام البيئي

أحد التحديات الرئيسية التي تواجه مستودعات الأبحاث مثلYOLO تعقيد الإعداد والصيانة. Ultralytics هذه المشكلة باستخدام Python موحدة. سواء كنت تستخدم YOLO11أو YOLOv10 أو YOLO26، يظل سير العمل متسقًا وبسيطًا.

تعمل Ultralytics (المعروفة سابقًا باسم HUB) على تسريع عملية التطوير من خلال توفير أدوات لإدارة مجموعات البيانات، والتعليقات التلقائية، والتصدير بنقرة واحدة إلى تنسيقات مثل TensorRT و ONNX و CoreML.

تعرف على المزيد حول YOLO26

حالات الاستخدام المثالية

يعتمد اختيار النموذج المناسب على القيود المحددة الخاصة بك:

  • اخترYOLO : كنت تجري بحثًا في مجال البحث عن البنية العصبية (NAS) أو تحتاج إلى بنية أساسية متخصصة لقيود الأجهزة الفريدة حيث لا تكفي البنى الأساسية القياسية CSP/ELAN.
  • اختر YOLOv10 : كنت بحاجة إلى كاشف محدد NMS لإجراء مقارنة أكاديمية أو لديك متطلبات قديمة للبنية المحددة المقترحة في ورقة تسينغهوا الأصلية.
  • اختر Ultralytics إذا: كنت بحاجة إلى حل متطور وجاهز للإنتاج. تصميمهNMS، جنبًا إلى جنب مع استقرار تدريب MuSGD CPU المحسّنة، يجعله الأفضل من جميع النواحي. وهو متفوق بشكل خاص في التطبيقات في الوقت الفعلي في التصنيع وتحليلات البيع بالتجزئة والأنظمة المستقلة حيث تعد سهولة النشر والدعم طويل الأمد أمرًا بالغ الأهمية.

مثال برمجي: تشغيل YOLOv10 و YOLO26

Ultralytics التبديل بين هذه البنى أمراً في غاية السهولة. ونظراً لأن YOLOv10 في Ultralytics يمكنك اختبار كلا النموذجين مع تغييرات طفيفة في الكود.

تشغيل YOLOv10

from ultralytics import YOLO

# Load a pre-trained YOLOv10 model
model = YOLO("yolov10n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Show results
results[0].show()

تدريب YOLO26

للاستفادة من أحدث التطورات في YOLO26، مثل مُحسِّن MuSGD و ProgLoss، يكون التدريب على مجموعة بيانات مخصصة أمرًا بسيطًا:

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset using the new optimizer settings (auto-configured)
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for simplified edge deployment
model.export(format="onnx")

الخلاصة

YOLOv10 كل منYOLO YOLOv10 دفع هذا المجال إلى الأمام —YOLO NAS الفعال و YOLOv10 إزالته البصيرة لـ NMS. ومع ذلك، بالنسبة للمطورين الذين يتطلعون إلى بناء تطبيقات قوية ومستقبلية في عام 2026، يوفر Ultralytics ميزة حاسمة. من خلال الجمع YOLOv10 بنية YOLOv10 NMS وديناميكيات التدريب الفائقة CPU الأسرع CPU والدعم الذي لا مثيل له من Ultralytics يُعد YOLO26 الخيار الأول لمحترفي الرؤية الحاسوبية.

للمهتمين باستكشاف الأجيال المستقرة السابقة، YOLO11 بديلاً مدعومًا بالكامل وذو قدرات عالية.


تعليقات