تخطي إلى المحتوى

YOLO26 مقابل YOLOv10: تطور الكشف الشامل عن الكائنات

تطورت بيئة اكتشاف الكائنات في الوقت الفعلي بسرعة، متنقلة من مسارات العمل المعقدة متعددة المراحل إلى معماريات مبسطة شاملة (من البداية إلى النهاية). نموذجان محوريان في هذا التحول هما YOLO26، أحدث ما تقدمه Ultralytics من تقنيات متطورة، وYOLOv10، وهو إنجاز أكاديمي من جامعة تسينغهوا.

في حين أن كلا النموذجين يدعمان إزالة قمع غير الحد الأقصى (NMS) لتبسيط عملية النشر، إلا أنهما يختلفان بشكل كبير في أهداف التحسين، ودعم النظام البيئي، والتحسينات المعمارية. يقدم هذا الدليل تحليلاً تقنياً معمقاً لاختلافاتهما لمساعدتك في اختيار الأداة المناسبة لمشاريع رؤية الكمبيوتر الخاصة بك.

معايير الأداء

يقارن الجدول التالي أداء YOLO26 و YOLOv10 على مجموعة بيانات التحقق COCO. يُظهر YOLO26 دقة فائقة (mAP) وسرعات استدلال أعلى، خاصة على أجهزة CPU حيث تم تحسينه خصيصًا للنشر على الأجهزة الطرفية.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Ultralytics YOLO26

يمثل YOLO26 قمة عائلة نماذج Ultralytics، وقد تم إصداره في يناير 2026. بناءً على إرث YOLOv8 و YOLO11، يقدم تصميمًا أصليًا شاملاً (من البداية إلى النهاية) يلغي الحاجة إلى معالجة NMS اللاحقة مع تحقيق مكاسب كبيرة في السرعة على الأجهزة الطرفية.

الابتكارات المعمارية الرئيسية

  • الاستدلال الشامل (من البداية إلى النهاية) الخالي من NMS: مثل YOLOv10، يلغي YOLO26 خطوة NMS. وهذا يبسط مسار النشر، مما يضمن أن يكون خرج النموذج جاهزًا للمنطق اللاحق فورًا، ويقلل من تباين زمن الوصول في الأنظمة في الوقت الفعلي.
  • إزالة DFL: تزيل المعمارية Distribution Focal Loss (DFL). يُبسّط هذا التغيير بشكل كبير عملية التصدير إلى تنسيقات مثل ONNX و TensorRT، ويعزز التوافق مع الأجهزة الطرفية منخفضة الطاقة التي قد تواجه صعوبة مع طبقات الإخراج المعقدة.
  • مُحسِّن MuSGD: مُحسِّن تدريب مبتكر يجمع بين الانحدار التدرجي العشوائي (SGD) مع Muon (مستوحى من تقنيات تدريب نماذج اللغة الكبيرة LLM من Moonshot AI). ينتج عن ذلك تقارب أسرع وتشغيل تدريب أكثر استقرارًا مقارنة بإعدادات AdamW أو SGD التقليدية.
  • ProgLoss + STAL: يعالج دمج موازنة الخسارة التدريجية (Progressive Loss Balancing) وتخصيص التسميات الواعي للأهداف الصغيرة (STAL) نقاط الضعف الشائعة في اكتشاف الكائنات بشكل مباشر، مما يحسن الأداء بشكل خاص على الكائنات الصغيرة الموجودة في الصور الجوية أو في مجال اللوجستيات.

تعرف على المزيد حول YOLO26

حالات الاستخدام ونقاط القوة

تم تصميم YOLO26 كنموذج رؤية عالمي. بالإضافة إلى اكتشاف الكائنات، يدعم بشكل أصلي تجزئة الكائنات (instance segmentation)، وتقدير الوضعيات (pose estimation)، واكتشاف الصناديق المحيطة الموجهة (OBB)، وتصنيف الصور.

إن تحسينه للاستدلال على وحدة المعالجة المركزية (CPU) يجعله الخيار الأمثل لتطبيقات الذكاء الاصطناعي الطرفية، مثل التشغيل على Raspberry Pi أو الأجهزة المحمولة، حيث تكون موارد GPU غير متاحة.

كفاءة الأجهزة الطرفية

تم تحسين YOLO26 لتحقيق سرعة استدلال على وحدة المعالجة المركزية (CPU) أسرع بنسبة تصل إلى 43% مقارنة بالأجيال السابقة، مما يجعله نقطة تحول لأجهزة إنترنت الأشياء التي تعمل بالبطارية والأنظمة المدمجة.

YOLOv10

YOLOv10، الذي طوره باحثون في جامعة تسينغهوا، كان نموذجًا رائدًا في تقديم التدريب الخالي من NMS لعائلة YOLO. يركز بشكل كبير على تقليل التكرار في رأس النموذج وإزالة عنق الزجاجة الحسابي للمعالجة اللاحقة.

الميزات الرئيسية

  • تعيينات مزدوجة متسقة: يستخدم YOLOv10 استراتيجية تعيين مزدوجة أثناء التدريب—باستخدام تعيين واحد إلى متعدد للإشراف الغني وتعيين واحد إلى واحد للكفاءة. وهذا يسمح بتدريب النموذج بفعالية مع عمله بطريقة شاملة (من البداية إلى النهاية) أثناء الاستدلال.
  • تصميم الكفاءة الشاملة: تستخدم المعمارية رؤوس تصنيف خفيفة الوزن وتقليل العينات المفكك مكانيًا وقنويًا لتقليل الحمل الحسابي (FLOPs).
  • تصميم الكتل الموجه بالرتبة: لتحسين الكفاءة، يكيف YOLOv10 تصميم الكتل بناءً على مرحلة الشبكة، مما يقلل التكرار في الطبقات الأعمق.

القيود

على الرغم من كونه مبتكرًا، إلا أن YOLOv10 هو في الأساس مشروع بحث أكاديمي. يفتقر إلى دعم المهام الشامل الموجود في YOLO26 (مثل نماذج OBB أو Pose الأصلية في المستودع الرسمي) ولا يستفيد من نفس مستوى الصيانة المستمرة ودعم التكامل الذي يوفره نظام Ultralytics البيئي.

تعرف على المزيد حول YOLOv10

مقارنة فنية تفصيلية

التدريب والتحسين

يقدم YOLO26 مُحسِّن MuSGD، وهو نهج هجين يجلب ابتكارات الاستقرار من تدريب نماذج اللغة الكبيرة (LLM) إلى رؤية الكمبيوتر. وهذا يتناقض مع YOLOv10، الذي يعتمد على تقنيات التحسين القياسية. بالإضافة إلى ذلك، يستخدم YOLO26 ProgLoss (الخسارة التدريجية) لضبط أوزان الخسارة ديناميكيًا أثناء التدريب، مما يضمن تركيز النموذج على الأمثلة الأكثر صعوبة مع تقدم التدريب.

سرعة الاستدلال والنشر

يقدم كلا النموذجين استدلالًا شاملاً (من البداية إلى النهاية)، مما يزيل عنق الزجاجة الخاص بـ NMS. ومع ذلك، يذهب YOLO26 أبعد من ذلك بإزالة DFL، الذي غالبًا ما يعقد عمليات التصدير إلى CoreML أو TFLite. تُظهر المعايير أن YOLO26 يحقق سرعة استدلال أسرع بنسبة تصل إلى 43% على وحدات المعالجة المركزية (CPUs)، مما يسلط الضوء على تركيزه على النشر العملي والواقعي على الأجهزة الطرفية بدلاً من مجرد التخفيض النظري لـ FLOPs على وحدات معالجة الرسوميات (GPU).

تعدد الاستخدامات والنظام البيئي

Ultralytics YOLO26 ليس مجرد نموذج اكتشاف؛ إنه منصة. يمكن للمستخدمين التبديل بسلاسة بين مهام مثل التجزئة (Segmentation)، وتقدير الوضعيات (Pose Estimation)، وOBB باستخدام نفس واجهة برمجة التطبيقات (API).

from ultralytics import YOLO

# Load a YOLO26 model for different tasks
model_det = YOLO("yolo26n.pt")  # Detection
model_seg = YOLO("yolo26n-seg.pt")  # Segmentation
model_pose = YOLO("yolo26n-pose.pt")  # Pose Estimation

# Run inference
results = model_det("image.jpg")

في المقابل، يركز YOLOv10 بشكل أساسي على اكتشاف الكائنات، مع دعم رسمي محدود لهذه المهام اللاحقة المعقدة.

لماذا تختار Ultralytics YOLO26؟

للمطورين والشركات، يقدم YOLO26 حلاً أكثر قوة:

  1. سهولة الاستخدام: تُعد واجهة برمجة تطبيقات python وواجهة سطر الأوامر (CLI) من Ultralytics معايير صناعية للبساطة. التدريب والتحقق والتصدير هي أوامر من سطر واحد.
  2. نظام بيئي مُصان جيدًا: توفر Ultralytics تحديثات متكررة وإصلاحات للأخطاء ومجتمعًا مزدهرًا على Discord وGitHub.
  3. كفاءة التدريب: مع توفر الأوزان المُدربة مسبقًا لجميع المهام والأحجام، يكون التعلم الانتقالي سريعًا وفعالًا، ويتطلب ذاكرة GPU أقل من البدائل القائمة على المحولات مثل RT-DETR.
  4. جاهز للنشر: يضمن الدعم الشامل لتنسيقات التصدير - بما في ذلك OpenVINO وTensorRT وONNX - تشغيل نموذجك في أي مكان.

الخلاصة

بينما كانت YOLOv10 رائدة في بنية YOLO الخالية من NMS، فإن YOLO26 تُحسّن وتوسع هذا المفهوم ليصبح قوة جاهزة للإنتاج. بفضل دقتها الفائقة، وتحسيناتها المتخصصة للأجهزة الطرفية، ودعمها الشامل للمهام، تُعد YOLO26 الخيار الموصى به لتطبيقات الرؤية الحاسوبية الحديثة التي تتراوح من تحليلات المدن الذكية إلى المراقبة الزراعية.

نماذج أخرى للاستكشاف

إذا كنت مهتمًا باستكشاف خيارات أخرى ضمن نظام Ultralytics البيئي، ففكر في:

  • YOLO11: السلف الموثوق به، الذي يقدم أداءً ممتازًا للأغراض العامة.
  • YOLO-World: للكشف ذي المفردات المفتوحة حيث تحتاج إلى detect كائنات غير موجودة في بيانات التدريب الخاصة بك.
  • RT-DETR: كاشف يعتمد على المحولات لسيناريوهات الدقة العالية حيث تكون سرعة الاستدلال أقل أهمية.

تعليقات