Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 مقابل YOLOv9#

لقد اتسم تطور الرؤية الحاسوبية في الوقت الفعلي بإنجازات مستمرة في السرعة والدقة والكفاءة الهيكلية. عند تقييم الحلول الحديثة للنشر القادم، فإن مقارنة YOLOv10 و YOLOv9 تقدم نظرة رائعة على نهجين متميزين لحل اختناقات التعلم العميق. بينما يركز YOLOv9 على زيادة تدفق معلومات التدرج إلى أقصى حد أثناء التدريب، يبتكر YOLOv10 تصميمًا أصليًا من البداية إلى النهاية يلغي تمامًا عقبات المعالجة اللاحقة التقليدية.

يحلل هذا الدليل الشامل ابتكاراتها الهيكلية ومقاييس الأداء وحالات الاستخدام المثالية لمساعدة المطورين والباحثين على اختيار النموذج الأمثل لمهام الرؤية الحاسوبية المحددة الخاصة بهم.

Link to this sectionYOLOv10: الرائد في التصميم الشامل بدون NMS#

تم تطوير YOLOv10 لمعالجة اختناقات زمن الاستجابة في كاشفات الكائنات التقليدية، ويقدم بنية ثورية شاملة تزيل أصليًا الحاجة إلى كبح الحد الأقصى غير (NMS).

التفاصيل الفنية والنسب:

تعرف على المزيد حول YOLOv10

Link to this sectionالمعمارية ونقاط القوة#

أهم مساهمة لـ YOLOv10 في هذا المجال هي استراتيجية التعيين المزدوج المتسقة للتدريب بدون NMS. من خلال القضاء على NMS، يقلل النموذج بشكل كبير من زمن استجابة الاستدلال، خاصة على أجهزة الحافة حيث يمكن للمعالجة اللاحقة أن تعيق خط الأنابيب بالكامل. إنه يحسن المكونات المختلفة من منظور الكفاءة والدقة، مما يؤدي إلى نموذج يفتخر بـ مقايضة رائعة بين السرعة والمعلمات. على سبيل المثال، يعتبر متغير YOLOv10-S سريعًا بشكل استثنائي، مما يجعله مناسبًا للغاية لـ تحليلات الفيديو عالية السرعة والملاحة الروبوتية في الوقت الفعلي.

Link to this sectionنقاط الضعف#

على الرغم من أن التصميم الخالي من NMS يعد ابتكارًا رائدًا لاكتشاف المربعات المحيطة، إلا أن YOLOv10 مُحسَّن في المقام الأول ككاشف كائنات نقي. إنه يفتقر إلى التنوع الجاهز للأنظمة البيئية الأحدث التي تدعم أصليًا تجزئة المثيل أو تقدير الوضع. علاوة على ذلك، تتطلب التنفيذات المبكرة معالجة دقيقة للتصدير لضمان تحسين العمليات مثل cv2 بالكامل خارج رسم بياني الاستدلال.

تصدير YOLOv10

عند إعداد YOLOv10 للإنتاج، تأكد دائمًا من تصدير النموذج إلى تنسيقات محسنة مثل TensorRT أو ONNX. قد يؤدي تشغيل أوزان PyTorch الخام في النشر إلى استدلال أبطأ من المتوقع بسبب عمليات الرسم البياني غير المحسنة.

Link to this sectionYOLOv9: معلومات التدرج القابلة للبرمجة#

قبل YOLOv10، قدم YOLOv9 مفاهيم هيكلية جديدة لحل مشكلة اختناق المعلومات المتأصلة في الشبكات العصبية العميقة، مما يسمح باستخدام فعال للغاية للمعلمات.

التفاصيل الفنية والنسب:

اعرف المزيد عن YOLOv9

Link to this sectionالمعمارية ونقاط القوة#

يقدم YOLOv9 معلومات التدرج القابلة للبرمجة (PGI) جنبًا إلى جنب مع شبكة تجميع الطبقات الفعالة المعممة (GELAN). تضمن PGI عدم ضياع معلومات الهدف الحاسمة أثناء مرور البيانات عبر الطبقات العميقة للشبكة، مما يولد تدرجات موثوقة لتحديثات الأوزان. تعمل GELAN على زيادة كفاءة معلمات الشبكة. معًا، تسمح هذه الابتكارات لـ YOLOv9 بتحقيق متوسط دقة عالٍ للغاية (mAP) على مجموعة بيانات MS COCO، وغالبًا ما تتفوق على النماذج الأثقل مع استخدام عدد أقل من FLOPs. إنه نموذج استثنائي للباحثين الذين يركزون على تعظيم مقاييس الدقة النظرية.

Link to this sectionنقاط الضعف#

على الرغم من دقته العالية، لا يزال YOLOv9 يعتمد على معالجة NMS اللاحقة القياسية. هذا يعني أنه بينما تكون عمليات الشبكة العصبية سريعة، يمكن أن تؤدي تصفية المربع المحيط النهائي إلى زمن استجابة متغير اعتمادًا على كثافة الكائنات في المشهد. بالإضافة إلى ذلك، يمكن أن تكون عملية التدريب الخاصة به كثيفة الاستخدام للذاكرة مقارنة بالنماذج اللاحقة، مما يتطلب موارد GPU أكثر قوة لضبط مجموعة البيانات المخصصة.

Link to this sectionمقارنة الأداء#

يوضح الجدول أدناه المقاييس الأساسية لكلا النموذجين. لاحظ كيف يحقق YOLOv10 عادةً زمن استجابة أقل عبر TensorRT، بينما يدفع YOLOv9 حدود الدقة القصوى في أكبر تكوين له.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Link to this sectionالجيل القادم: لماذا تعتبر YOLO26 التوصية النهائية#

بينما يعد YOLOv9 و YOLOv10 إنجازين مثيرين للإعجاب، يتحرك مشهد التعلم الآلي بسرعة. بالنسبة لبيئات الإنتاج الحديثة، يعتمد المطورون بشكل متزايد على النظام البيئي المتكامل والمصان جيدًا لـ منصة Ultralytics. اعتبارًا من عام 2026، التوصية الواضحة لكل من البحث والمؤسسات هي YOLO26 التي تم إصدارها حديثًا.

تأخذ YOLO26 المفاهيم الأساسية لأسلافها وترتقي بها من خلال تجربة مستخدم مبسطة، وAPI بسيط، ومتطلبات ذاكرة أقل بشكل استثنائي أثناء التدريب مقارنة بالبنى الضخمة القائمة على Transformer.

Link to this sectionالابتكارات الرئيسية في YOLO26#

  • تصميم شامل بدون NMS: بناءً على إنجازات YOLOv10، تعد YOLO26 أصلية من البداية إلى النهاية، مما يلغي تمامًا معالجة NMS اللاحقة لنشر أبسط وملفات تعريف زمن استجابة حتمية للغاية.
  • استدلال أسرع بنسبة تصل إلى 43% على CPU: مُحسَّنة لـ Edge AI خارج الصندوق، مما يجعلها الخيار الأمثل للأنظمة المدمجة التي تفتقر إلى GPUs مخصصة.
  • محسن MuSGD: هجين رائد من SGD و Muon (مستوحى من تحسينات نماذج اللغات الكبيرة)، مما يضمن عمليات تدريب مستقرة للغاية وأوقات تقارب سريعة بشكل لا يصدق.
  • إزالة DFL: من خلال إزالة Distribution Focal Loss، تبسط YOLO26 عملية تصدير النموذج، مما يعزز بشكل كبير التوافق مع الأجهزة منخفضة الطاقة وأطر عمل نشر الحافة المختلفة.
  • تحسينات خاصة بالمهمة: على عكس الكاشفات المتخصصة ذات المهمة الواحدة، تعد YOLO26 قوة متعددة الاستخدامات. إنها تستخدم خسارة التجزئة الدلالية لدقة مستوى البكسل المحسنة، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتقدير الوضع الخالي من العيوب، وخسارة زاوية متخصصة لحل مشكلات حدود OBB (مربع محيط موجه).
ميزة نظام Ultralytics البيئي

يوفر اختيار نموذج Ultralytics مثل YOLO11 أو YOLO26 سهولة استخدام لا تضاهى. يمكنك الوصول إلى التطوير النشط، ومجتمع مزدهر، وتحديثات متكررة تضمن بقاء نماذجك متوافقة مع أحدث محركات الاستدلال مثل OpenVINO و CoreML.

Link to this sectionالتنفيذ العملي#

تدريب هذه النماذج ونشرها أمر مباشر باستخدام Python SDK. يوضح المثال التالي كيفية الاستفادة من عمليات التدريب عالية الكفاءة للنظام البيئي لـ Ultralytics، والذي يتعامل تلقائيًا مع جدولة المعلمات الفائقة وتخصيص الذاكرة الأمثل.

from ultralytics import YOLO

# Load the recommended state-of-the-art model
model = YOLO("yolo26n.pt")  # Also compatible with 'yolov10n.pt' or 'yolov9c.pt'

# Train the model efficiently on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0, batch=16)

# Run ultra-fast inference
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for simplified edge deployment
model.export(format="onnx")

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOv10 و YOLOv9 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOv10#

يعد YOLOv10 خياراً قوياً لـ:

  • الكشف الفوري بدون NMS: التطبيقات التي تستفيد من الكشف الشامل (end-to-end) بدون تقنية Non-Maximum Suppression، مما يقلل من تعقيد النشر.
  • الموازنة بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر مختلف أحجام النماذج.
  • تطبيقات زمن الاستجابة المتسق: سيناريوهات النشر التي تكون فيها أوقات الاستدلال القابلة للتنبؤ أمراً بالغ الأهمية، مثل الروبوتات أو الأنظمة ذاتية القيادة.

Link to this sectionمتى تختار YOLOv9#

يوصى بـ YOLOv9 لـ:

  • أبحاث اختناق المعلومات: المشاريع الأكاديمية التي تدرس معمارية معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
  • دراسات تحسين تدفق التدرج: الأبحاث التي تركز على فهم وتخفيف فقدان المعلومات في طبقات الشبكة العميقة أثناء التدريب.
  • قياس أداء الكشف عالي الدقة: السيناريوهات التي تكون فيها أداء معيار COCO القوي لـ YOLOv9 مطلوباً كنقطة مرجعية للمقارنات المعمارية.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionالخلاصة#

يوفر كل من YOLOv9 و YOLOv10 مزايا فريدة. YOLOv9 هو دليل على زيادة كفاءة معلمات الشبكة وتدفق التدرج النظري إلى أقصى حد، مما يؤدي إلى دقة من الدرجة الأولى. وفي الوقت نفسه، يعمل YOLOv10 كرائد أكاديمي لاكتشاف المربعات المحيطة من البداية إلى النهاية بدون عقوبة زمن استجابة NMS.

ومع ذلك، بالنسبة للمطورين الذين يبحثون عن التوازن المثالي بين الأداء والتنوع وسهولة الاستخدام، فإن الترقية إلى أحدث النماذج أمر بالغ الأهمية. بفضل محسن MuSGD المتقدم، ووظيفة ProgLoss + STAL لاكتشاف الأجسام الصغيرة بشكل متفوق، ودعم المهام المتعددة الشامل، تمثل YOLO26 الحل النهائي الأحدث لأي تحدي رؤية حاسوبية في العالم الحقيقي.

المساهمون

التعليقات