Meet YOLO26: next-gen vision AI.

Link to this sectionمقارنة بين YOLOv6-3.0 و YOLOv10#

لقد أصبح مشهد الرؤية الحاسوبية معقداً بشكل متزايد، مما يجعل اختيار النموذج الأمثل قراراً حاسماً للمطورين ومهندسي تعلم الآلة. عند تقييم تطور اكتشاف الأجسام ونماذج Ultralytics YOLO، من المهم فهم المقايضات بين النهج المعمارية المختلفة. يوفر هذا الدليل مقارنة تقنية شاملة بين YOLOv6-3.0 و YOLOv10، وهما نموذجان يوفران مزايا متميزة للنشر في البيئات الصناعية وعلى الحافة.

Link to this sectionاستكشاف YOLOv6-3.0: صُمم للإنتاجية الصناعية#

تم تطوير YOLOv6-3.0 لزيادة الإنتاجية في التطبيقات الصناعية من جهة الخادم، وهو يعطي الأولوية للاستنتاج السريع على مسرعات الأجهزة، وخاصة وحدات معالجة الرسومات (GPUs). ومن خلال استخدام هيكل أساسي (backbone) محسّن، يهدف النموذج إلى تحقيق توازن بين معالجة الفيديو عالية السرعة والدقة التنافسية.

المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, وآخرون. المنظمة: Meituan التاريخ: 2023-01-13 Arxiv: 2301.05586 GitHub: meituan/YOLOv6

Link to this sectionأبرز ميزات البنية#

يكمن جوهر YOLOv6-3.0 في تصميمه الصديق للأجهزة. فهو يدمج وحدة تسلسل ثنائية الاتجاه (BiC) ضمن هيكل العنق لتعزيز دمج الميزات متعددة النطاقات. بالإضافة إلى ذلك، تستفيد الشبكة من استراتيجية التدريب بمساعدة المرساة (AAT) التي تمزج بذكاء بين استقرار الكاشفات القائمة على المرساة أثناء التدريب وسرعة الاستنتاج الخاصة بنموذج خالٍ من المرساة.

يعمل هذا النموذج بفضل هيكل EfficientRep، ويتألق في مهام أتمتة التصنيع الشاقة حيث تكون المعالجة بالدفعات على أجهزة NVIDIA القوية (مثل وحدات T4 أو A100 GPUs) هي القاعدة. وبينما يعمل بشكل مثير للإعجاب في مجموعات الخوادم، فإن اعتماده على تحسينات أجهزة معينة قد يجعله أقل كفاءة على وحدات المعالجة المركزية (CPUs) للحافة ذات الطاقة المنخفضة.

اعرف المزيد حول YOLOv6

Link to this sectionاستكشاف YOLOv10: الرائد الخالي من NMS#

تم تقديمه بعد أكثر من عام، وقد غيّر YOLOv10 النموذج السائد من خلال معالجة واحدة من أكثر الاختناقات استمراراً في خطوط أنابيب الاكتشاف التقليدية: معالجة ما بعد الكبت غير الأقصى (NMS).

المؤلفون: Ao Wang, Hui Chen, Lihao Liu, وآخرون. المنظمة: جامعة تسينغhua التاريخ: 2024-05-23 Arxiv: 2405.14458 GitHub: THU-MIG/yolov10

Link to this sectionأبرز ميزات البنية#

تتمثل المساهمة الرئيسية لـ YOLOv10 في هذا المجال في تصميمه الشامل الخالي من NMS. من خلال استخدام تعيينات ثنائية متسقة أثناء التدريب، تُجبر الشبكة على إخراج مربع محيط واحد عالي الجودة لكل كائن، مما يلغي الحاجة إلى عمليات NMS القائمة على الاستدلال أثناء الاستنتاج. يقلل هذا الابتكار بشكل كبير من زمن استجابة الاستنتاج الشامل ويبسط منطق النشر على أجهزة الحافة مثل وحدات المعالجة العصبية (NPUs).

علاوة على ذلك، يتميز النموذج بتصميم كلي مدفوع بالكفاءة والدقة. ومن خلال التحسين الشامل للطبقات المختلفة، يقلل YOLOv10 بشكل كبير من التكرار الحسابي. وهذا يجعله مناسباً جداً للبيئات المحدودة الموارد، بما في ذلك المركبات ذاتية القيادة وروبوتات الحافة.

تعرف على المزيد حول YOLOv10

Link to this sectionمقارنة مفصلة للأداء#

عند مقارنة هذه النماذج، يتم قياس الأداء عادةً عبر الدقة والسرعة وكفاءة المعلمات. يوضح الجدول أدناه كيفية أداء المقاييس المختلفة لهذه المعماريات.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Link to this sectionتحليل#

يحقق YOLOv10 باستمرار متوسط دقة متوسط (mAP) متفوق عبر فئات الحجم المكافئة مقارنة بـ YOLOv6-3.0. على سبيل المثال، يصل YOLOv10n إلى 39.5% mAP بمعلمات تبلغ 2.3 مليون فقط، في حين يسجل YOLOv6-3.0n نسبة 37.5% باستخدام أكثر من ضعف عدد المعلمات. ومع ذلك، يتمكن YOLOv6-3.0n من تحقيق زمن استنتاج TensorRT أسرع قليلاً على وحدة GPU من نوع T4 (1.17 مللي ثانية)، مما يظهر تحسينه العميق لأجهزة المعالجة المتوازية.

اعتبارات النشر

بينما قد تفضل مقاييس زمن الاستجابة الخام على GPU نموذج YOLOv6 في الاختبارات الدقيقة، فإن طبيعة YOLOv10 الخالية من NMS تؤدي غالباً إلى سرعات أسرع في خطوط الأنابيب الشاملة في العالم الحقيقي، خاصة على أجهزة الحافة حيث يمكن أن تشكل معالجة ما بعد الاستنتاج اختناقاً لوحدة المعالجة المركزية (CPU).

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOv6 و YOLOv10 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOv6#

يعتبر YOLOv6 خياراً قوياً لـ:

  • النشر المدرك للأجهزة الصناعية: السيناريوهات التي يوفر فيها التصميم المدرك للأجهزة وإعادة تحديد المعلمات الفعال للنموذج أداءً محسناً على أجهزة مستهدفة محددة.
  • الكشف السريع في مرحلة واحدة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الخام على GPU لمعالجة الفيديو الفوري في بيئات خاضعة للتحكم.
  • تكامل نظام Meituan البيئي: الفرق التي تعمل بالفعل ضمن مكدس التكنولوجيا والبنية التحتية للنشر الخاصة بـ Meituan.

Link to this sectionمتى تختار YOLOv10#

يوصى باستخدام YOLOv10 في الحالات التالية:

  • الكشف الفوري بدون NMS: التطبيقات التي تستفيد من الكشف الشامل (end-to-end) بدون تقنية Non-Maximum Suppression، مما يقلل من تعقيد النشر.
  • الموازنة بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر مختلف أحجام النماذج.
  • تطبيقات زمن الاستجابة المتسق: سيناريوهات النشر التي تكون فيها أوقات الاستدلال القابلة للتنبؤ أمراً بالغ الأهمية، مثل الروبوتات أو الأنظمة ذاتية القيادة.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionميزة Ultralytics: لماذا يعتبر YOLO26 الخيار المتفوق#

بينما توفر YOLOv6-3.0 و YOLOv10 معماريات أساسية قوية، تتطلب بيئات الإنتاج الحديثة نماذج تمزج بين ذروة الدقة وسهولة الاستخدام القصوى. وهنا يتفوق إطار عمل Ultralytics YOLO26 بشكل أساسي على الإصدارات الأكاديمية المستقلة.

تم إطلاق YOLO26 في يناير 2026، وهو يدمج أفضل الابتكارات من السنوات السابقة ويغلفها في نظام بيئي يتم صيانته بدقة.

Link to this sectionابتكارات YOLO26 الرئيسية#

  • تصميم شامل خالٍ من NMS: بناءً على المفهوم الذي تم استخدامه لأول مرة في YOLOv10، يلغي YOLO26 معالجة ما بعد NMS أصلياً، مما يؤدي إلى أوقات استنتاج أكثر سلاسة وقابلية للتنبؤ والتي تعد أسهل بكثير للنقل إلى الإنتاج.
  • مُحسّن MuSGD: مستوحى من تحسينات نماذج اللغة الكبيرة مثل Kimi K2 من Moonshot AI، يضمن هذا الهجين من SGD و Muon تدريباً مستقراً بشكل لا يصدق وتقارباً أسرع بشكل كبير.
  • استنتاج أسرع على وحدة المعالجة المركزية (CPU) بنسبة تصل إلى 43%: بالنسبة لأجهزة الحافة، يتميز YOLO26 بتبسيط معماري محدد، مما يجعله متفوقاً بشكل كبير للنشر على شرائح إنترنت الأشياء (IoT) ووحدات المعالجة المركزية الاستهلاكية.
  • إزالة DFL: تعمل إزالة خسارة التوزيع البؤري (Distribution Focal Loss) على تبسيط تصدير الرأس، مما يحسن بشكل كبير التوافق مع محركات النشر منخفضة الطاقة مثل OpenVINO أو NCNN.
  • ProgLoss + STAL: تعمل تركيبات الخسارة المتقدمة على تعزيز الدقة بشكل ملحوظ في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لـ عمليات الطائرات بدون طيار (UAV) وتتبع الأهداف البعيدة.

علاوة على ذلك، وعلى عكس المستودعات أحادية المهمة، يتعامل نظام Ultralytics البيئي مع مجموعة هائلة من مهام الرؤية بشكل جاهز، بما في ذلك اكتشاف المربعات المحيطة، وتجزئة المثيلات، وتصنيف الصور، وتقدير الوضع.

Link to this sectionكفاءة التدريب وتحسين الذاكرة#

تتمثل الميزة الحاسمة لنماذج Ultralytics YOLO مقارنة بـ المعماريات القائمة على المحولات مثل RT-DETR في استهلاكها المنخفض للغاية لذاكرة CUDA أثناء التدريب. يمكن للمطور ضبط YOLO26 بسهولة على وحدة معالجة رسومات (GPU) للمستهلكين أو من خلال موارد سحابية مجانية، مما يضفي طابعاً ديمقراطياً بشكل كبير على تطوير الذكاء الاصطناعي.

Link to this sectionمثال على الكود: البدء مع YOLO26#

تسمح سهولة الاستخدام التي توفرها واجهة برمجة تطبيقات Ultralytics Python بتحميل النماذج وتدريبها واختبارها في بضعة أسطر فقط من التعليمات البرمجية.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Evaluate model performance on validation data
metrics = model.val()

# Run real-time NMS-free inference on a target image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for cross-platform deployment
model.export(format="onnx")

تعرف على المزيد حول YOLO26

Link to this sectionالخلاصة والخيارات البديلة#

عند الاختيار بين YOLOv6-3.0 و YOLOv10، يعتمد القرار على بيئة النشر. لا يزال YOLOv6-3.0 قابلاً للتطبيق لخلفيات الخوادم ذات الإنتاجية العالية والغنية بـ GPU والتي تركز على معالجة دفعات الفيديو. يوفر YOLOv10 معمارية أكثر ذكاءً وخالية من NMS ومناسبة بشكل أفضل للدقة المتوازنة وتكامل الحافة المعقد.

ومع ذلك، بالنسبة للمطورين الذين يبحثون عن أداء بدون تنازلات مدعوماً بتوثيق شامل، وتسجيل سحابي عبر منصة Ultralytics، وتعدد مهام متعدد الاستخدامات، فإن YOLO26 هو التوصية النهائية.

بالنسبة لمتطلبات البنية التحتية القديمة، قد تبحث الفرق أيضاً في الجيل السابق Ultralytics YOLO11، أو استكشاف YOLO-World للحصول على قدرات اكتشاف فريدة للمفردات المفتوحة.

التعليقات