تخطي إلى المحتوى

YOLO26 مقابل YOLOv6.0: دليل شامل لاكتشاف الكائنات في الوقت الفعلي

تستمر سرعة تطور الرؤية الحاسوبية في التزايد، مما يوفر للمطورين أدوات جديدة قوية لتطبيقات التعلم الآلي. غالبًا ما يحدد اختيار البنية المناسبة للنشر نجاح المشروع. في هذه المقارنة الفنية، سوف نستكشف الاختلافات الرئيسية بين YOLO26 المتطورة و YOLOv6. YOLOv6 الصناعية للغاية، ونقيّم بنيتيهما ومنهجيات التدريب وسيناريوهات النشر المثالية.

أصول النموذج وتفاصيله

قبل الخوض في مقاييس الأداء، من المفيد فهم الخلفية وتركيز التطوير وراء هذين النموذجين القويين للرؤية.

YOLO26

تعرف على المزيد حول YOLO26

YOLOv6-3.0

  • المؤلفون: تشوي لي، لولو لي، ييفي جينغ، هونغليانغ جيانغ، منغ تشنغ، بو تشانغ، زيدان كي، شياومينغ شو، وشيانغشيانغ تشو
  • المنظمة: Meituan
  • التاريخ: 2023-01-13
  • أرشيف: ورقة YOLOv6 v3.0
  • GitHub: مستودعYOLOv6
  • المستندات: YOLOv6

تعرف على المزيد حول YOLOv6-3.0

الابتكارات والاختلافات المعمارية

تم تصميم كلا النموذجين لـ الكشف عن الكائنات عالي السرعة، لكنهما يتبعان مقاربات مختلفة تمامًا لتحقيق أدائهما.

Ultralytics : النموذج الأصلي الشامل الذي يركز على الحافة

تم إصدار YOLO26 في أوائل عام 2026، وهو يمثل قفزة هائلة إلى الأمام في كفاءة النموذج. وأهم تحديث في البنية هو تصميمه الأصلي NMS من البداية إلى النهاية. من خلال التخلص من خطوة المعالجة اللاحقة التقليدية لـ Non-Maximum Suppression (NMS) — وهو مفهوم تم تطويره بنجاح في YOLOv10— يقلل YOLO26 بشكل كبير من تقلب زمن الاستجابة، مما يجعله قابلاً للتنبؤ بدرجة عالية في عمليات النشر في الوقت الفعلي.

بالإضافة إلى ذلك، يتميز YOLO26 بـ إزالة DFL. من خلال إزالة Distribution Focal Loss، يبسط النموذج عملية التصدير الخاصة به ويعزز بشكل كبير التوافق مع أجهزة الحوسبة الطرفية منخفضة الطاقة. وينتج عن ذلك ما يصل إلى 43% استدلال أسرع لوحدة المعالجة المركزية (CPU)، مما يجعل YOLO26 قوة مطلقة للبيئات التي لا تحتوي على وحدات معالجة رسوميات (GPUs) مخصصة مثل Raspberry Pi أو الأجهزة المحمولة.

YOLOv6.0: المتخصص الصناعي

تم تطوير YOLOv6. YOLOv6 بواسطة فريق الرؤية في Meituan، وهو عبارة عن شبكة CNN صناعية عالية الكفاءة ومُحسّنة بشكل كبير من أجل TensorRT على NVIDIA . يعتمد بشكل كبير على تقنيات التقطير الذاتي وتصميم بنية عصبية مدركة للأجهزة. على الرغم من سرعته المذهلة على وحدات معالجة الرسومات T4 أو A100 الثقيلة، إلا أنه يعتمد على NMS التقليدية، والتي يمكن أن تسبب اختناقات في بيئات الأجهزة المقيدة.

توازن الأداء والمعايير

الاختبار الحقيقي لأي نموذج هو كيفية موازنته بين متوسط الدقة (mAP) وسرعة الاستدلال وعدد المعلمات. تشتهر Ultralytics بمتطلباتها الاستثنائية من الذاكرة وتوازن أدائها، وغالبًا ما تتفوق على النماذج القائمة على المحولات التي تتطلب CUDA ضخمة.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

كما يتضح من البيانات، يحقق YOLO26 باستمرار قيمة mAP أعلى بنحو نصف عدد المعلمات مقارنة بنظرائه من YOLOv6. على سبيل المثال، يتفوق YOLO26s على YOLOv6-3.0s بـ 3.6 نقطة mAP مع استخدام ما يقرب من نصف المعلمات (9.5 مليون مقابل 18.5 مليون).

كفاءة الذاكرة

يعني انخفاض عدد المعلمات وعمليات FLOP في YOLO26 انخفاضًا كبيرًا في استخدام الذاكرة أثناء التدريب والاستدلال مقارنةً بـ YOLOv6، مما يسمح بأحجام دفعات أكبر على الأجهزة الاستهلاكية القياسية.

كفاءة التدريب ومنهجياته

تختلف منهجيات التدريب بشكل كبير بين الإطارين. يقدم YOLO26 محسن MuSGD، وهو مزيج من SGD Muon مستوحى من Kimi K2 من Moonshot AI. وهذا يجلب ابتكارات تدريب LLM مباشرة إلى الرؤية الحاسوبية، مما يؤدي إلى تدريب أكثر استقرارًا ومعدلات تقارب سريعة للغاية.

علاوة على ذلك، يستخدم YOLO26 وظائف الخسارة ProgLoss + STAL. توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية للذكاء الاصطناعي في الزراعة وصور الطائرات بدون طيار على ارتفاعات عالية.

على النقيض، يستخدم YOLOv6-3.0 استراتيجية تقطير ذاتي مكثفة. على الرغم من فعاليتها، إلا أنها تتطلب عمومًا جداول تدريب أطول ومزيدًا من الأعباء الحسابية للوصول إلى الدقة المثلى.

النظام البيئي وسهولة الاستخدام

واحدة من أكبر مزايا اختيار YOLO26 هي النظام البيئي الجيد الصيانة Ultralytics . Ultralytics بسهولة استخدامها "من الصفر إلى القمة". يمكن للمطورين تثبيت Python والبدء في التدريب في غضون دقائق.

في المقابل، YOLOv6 استنساخ مستودع الأبحاث وإدارة التبعيات يدويًا والتنقل بين نصوص تشغيل معقدة، مما قد يبطئ عملية النشر بالنسبة لفرق الهندسة سريعة الوتيرة.

مثال على الكود: البدء مع YOLO26

يعد التدريب وتشغيل الاستدلال باستخدام Ultralytics أمرًا بسيطًا للغاية. تتولى Python القوية جميع المهام الصعبة:

from ultralytics import YOLO

# Load the highly efficient YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run end-to-end NMS-free inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export seamlessly to ONNX for CPU deployment
model.export(format="onnx")

تنوع لا مثيل له في مهام الرؤية

في حين أن YOLOv6. YOLOv6 هو مجرد كاشف كائنات مربع حدودي، فإن YOLO26 يتميز بتنوع مذهل. باستخدام نفس واجهة برمجة التطبيقات البسيطة، يمكن للمطورين إجراء تقسيم المثيلات وتصنيف الصور وتقدير الوضع وكشف المربع الحدودي الموجه (OBB).

يتضمن YOLO26 تحسينات محددة للمهام على جميع الأصعدة، مثل فقدان التجزئة الدلالية لإخفاء البكسلات بشكل مثالي، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لنقاط مرجعية فائقة الدقة، وفقدان الزاوية المتخصص لحل مشكلات حدود OBB.

حالات الاستخدام المثالية

متى تستخدم YOLO26

YOLO26 هو البطل بلا منازع في مجال الأجهزة الطرفية وإنترنت الأشياء (IoT) والروبوتات. بفضل CPU التي تزيد بنسبة 43٪ وبنيته NMS فإنه مثالي لأنظمة الإنذار الأمني في الوقت الفعلي التي تعمل على وحدات المعالجة المركزية القياسية أو رقائق ARM منخفضة الطاقة. كما أن قدرته الفائقة على اكتشاف الأجسام الصغيرة (بفضل ProgLoss + STAL) تجعله الخيار المثالي لاكتشاف الحيوانات البرية من الجو وتحليل الصور الملتقطة بالأقمار الصناعية.

متى تستخدم YOLOv6.0

يتميز YOLOv6.YOLOv6 في البيئات الصناعية الخاضعة لرقابة صارمة حيث تكون الخوادم مزودة NVIDIA متطورة (مثل T4 أو A100) تعمل على TensorRT محسّنة للغاية. وهو مناسب للغاية لاكتشاف العيوب في خطوط الإنتاج عالية السرعة حيث تكون بيئة الأجهزة ثابتة وتكون تباينات NMS مقبولة.

استكشاف نماذج أخرى

إذا كنت تستكشف المجال الأوسع للرؤية الحاسوبية، فقد تهتم أيضًا بنماذج أخرى تدعمها Ultralytics . على سبيل المثال، YOLO11 لا يزال نموذجًا رائعًا للأغراض العامة يحظى بدعم كبير من المجتمع. إذا كنت مهتمًا بشكل خاص بهياكل المحولات، فإن RT-DETR أداءً قويًا قائمًا على الانتباه، على الرغم من أنه يتطلب ذاكرة تدريب أكبر بكثير من YOLO26. للحصول على إمكانات بدون تدريب، يوفر YOLO إمكانية الكشف الفوري عن المفردات المفتوحة.

ملخص

يمثل كل من YOLOv6-3.0 وYOLO26 إنجازات هندسية هائلة. ومع ذلك، بالنسبة للتطبيقات الحديثة التي تتطلب تطويرًا سريعًا، ونفقات ذاكرة منخفضة، ونشرًا سلسًا عبر الأجهزة الطرفية غير المتجانسة، فإن Ultralytics YOLO26 هو الخيار الأفضل. فبفضل تصميمه الشامل الأصيل، ومُحسِّن MuSGD الثوري، وتكامله مع نظام Ultralytics البيئي القوي، يمكن للفرق إطلاق حلول الذكاء الاصطناعي البصري المتطورة في الإنتاج بشكل أسرع من أي وقت مضى.


تعليقات