YOLOv6.0 مقابل YOLO26: تطور الكشف عن الكائنات في الوقت الفعلي
يتميز مجال الرؤية الحاسوبية بالتطور السريع، حيث تعيد الاختراقات المعمارية باستمرار تعريف ما هو ممكن على الأجهزة الطرفية وخوادم السحابة على حد سواء. تستكشف هذه المقارنة معلمين هامين في هذه الرحلة: YOLOv6.YOLOv6، وهو كاشف صناعي قوي من Meituan، و YOLO26، وهو أحدث نموذج متطور من Ultralytics لتحقيق الكفاءة الشاملة.
YOLOv6.0: العمود الفقري للصناعة
تم إصدار YOLOv6. YOLOv6 في أوائل عام 2023، وقد تم تصميمه بهدف واحد: التطبيقات الصناعية. قام الباحثون في Meituan بتحسين هذا النموذج خصيصًا من أجل GPU ، مما جعله خيارًا شائعًا لأنظمة التصنيع عالية السرعة وأنظمة الفحص الآلي التي تعمل على أجهزة مثل NVIDIA T4.
نظرة عامة علىYOLOv6
المؤلفون: Chuyi Li، Lulu Li، Yifei Geng، Hongliang Jiang، Meng Cheng، Bo Zhang، Zaidan Ke، Xiaoming Xu، و Xiangxiang Chu
المنظمة: Meituan
التاريخ: 2023-01-13
Arxiv: YOLOv6 .0: إعادة تحميل كاملة النطاق
GitHub: YOLOv6
الميزات ونقاط القوة الرئيسية
تستفيد بنية YOLOv6 من وحدة التسلسل ثنائي الاتجاه (BiC) واستراتيجية التدريب بمساعدة المثبت (AAT). وتكمن قوتها الأساسية في هيكلها الأساسي من نوع RepVGG، الذي يسمح للنموذج بالتفرع المعقد أثناء التدريب، ولكنه يندمج في بنية بسيطة وسريعة أثناء الاستدلال.
- GPU : تم ضبط النموذج بشكل كبير لـ TensorRT ، ويتميز في السيناريوهات التي تستخدم GPU مخصصة.
- سهولة التكمية: أدخلت تقنيات التدريب المدرك للتكمية (QAT) للحفاظ على دقة عالية حتى عند الضغط إلى دقة INT8.
- التركيز الصناعي: مصمم خصيصًا للبيئات العملية التي تتسم بصرامة ميزانيات زمن الاستجابة، ولكنها تتمتع بأجهزة قوية.
ومع ذلك، فإن هذا التركيز على GPU يعني أن YOLOv6. YOLOv6 قد يكون أقل كفاءة على الأجهزة CPU مقارنة بالطرازات الأحدث المصممة لتوافق أوسع مع الأجهزة الطرفية.
YOLO26: ثورة الحافة من البداية إلى النهاية
تم إصدار Ultralytics في يناير 2026، وهو يمثل تحولًا جذريًا في بنية الكشف. من خلال التخلص من الحاجة إلى تقنية Non-Maximum Suppression (NMS)، يعمل YOLO26 على تبسيط عملية النشر بالكامل، مما يوفر تجربة أصلية شاملة تقلل من تباين زمن الاستجابة وتبسط عملية التكامل.
نظرة عامة على YOLO26
المؤلفون: Glenn Jocher و Jing Qiu
المنظمة: Ultralytics
التاريخ: 2026-01-14
المستندات: وثائقUltralytics
GitHub: ultralytics
ميزات مبتكرة
يضم YOLO26 ابتكارات من كل من الرؤية الحاسوبية وتدريب نموذج اللغة الكبيرة (LLM) لتحقيق أداء فائق:
- تصميم شامل NMS: بناءً على إرث YOLOv10، يلغي YOLO26 NMS . وينتج عن ذلك سرعات استدلال أسرع وحتمية وتبسيط منطق النشر.
- MuSGD Optimizer: مستوحى من Kimi K2 من Moonshot AI، هذا المزيج من SGD Muon يوفر استقرار تدريب LLM لمهام الرؤية، مما يضمن تقاربًا أسرع.
- سرعةCPU : مع إزالة Distribution Focal Loss (DFL) وخيارات الهندسة المعمارية المحسّنة، أصبح YOLO26 أسرع بنسبة تصل إلى 43٪ على وحدات المعالجة المركزية، مما يجعله الخيار المثالي لإنترنت الأشياء والأجهزة المحمولة والروبوتات.
- ProgLoss + STAL: تعمل وظائف الخسارة المتقدمة (الخسارة البرمجية وخسارة الهدف الناعم) على تحسين اكتشاف الأجسام الصغيرة بشكل كبير، وهو مطلب أساسي للصور الجوية والأمن.
مقارنة مقاييس الأداء
يوضح الجدول التالي الفروق في الأداء بين البنيتين. في حين أن YOLOv6. YOLOv6 لا تزال تنافسية على وحدات معالجة الرسومات (GPU)، فإن YOLO26 تظهر كفاءة فائقة، لا سيما في CPU واستخدام المعلمات.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
تحليل البيانات
يحقق YOLO26 دقة أعلى بكثير (mAP) مع ما يقرب من نصف المعلمات و FLOPs YOLOv6 المكافئة. على سبيل المثال، يصل YOLO26s إلى 48.6 mAP 9.5 مليون معلمة فقط، في حين يتطلب YOLOv6. YOLOv6 18.5 مليون معلمة للوصول إلى 45.0 mAP.
نظرة معمارية متعمقة
يكمن الاختلاف الأساسي بين هذين النموذجين في نهجهما تجاه التنبؤ والتحسين.
YOLOv6.0: محسّن لبطاقات GPU
YOLOv6 EfficientRep Backbone، وهو نظام قابل للتوازي بدرجة عالية على وحدات معالجة الرسومات (GPU). ويستخدم استراتيجية تدريب مدعومة بالمرساة تجمع بين نماذج قائمة على المراسي ونماذج خالية من المراسي لتثبيت التدريب. الاعتماد الكبير على التلافيف 3x3 يجعله سريعًا للغاية على الأجهزة التي تسرع هذه العمليات، مثل NVIDIA ولكن هذه البنية يمكن أن تكون مكلفة من الناحية الحسابية على وحدات المعالجة المركزية (CPU) أو وحدات المعالجة العصبية (NPU) التي تفتقر إلى تحسينات محددة.
YOLO26: مُحسّن لكل منصة
يتبع YOLO26 نهجًا أكثر شمولية. من خلال إزالة وحدة Distribution Focal Loss (DFL)، يتم تبسيط طبقة الإخراج، مما يساعد في التصدير إلى تنسيقات مثل CoreML و TFLite.
التصميم الشامل NMS هو الميزة البارزة. تنتج أجهزة الكشف عن الكائنات التقليدية آلاف المربعات المتداخلة التي يجب ترشيحها بواسطة NMS وهي عملية بطيئة ويصعب تحسينها على المسرعات المدمجة. يستخدم YOLO26 استراتيجية مزدوجة التعيين أثناء التدريب تجبر النموذج على توقع مربع واحد صحيح لكل كائن، مما يلغي الحاجة إلى NMS أثناء الاستدلال.
ميزة Ultralytics
في حين أن YOLOv6. YOLOv6 هو مستودع مفتوح المصدر رائع، فإن اختيار Ultralytics يوفر الوصول إلى نظام بيئي شامل يبسط دورة حياة الذكاء الاصطناعي بأكملها.
1. تجربة مستخدم سلسة
Ultralytics تجربة المطورين Ultralytics . سواء كنت تستخدم CLI Python فإن تدريب نموذج SOTA لا يتطلب سوى بضع أسطر من التعليمات البرمجية. ويتناقض سير العمل هذا "من الصفر إلى القمة" مع مستودعات الأبحاث التي تتطلب غالبًا إعدادات بيئة معقدة وتنسيقًا يدويًا للبيانات.
from ultralytics import YOLO
# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimizer automatically engaged
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
2. تنوع لا مثيل له
YOLOv6.YOLOv6 هو في الأساس نموذج للكشف عن الكائنات. في المقابل، يدعم Ultralytics مجموعة واسعة من مهام الرؤية. إذا تغيرت متطلبات مشروعك من الكشف إلى تقسيم الحالات أو تقدير الوضع، يمكنك تبديل المهام دون تغيير سير العمل أو المكتبة.
3. كفاءة التدريب والذاكرة
تم تحسين Ultralytics لتتوافق مع قيود الأجهزة. يتطلب YOLO26 عمومًا CUDA أقل أثناء التدريب مقارنة بالبنى القديمة أو الهجينة القائمة على المحولات مثل RT-DETR. وهذا يتيح للمطورين تدريب أحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين، مما يسرع دورة البحث.
4. نظام بيئي قوي
توفر Ultralytics (المعروفة سابقًا باسم HUB) واجهة قائمة على الويب لإدارة مجموعات البيانات وتدريب النماذج في السحابة ونشرها على الأجهزة الطرفية. إلى جانب عمليات التكامل مع Weights & Biasesو MLflow وغيرها، يتناسب YOLO26 بشكل طبيعي مع خطوط أنابيب MLOps الحديثة.
الخلاصة: أي نموذج يجب أن تختاره؟
اختر YOLOv6.0 إذا:
- أنت تقوم بالنشر حصريًا على وحدات معالجة الرسوماتNVIDIA أو V100.
- لديك خط أنابيب قديم تم إنشاؤه خصيصًا حول بنية RepVGG.
- تطبيقك هو اكتشاف الأجسام بشكل صارم في بيئة صناعية خاضعة للرقابة حيث لا علاقة CPU بالأمر.
اختر YOLO26 إذا:
- تحتاج إلى أفضل توازن بين السرعة والدقة عبر أجهزة متنوعة (CPU GPU NPU، الأجهزة المحمولة).
- تحتاج إلى استدلال شامل NMS من أجل منطق نشر أبسط.
- أنت تعمل على أجهزة حديثة مثل Raspberry Pi أو Jetson Nano أو الهواتف المحمولة حيث تعد CPU أمرًا بالغ الأهمية.
- أنت بحاجة إلى حل مستقبلي مدعوم بصيانة نشطة ووثائق ومجتمع مزدهر.
- يتضمن مشروعك مهام معقدة مثل OBB أو التجزئة إلى جانب الكشف.
بالنسبة لمعظم المطورين والمؤسسات التي تبدأ مشاريع جديدة اليوم، يوفر YOLO26 تنوعًا فائقًا وسهولة في الاستخدام وأداءً عاليًا، مما يجعله الخيار الموصى به لتطبيقات الرؤية الحاسوبية من الجيل التالي.
للمستخدمين المهتمين باستكشاف نماذج أخرى عالية الكفاءة، نوصي أيضًا بالاطلاع على YOLO11 للحصول على كشف قوي للأغراض العامة أو YOLO للمهام ذات المفردات المفتوحة.