YOLOv6.0 مقابلYOLO: مواجهة تقنية في مجال الكشف عن الأجسام في الوقت الفعلي
يتطور مجال الرؤية الحاسوبية باستمرار، حيث توسع البنى الجديدة حدود ما هو ممكن في مجال الكشف عن الأجسام في الوقت الفعلي. يعد YOLOv6. YOLOv6 وYOLO منافسين بارزين في هذا المجال. يقدم كلا النموذجين ابتكارات معمارية فريدة مصممة لتحقيق أقصى قدر من الأداء على الأجهزة الصناعية. يقدم هذا الدليل مقارنة تقنية شاملة بين هذين النموذجين، ويستكشف هندستهما ومنهجيات التدريب وحالات الاستخدام المثالية، مع تقديم مزايا الجيل التالي من Ultralytics مثل YOLO26.
ملفات تعريف النماذج
YOLOv6.0: إنتاجية على مستوى صناعي
تم تطوير YOLOv6. YOLOv6 بواسطة قسم Vision AI في Meituan، وهو مصمم خصيصًا للتطبيقات الصناعية عالية الإنتاجية. ويركز بشكل كبير على تعظيم الأداء على مسرعات الأجهزة مثل NVIDIA .
- المؤلفون: تشوي لي، لولو لي، ييفي جينغ، وآخرون.
- المنظمة: ميتوان
- التاريخ: 2023-01-13
- أرخايف:2301.05586
- GitHub:meituan/YOLOv6
- الوثائق:وثائق Ultralytics YOLOv6
يقدم YOLOv6 وحدة تسلسل ثنائي الاتجاه (BiC) لتحسين دمج الميزات ويستخدم استراتيجية التدريب بمساعدة المثبت (AAT). تجمع هذه الاستراتيجية بين مزايا أجهزة الكشف القائمة على المثبت وأجهزة الكشف الخالية من المثبت أثناء التدريب، مع الحفاظ على الاستدلال خالياً تماماً من المثبت. يجعله العمود الفقري EfficientRep سهل الاستخدام للغاية مع GPU ، مما يجعله مثالياً لمعالجة كميات هائلة من بيانات فهم الفيديو.
YOLO: سريع ودقيق عبر NAS
تم إنشاءYOLO بواسطة Alibaba Group،YOLO Neural Architecture Search (NAS) لاكتشاف الهياكل الأساسية الأكثر كفاءة للاستدلال في الوقت الفعلي.
- المؤلفون: شيانزه شو، يي تشي جيانغ، ويهوا تشن، وآخرون.
- المنظمة: مجموعة علي بابا
- التاريخ: 2022-11-23
- Arxiv:2211.15444v2
- GitHub:tinyvision/DAMO-YOLO
YOLO بشبكة RepGFPN (شبكة هرمية معممة معاد معايرتها) لدمج الميزات متعددة المقاييس بكفاءة وتصميم ZeroHead الذي يقلل بشكل كبير من الحمل الحسابي في رأس الكشف. كما أنه يشتمل على تعيين علامات AlignedOTA وتقنيات تقطير المعرفة القوية لتعزيز الدقة دون زيادة عدد معلمات النموذج.
تقطير علوي
بينماYOLO دقة ممتازة، فإن اعتماده الكبير على تقطير المعرفة أثناء التدريب يتطلب نموذج "مدرس" أكبر بكثير. وهذا يزيد بشكل كبير من CUDA المطلوبة أثناء مرحلة التدريب مقارنة بالبنى الأبسط.
مقارنة الأداء
عند تقييم نماذج الكشف عن الأجسام، من المهم تحقيق التوازن بين متوسط الدقة (mAP) وسرعة الاستدلال. فيما يلي مقارنة مفصلة بين YOLOv6.0 وYOLO نماذج مختلفة.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
يُظهر YOLOv6.0 سرعة استثنائية على NVIDIA باستخدام TensorRT ، خاصة في إصداراته النانوية والصغيرة. ومع ذلك، فإن البنية الأساسية المُحسّنة لـ NASYOLO تتطلب عادةً عددًا أقل من FLOPs على النطاقات المتوسطة والكبيرة، مما ينتج عنه مزايا طفيفة في زمن الاستجابة بالنسبة للعمليات النشر الأكبر حجمًا.
ميزة Ultralytics: تقديم YOLO26
على الرغم منYOLO YOLOv6. YOLOv6 وYOLO أدواتYOLO المطورين غالبًا ما يواجهون تحديات تتعلق بخطوط الإنتاج المعقدة، ومتطلبات الذاكرة العالية أثناء التدريب، والبنى الصارمة أحادية المهام. يوفر Ultralytics بيئة عمل أكثر بساطة للمطورين.
مع إصدار YOLO26، Ultralytics تعريف أحدث تقنيات الذكاء الاصطناعي في مجال الرؤية. تم إصدار Ultralytics في يناير 2026، وهو يوسع حدود الكفاءة والتنوع.
الابتكارات الرئيسية في YOLO26
- تصميم شامل NMS: بناءً على المفاهيم الرائدة في YOLOv10، يزيل YOLO26 بشكل أساسي المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يقلل بشكل كبير من تباين زمن الاستجابة ويبسط النشر على الأجهزة الطرفية عبر CoreML أو TFLite.
- إزالة DFL: من خلال إزالة Distribution Focal Loss (فقدان بؤرة التوزيع)، يبسط YOLO26 عملية التصدير ويعزز بشكل كبير التوافق مع وحدات التحكم الدقيقة منخفضة الطاقة والأجهزة الطرفية.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : بالنسبة للتطبيقات التي تفتقر إلى GPU مخصصة، توفر CPU في YOLO26 سرعة لا مثيل لها، متفوقةً على النماذج GPU بشكل كبير GPU مثل YOLOv6.
- مُحسّن MuSGD: مستوحى من تقنيات تدريب LLM مثل Kimi K2 من Moonshot AI، يستخدم YOLO26 مُحسّن MuSGD (مزيج من SGD Muon) لضمان تدريب مستقر وتقارب سريع.
- ProgLoss + STAL: تعمل وظائف الخسارة المتقدمة على تحسين التعرف على الأجسام الصغيرة بشكل كبير، مما يجعل YOLO26 مثاليًا لعمليات الطائرات بدون طيار وتتبع الأهداف البعيدة.
- تعدد المهام: على عكسYOLO الذي هو مجرد كاشف، يوفر YOLO26 دعمًا جاهزًا لتقسيم المثيلات وتقدير الوضع (عبر تقدير الاحتمالية المتبقية) ومربعات الحدود الموجهة (OBB) ضمن واجهة برمجة تطبيقات واحدة وموحدة.
تدريب فعال من حيث الاستهلاك للذاكرة
على عكس هياكل المحولات المعقدة مثل RT-DETR أو خطوط الأنابيب الثقيلةYOLO، تشتهر Ultralytics بانخفاض مساحة VRAM التي تشغلها. يمكنك بسهولة تدريب نموذج YOLO26 على أجهزة من فئة المستهلكين.
Python مبسط
لا ينبغي أن يتطلب تدريب ونشر النماذج الحديثة مئات الأسطر من التعليمات البرمجية النمطية. تعملPython Ultralytics Python على تبسيط دورة حياة التعلم الآلي.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model effortlessly with built-in data handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run ultra-fast inference and display results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
# Export seamlessly to ONNX or TensorRT
model.export(format="onnx")
حالات الاستخدام المثالية
يعتمد اختيار البنية المناسبة بشكل كامل على قيود النشر لديك:
متى تستخدم YOLOv6.0
- تحليلات الفيديو عالية الدقة: ممتازة لمعالجة تدفقات الفيديو الكثيفة على GPU المؤسسية حيث TensorRT الاستفادة الكاملة من TensorRT .
- الأتمتة الصناعية: خطوط إنتاج عالية السرعة تقوم بفحص الجودة والكشف عن العيوب.
متى تستخدم DAMO-YOLO
- السيليكون المخصص: البحث في البحث عن البنية العصبية لخرائط محددة ومملوكة لأجهزة NPU.
- البحث الأكاديمي: قياس أداء تقنيات جديدة لتقطير المعرفة للشبكات في الوقت الحقيقي.
متى تستخدم Ultralytics
- التطبيقات المتطورة والمتنقلة: التصميم NMS وإزالة DFL وزيادة CPU بنسبة 43٪ تجعله البطل بلا منازع لتكامل iOS Android وRaspberry Pi.
- النماذج الأولية السريعة للإنتاج: يتيح التكامل السلس مع Ultralytics للفرق الانتقال من تعليق مجموعات البيانات إلى النشر السحابي العالمي في غضون أيام، وليس أشهر.
- خطوط الرؤية المعقدة: عندما يتطلب المشروع الكشف عن المربعات المحيطة جنبًا إلى جنب مع نقاط مفتاحية لوضعية الإنسان وأقنعة تقسيم دقيقة في وقت واحد.
الخلاصة
YOLO كل من YOLOv6. YOLOv6 وYOLO بشكل كبير في علم الكشف عن الأجسام في الوقت الفعلي. YOLOv6 GPU بينماYOLO قوة البحث الآلي عن البنية.
ومع ذلك، بالنسبة للمطورين الذين يبحثون عن المزيج المثالي بين الدقة وسرعة الاستدلال وقابلية صيانة النظام البيئي، فإن Ultralytics YOLO هي الخيار الأول. بفضل التحسينات الرائدة التي أدخلت على YOLO26، أصبح إنشاء تطبيقات الرؤية الحاسوبية على مستوى المؤسسات أسهل من أي وقت مضى.
لمزيد من الاستكشاف، قد تكون مهتمًا أيضًا بمقارنة هذه النماذج مع بنى أخرى في وثائقنا، مثل YOLO11 أو النهج القائمة على المحولات مثل RT-DETR.