YOLOv6-3.0 في مقابل DAMO-YOLO: مواجهة تقنية في اكتشاف الكائنات في الوقت الفعلي
يشهد مجال الرؤية الحاسوبية تطوراً مستمراً، حيث تدفع البنيات الجديدة حدود ما هو ممكن في اكتشاف الكائنات في الوقت الفعلي. ومن أبرز المنافسين في هذا المجال YOLOv6-3.0 و DAMO-YOLO. يقدم كلا النموذجين ابتكارات معمارية فريدة مصممة لتحقيق أقصى قدر من الأداء على الأجهزة الصناعية. يقدم هذا الدليل مقارنة تقنية شاملة بين هذين النموذجين، مع استكشاف بنيتهما ومنهجيات التدريب وحالات الاستخدام المثالية، مع تقديم مزايا الجيل التالي لنماذج Ultralytics مثل YOLO26.
ملفات تعريف النماذج
YOLOv6-3.0: إنتاجية بمستوى صناعي
تم تطوير YOLOv6-3.0 بواسطة قسم الذكاء الاصطناعي البصري في Meituan، وهو مصمم خصيصاً للتطبيقات الصناعية ذات الإنتاجية العالية. ويركز بشكل كبير على تعظيم الأداء على مسرعات الأجهزة مثل وحدات معالجة الرسومات NVIDIA.
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, وآخرون.
- المؤسسة: Meituan
- التاريخ: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
- المستندات: توثيق Ultralytics YOLOv6
يقدم YOLOv6-3.0 وحدة ربط ثنائية الاتجاه (BiC) لتحسين دمج الميزات ويستخدم استراتيجية التدريب بمساعدة المرساة (AAT). تجمع هذه الاستراتيجية بين مزايا أجهزة الكشف القائمة على المراسي أثناء التدريب، مع الحفاظ على الاستدلال بدون مراسٍ تماماً. تجعل بنية EfficientRep الخاصة به صديقة للأجهزة بشكل كبير لمعالجة الدفعات في GPU، مما يجعله مثالياً لمعالجة كميات هائلة من بيانات فهم الفيديو.
DAMO-YOLO: سريع ودقيق عبر NAS
تم إنشاء DAMO-YOLO بواسطة Alibaba Group، ويستفيد من البحث عن البنية العصبية (NAS) لاكتشاف أكثر هياكل البنية كفاءة للاستدلال في الوقت الفعلي تلقائياً.
- المؤلفون: Xianzhe Xu, Yiqi Jiang, Weihua Chen, وآخرون.
- المؤسسة: Alibaba Group
- التاريخ: 2022-11-23
- Arxiv: 2211.15444v2
- GitHub: tinyvision/DAMO-YOLO
يتميز DAMO-YOLO بشبكة هرم الميزات العامة المعاد تكييفها (RepGFPN) لدمج الميزات متعددة المقاييس بكفاءة وتصميم ZeroHead، مما يقلل بشكل كبير من العبء الحسابي في رأس الكشف. كما يتضمن تعيين تسميات AlignedOTA وتقنيات تقطير المعرفة القوية لتعزيز الدقة دون زيادة عدد معلمات النموذج.
بينما يحقق DAMO-YOLO دقة ممتازة، فإن اعتماده الكبير على تقطير المعرفة أثناء التدريب يتطلب نموذج "معلم" أكبر بكثير. هذا يزيد بشكل كبير من ذاكرة CUDA المطلوبة أثناء مرحلة التدريب مقارنة بالبنيات الأبسط.
مقارنة الأداء
عند تقييم نماذج اكتشاف الكائنات، يعد التوازن بين متوسط دقة الدقة (mAP) وسرعة الاستدلال أمراً بالغ الأهمية. فيما يلي مقارنة تفصيلية بين YOLOv6-3.0 و DAMO-YOLO عبر مقاييس نموذج مختلفة.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ملي ثانية) | السرعة T4 TensorRT10 (ملي ثانية) | المعلمات (مليون) | FLOPs (مليار) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
يُظهر YOLOv6-3.0 سرعة استثنائية على وحدات معالجة الرسومات NVIDIA باستخدام تحسينات TensorRT، خاصة في متغيراته النانو والصغيرة. ومع ذلك، تميل البنيات المحسنة بواسطة NAS في DAMO-YOLO إلى طلب عدد أقل من FLOPs على المقاييس المتوسطة والكبيرة، مما يؤدي إلى مزايا تأخير طفيفة للنشر على نطاق أوسع.
ميزة Ultralytics: دخول YOLO26
في حين أن YOLOv6-3.0 و DAMO-YOLO أدوات قوية، غالباً ما يواجه المطورون تحديات في خطوط أنابيب النشر المعقدة، ومتطلبات الذاكرة العالية أثناء التدريب، والبنيات الصارمة ذات المهمة الواحدة. يوفر نظام Ultralytics البيئي تجربة مطور مبسطة بشكل ملحوظ.
مع إصدار YOLO26، أعادت Ultralytics تعريف أحدث ما توصل إليه ذكاء الرؤية الاصطناعي. تم إطلاقه في يناير 2026، ويدفع Ultralytics YOLO26 حدود الكفاءة وتعدد الاستخدامات.
الابتكارات الرئيسية في YOLO26
- تصميم كامل بدون NMS: بالبناء على المفاهيم الرائدة في YOLOv10، يلغي YOLO26 معالجة ما بعد الكبت غير الأقصى (NMS) بشكل طبيعي. وهذا يقلل بشكل كبير من تباين التأخير ويبسط النشر على أجهزة الحافة عبر CoreML أو TFLite.
- إزالة DFL: من خلال إزالة خسارة التوزيع البؤرية (Distribution Focal Loss)، يبسط YOLO26 عملية التصدير ويعزز التوافق بشكل كبير مع وحدات التحكم الدقيقة منخفضة الطاقة وأجهزة الحافة.
- سرعة استدلال CPU تصل إلى 43% أسرع: بالنسبة للتطبيقات التي تفتقر إلى أجهزة GPU مخصصة، توفر تحسينات CPU في YOLO26 سرعة لا مثيل لها، متفوقة على النماذج التي تعتمد بشكل كبير على GPU مثل YOLOv6.
- مُحسِّن MuSGD: مستوحى من تقنيات تدريب النماذج اللغوية الكبيرة مثل Kimi K2 من Moonshot AI، يستخدم YOLO26 مُحسِّن MuSGD (هجين من SGD و Muon) لضمان تدريب مستقر وتقارب سريع.
- ProgLoss + STAL: تعمل دوال الخسارة المتقدمة على تحسين التعرف على الكائنات الصغيرة بشكل كبير، مما يجعل YOLO26 مثالياً لـ عمليات الطائرات بدون طيار وتتبع الأهداف البعيدة.
- تعدد المهام: على عكس DAMO-YOLO، الذي هو مجرد كاشف، يوفر YOLO26 دعماً جاهزاً لـ تجزئة المثيلات، و تقدير الوضع (عبر تقدير الاحتمالية اللوغاريتمية المتبقية)، و صناديق التحديد الموجهة (OBB) ضمن واجهة برمجة تطبيقات واحدة موحدة.
على عكس بنيات المحولات المعقدة مثل RT-DETR أو خطوط الأنابيب الثقيلة للتقطير في DAMO-YOLO، تشتهر نماذج Ultralytics ببصمتها المنخفضة في VRAM. يمكنك بسهولة تدريب نموذج YOLO26 على أجهزة المستهلكين العادية.
سير عمل Python مبسط
لا ينبغي أن يتطلب تدريب ونشر أحدث النماذج مئات الأسطر من الكود المتكرر. تعمل حزمة Python من Ultralytics على تبسيط دورة حياة التعلم الآلي.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model effortlessly with built-in data handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run ultra-fast inference and display results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
# Export seamlessly to ONNX or TensorRT
model.export(format="onnx")حالات الاستخدام المثالية
يعتمد اختيار البنية الصحيحة تماماً على قيود النشر الخاصة بك:
متى تستخدم YOLOv6-3.0
- تحليلات الفيديو ذات الدفعة العالية: ممتازة لمعالجة تدفقات الفيديو الكثيفة على خوادم GPU للمؤسسات حيث يمكن الاستفادة الكاملة من TensorRT.
- الأتمتة الصناعية: خطوط التصنيع عالية السرعة التي تؤدي اكتشاف العيوب في مراقبة الجودة.
متى تستخدم DAMO-YOLO
- السيليكون المخصص: بحث خرائط البحث عن البنية العصبية لأجهزة NPU محددة ومملوكة.
- البحث الأكاديمي: قياس أداء تقنيات تقطير المعرفة الجديدة للشبكات في الوقت الفعلي.
متى تستخدم Ultralytics YOLO26
- عمليات النشر على الحافة والأجهزة المحمولة: التصميم الخالي من NMS، وإزالة DFL، وزيادة سرعة CPU بنسبة 43% تجعله البطل بلا منازع لتكاملات iOS و Android و Raspberry Pi.
- النماذج الأولية السريعة للإنتاج: يتيح التكامل السلس مع منصة Ultralytics للفرق الانتقال من تعليق البيانات التوضيحي إلى النشر السحابي العالمي في أيام، وليس أشهر.
- خطوط أنابيب الرؤية المعقدة: عندما يتطلب المشروع اكتشاف صناديق التحديد جنباً إلى جنب مع نقاط مفتاح وضع الإنسان وأقنعة التجزئة الدقيقة في وقت واحد.
خاتمة
ساهم كل من YOLOv6-3.0 و DAMO-YOLO بشكل كبير في علم اكتشاف الكائنات في الوقت الفعلي. قام YOLOv6 بتنقيح تعظيم GPU، بينما عرض DAMO-YOLO قوة البحث الآلي عن البنية.
ومع ذلك، بالنسبة للمطورين الذين يبحثون عن المزيج النهائي من الدقة وسرعة الاستدلال وقابلية صيانة النظام البيئي، تظل عائلة Ultralytics YOLO الخيار الأول. مع التحسينات الرائدة التي تم تقديمها في YOLO26، لم تكن حاجز الدخول لإنشاء تطبيقات رؤية حاسوبية على مستوى المؤسسات أقل من أي وقت مضى.
لمزيد من الاستكشاف، قد تكون مهتماً أيضاً بمقارنة هذه النماذج ببنيات أخرى في وثائقنا، مثل YOLO11 أو الأساليب القائمة على المحولات مثل RT-DETR.