DAMO-YOLO في مواجهة YOLOv6-3.0: مقارنة شاملة لكاشفات الكائنات الصناعية

أنتج التطور السريع للرؤية الحاسوبية بنيات عالية التخصص مصممة للتطبيقات الصناعية. ومن بينها، يبرز نموذجان قويان لتركيزهما على الأداء في الوقت الفعلي وكفاءة النشر، وهما: DAMO-YOLO و YOLOv6-3.0. توفر هذه الصفحة مقارنة تقنية متعمقة لبنيتيهما ومقاييس الأداء ومنهجيات التدريب لمساعدتك في اتخاذ قرارات النشر الخاصة بك.

DAMO-YOLO: عندما يلتقي البحث عن البنية العصبية (NAS) مع اكتشاف الكائنات

قدم باحثون في مجموعة Alibaba نموذج DAMO-YOLO، وهو نهج مبتكر لعائلة YOLO من خلال دمج البحث عن البنية العصبية (NAS) بشكل مكثف في تصميم هيكله الأساسي (backbone).

الابتكارات المعمارية

يستخدم DAMO-YOLO هيكلاً أساسياً مُحسَّناً بواسطة NAS يُسمى MAE-NAS، والذي يبحث تلقائياً عن هياكل الشبكة المثلى في ظل قيود زمن استجابة محددة. يضمن هذا توسع النموذج بكفاءة عبر ملفات تعريف الأجهزة المختلفة. ولتحسين دمج الميزات، تستخدم البنية نموذج Efficient RepGFPN (شبكة هرمية للميزات العامة مُعاد تحديد معالمها)، مما يعزز تمثيل المقاييس المتعددة بشكل كبير.

علاوة على ذلك، يقدم النموذج تصميم "ZeroHead". فمن خلال إزالة هياكل الفروع المتعددة والمعقدة في رأس الاكتشاف، فإنه يحافظ على المعلومات المكانية بفعالية أكبر مع تقليل العبء الحسابي. كما تستفيد منهجية التدريب من AlignedOTA (تخصيص النقل الأمثل المحاذي) وتقطير المعرفة القوي، مما يسمح للنماذج الطالبة الأصغر بالتعلم من الشبكات المعلمة الأضخم.

تعرف على المزيد حول DAMO-YOLO

تعقيد التقطير

بينما يساعد تقطير المعرفة نموذج DAMO-YOLO على تحقيق دقة عالية، فإنه يتطلب خط أنابيب تدريب متعدد المراحل. وهذا يزيد بشكل كبير من حوسبة GPU المطلوبة مقارنة بتدريب النماذج القياسية أحادية المرحلة.

YOLOv6-3.0: تعظيم الإنتاجية الصناعية

تم تطوير YOLOv6-3.0 بواسطة قسم Vision AI في Meituan، ويُصنف صراحةً ككاشف كائنات صناعي، تم تصميمه خصيصاً لتعظيم الإنتاجية على أجهزة NVIDIA.

  • المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, and Xiangxiang Chu
  • المنظمة: Meituan
  • التاريخ: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

الميزات الرئيسية والتحسينات

تم بناء YOLOv6-3.0 على الهيكل الأساسي EfficientRep المتوافق مع الأجهزة، مما يجعله سريعاً بشكل استثنائي عند الاستفادة من تحسينات مثل TensorRT على وحدات GPU الحديثة. وفي إصدار v3.0، تدمج الشبكة وحدة التسلسل ثنائي الاتجاه (BiC) لتحسين تحديد موقع الكائنات ذات الأحجام المتفاوتة.

ميزة بارزة أخرى هي استراتيجية التدريب المعتمد على الركائز (AAT). تجمع AAT بين استقرار الكاشفات المعتمدة على الركائز أثناء التدريب وسرعة الاستدلال للتصميم الخالي من الركائز. هذا النهج الهجين يؤدي إلى تقارب ممتاز دون التضحية بزمن استجابة النشر، مما يجعله خياراً قوياً لمعالجة تدفقات الفيديو الضخمة في تحليلات المدن الذكية وأنظمة الدفع الآلي.

اعرف المزيد عن YOLOv6

مقارنة الأداء

عند تقييم هذه النماذج لـ الاستدلال في الوقت الفعلي، يعد تحقيق التوازن بين المعلمات و FLOPs والدقة أمراً بالغ الأهمية. فيما يلي تقييم مفصل يقارن أداءهما.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ملي ثانية)
السرعة
T4 TensorRT10
(ملي ثانية)
المعلمات
(مليون)
FLOPs
(مليار)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

بينما يظهر DAMO-YOLO تفوقاً طفيفاً في الفئة الصغيرة (46.0 mAP مقابل 45.0 mAP)، يثبت YOLOv6-3.0 قابلية توسع متفوقة، حيث يتفوق في الفئتين المتوسطة والكبيرة مع الاحتفاظ بأقل عدد مطلق من المعلمات في تكوينه النانوي (nano).

الاختيار بين الاثنين

إذا كانت بيئة أجهزتك تسمح بعمليات بحث آلية مكثفة لتخصيص هيكلك الأساسي، فإن نهج NAS الخاص بـ DAMO-YOLO فعال للغاية. ومع ذلك، إذا كنت تعتمد كلياً على تسريع GPU القياسي (مثل T4 أو A100)، فإن هياكل EfficientRep الخاصة بـ YOLOv6 غالباً ما تترجم إلى سرعة إطارات خام (FPS) أعلى.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين DAMO-YOLO و YOLOv6 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار DAMO-YOLO

يعد DAMO-YOLO خياراً قوياً لـ:

  • تحليلات الفيديو عالية الإنتاجية: معالجة تدفقات الفيديو عالية معدل الإطارات على بنية تحتية ثابتة لـ NVIDIA GPU حيث تعد إنتاجية الدفعة 1 المقياس الأساسي.
  • خطوط التصنيع الصناعية: سيناريوهات ذات قيود زمن انتقال صارمة لوحدة معالجة الرسومات على أجهزة مخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
  • أبحاث البحث عن البنية العصبية: دراسة تأثيرات البحث المؤتمت عن البنية (MAE-NAS) والهياكل الأساسية المعاد معلمات ذات الكفاءة على أداء الكشف.

متى تختار YOLOv6

يوصى بـ YOLOv6 لـ:

  • النشر المدرك للأجهزة الصناعية: السيناريوهات التي يوفر فيها التصميم المدرك للأجهزة وإعادة المعلمات الفعالة للنموذج أداءً محسناً على أجهزة مستهدفة محددة.
  • الاكتشاف السريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستنتاج الخام على GPU لمعالجة الفيديو في الوقت الفعلي في بيئات محكومة.
  • تكامل نظام Meituan البيئي: الفرق التي تعمل بالفعل ضمن كومة تقنيات Meituan وبنية النشر التحتية الخاصة بها.

متى تختار Ultralytics (YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطورين:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استدلالاً ثابتاً ومنخفض التأخير دون تعقيد المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئات تعتمد فقط على CPU: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث توفر سرعة استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

ميزة Ultralytics: تقديم YOLO26

في حين أن كلاً من DAMO-YOLO و YOLOv6-3.0 قادران للغاية، إلا أنهما يعانيان من أنظمة بيئية مجزأة، وقيود المهام الفردية، وخطوط أنابيب نشر معقدة. بالنسبة لفرق الهندسة الحديثة، توفر نماذج Ultralytics تجربة مطور أفضل بكثير، تتوج بالنموذج الرائد YOLO26.

تم إطلاق YOLO26 في يناير 2026، وهو يمثل المعيار الجديد للنشر على الحافة (edge) والسحابة، حيث يعمل على تحسين متطلبات الذاكرة والكفاءة الحسابية بشكل كبير.

لماذا تختار YOLO26؟

  1. تصميم من طرف إلى طرف خالٍ من NMS: بناءً على مفاهيم من YOLOv10، يلغي YOLO26 محلياً معالجة ما بعد الاكتشاف غير الحد الأقصى (Non-Maximum Suppression). هذا يبسط بشكل كبير كود النشر ويقلل من تباين زمن استجابة الاستدلال عبر جميع أجهزة الحافة.
  2. تحسين فائق: يستخدم YOLO26 مُحسِّن MuSGD، وهو هجين من SGD و Muon (مستوحى من النماذج اللغوية الكبيرة)، مما ينتج عنه عمليات تدريب مستقرة للغاية وتقارب أسرع.
  3. تعدد استخدامات الأجهزة: من خلال تنفيذ إزالة DFL (خسارة التوزيع البؤري)، تم تبسيط رؤوس الإخراج، مما يعزز التوافق مع أجهزة الحافة. في الواقع، يحقق YOLO26 استدلالاً على CPU أسرع بنسبة تصل إلى 43%، مما يجعله متفوقاً بشكل كبير على YOLOv6 لبيئات الحافة المتنقلة أو إنترنت الأشياء (IoT).
  4. دقة محسنة: باستخدام ProgLoss + STAL، يشهد YOLO26 تحسينات دراماتيكية في اكتشاف الكائنات الصغيرة، مما يجعله الخيار الأمثل لـ التصوير الجوي وفحص العيوب.
  5. Unmatched Versatility: Unlike industrial models that only do bounding boxes, the YOLO26 family supports multi-modal tasks, including Image Classification, Instance Segmentation, Pose Estimation, and Oriented Bounding Boxes (OBB).

اعرف المزيد عن YOLO26

تجربة نظام بيئي سلسة

تعمل منصة Ultralytics على تحويل دورة حياة التعلم الآلي بأكملها. لم يعد تدريب النموذج صداعاً للتقطير متعدد المراحل. مع زيادة البيانات التلقائية، وضبط المعلمات الفائقة الموحد، والتصدير بنقرة واحدة إلى تنسيقات مثل ONNX، OpenVINO، و CoreML، يمكنك الانتقال من مجموعة البيانات إلى الإنتاج في ساعات، وليس أسابيع.

بالإضافة إلى ذلك، تشتهر نماذج Ultralytics بـ كفاءتها في الذاكرة، مما يتجنب اختناقات VRAM الضخمة التي تعاني منها بنيات المحولات مثل RT-DETR.

مثال كود للبدء السريع

يعد التدريب والاستدلال باستخدام نموذج Ultralytics مثل YOLO26 بسيطاً بشكل أنيق. يوضح نص Python التالي كيف يمكنك البدء فوراً في تتبع الكائنات ببضعة أسطر فقط من الكود:

from ultralytics import YOLO

# Load the highly efficient, NMS-free YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset seamlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a sample image
prediction = model("https://ultralytics.com/images/bus.jpg")

# Export to TensorRT for maximum GPU throughput
model.export(format="engine", dynamic=True)

خاتمة

كلا النموذجين DAMO-YOLO و YOLOv6-3.0 هما إنجازان هندسيان مبهران يدفعان حدود اكتشاف الكائنات الصناعية. ومع ذلك، فهما أدوات عالية التخصص تتطلب غالباً إعدادات معقدة وقيوداً صارمة على الأجهزة.

For developers and researchers who demand a perfect performance balance, multi-task capabilities, and an actively well-maintained ecosystem, Ultralytics YOLO26 stands unmatched. By blending LLM-inspired optimizers with a clean, NMS-free architecture, YOLO26 simplifies AI deployment while delivering state-of-the-art accuracy across edge and cloud environments.

إذا كنت تقيم نماذج لمشروع رؤية حاسوبية جديد، فإننا نوصي بشدة باستكشاف قدرات نظام Ultralytics YOLO البيئي. قد تجد أيضاً أنه من المفيد مقارنتها ببنيات أخرى مثل EfficientDet أو معالم سابقة مثل YOLO11 لفهم تطور الذكاء الاصطناعي للرؤية في الوقت الفعلي بشكل كامل.

تعليقات