Link to this sectionDAMO-YOLO في مقابل YOLOv6-3.0#
أدى التطور السريع لرؤية الحاسوب إلى إنتاج بنيات متخصصة للغاية ومصممة للتطبيقات الصناعية. ومن بين هذه البنيات، يبرز نموذجان قويان لتركيزهما على الأداء في الوقت الفعلي وكفاءة النشر، وهما: DAMO-YOLO و YOLOv6-3.0. توفر هذه الصفحة مقارنة تقنية متعمقة لبنيتيهما ومقاييس أدائهما ومنهجيات تدريبهما لمساعدتك في اتخاذ قرارات النشر الخاصة بك.
Link to this sectionDAMO-YOLO: حيث يلتقي البحث عن البنية العصبية باكتشاف الأجسام#
تم تطوير DAMO-YOLO بواسطة باحثين في مجموعة Alibaba، ويقدم نهجاً جديداً لعائلة YOLO من خلال دمج البحث عن البنية العصبية (NAS) بكثافة في تصميم هيكله الأساسي (backbone).
- المؤلفون: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, و Xiuyu Sun
- المؤسسة: Alibaba Group
- التاريخ: 2022-11-23
- Arxiv: 2211.15444v2
- GitHub: tinyvision/DAMO-YOLO
Link to this sectionالابتكارات المعمارية#
يستخدم DAMO-YOLO هيكلاً أساسياً مُحسّناً بواسطة NAS يسمى MAE-NAS، والذي يبحث تلقائياً عن هياكل الشبكة المثلى في ظل قيود زمن وصول محددة. وهذا يضمن قدرة النموذج على التوسع بكفاءة عبر ملفات تعريف الأجهزة المختلفة. ولتحسين دمج الميزات، تستخدم البنية Efficient RepGFPN (شبكة هرمية ميزات معممة قابلة لإعادة التعيين)، مما يعزز تمثيل المقاييس المتعددة بشكل كبير.
علاوة على ذلك، يقدم النموذج تصميماً "ZeroHead". فمن خلال إزالة هياكل الفروع المتعددة المعقدة في رأس الكشف، فإنه يحافظ على المعلومات المكانية بشكل أكثر فعالية مع تقليل العبء الحسابي. كما تستفيد منهجية التدريب من AlignedOTA (تخصيص النقل الأمثل الموحد) وتقطير المعرفة القوي، مما يسمح لنماذج الطلاب الأصغر بالتعلم من شبكات المعلمين الأثقل.
بينما يساعد تقطير المعرفة نموذج DAMO-YOLO على تحقيق دقة عالية، فإنه يتطلب خط أنابيب تدريب متعدد المراحل. وهذا يزيد بشكل كبير من GPU compute المطلوب مقارنة بتدريب النماذج القياسية ذات المرحلة الواحدة.
Link to this sectionYOLOv6-3.0: زيادة الإنتاجية الصناعية إلى الحد الأقصى#
بقيادة قسم رؤية الذكاء الاصطناعي في Meituan، تم تصنيف YOLOv6-3.0 صراحةً ككاشف أجسام صناعي، مصمم خصيصاً لزيادة الإنتاجية إلى أقصى حد على أجهزة NVIDIA.
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
- المنظمة: Meituan
- التاريخ: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
Link to this sectionالميزات الرئيسية والتحسينات#
تم بناء YOLOv6-3.0 على الهيكل الأساسي EfficientRep الصديق للأجهزة، مما يجعله سريعاً بشكل استثنائي عند الاستفادة من تحسينات مثل TensorRT على وحدات معالجة الرسومات الحديثة. وفي إصدار v3.0، تدمج الشبكة وحدة ربط ثنائية الاتجاه (BiC) لتحسين تحديد موقع أحجام الأجسام المختلفة.
ميزة أخرى بارزة هي استراتيجية التدريب بمساعدة المرساة (AAT). تجمع AAT بين استقرار anchor-based detectors أثناء التدريب وسرعة الاستدلال للتصميم الخالي من المراسي. ينتج عن هذا النهج الهجين تقارب ممتاز دون التضحية بزمن وصول النشر، مما يجعله خياراً قوياً لمعالجة تدفقات الفيديو الضخمة في تحليلات المدن الذكية وأنظمة الدفع الآلي.
Link to this sectionمقارنة الأداء#
عند تقييم هذه النماذج لـ real-time inference، يعد موازنة المعلمات، و FLOPs، والدقة أمراً بالغ الأهمية. فيما يلي تقييم مفصل يقارن أداءهما.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
بينما يُظهر DAMO-YOLO تفوقاً طفيفاً في الفئة الصغيرة (46.0 mAP مقابل 45.0 mAP)، يُظهر YOLOv6-3.0 قابلية توسع متفوقة، متفوقاً في الفئات المتوسطة والكبيرة مع الاحتفاظ بأقل عدد مطلق من المعلمات في تكوينه النانوي.
إذا كانت بيئة أجهزتك تسمح بعمليات بحث آلية ثقيلة لتخصيص هيكلك الأساسي، فإن نهج NAS الخاص بـ DAMO-YOLO فعال للغاية. ومع ذلك، إذا كنت تعتمد كلياً على تسريع GPU الموحد (مثل T4 أو A100)، فإن هياكل EfficientRep الخاصة بـ YOLOv6 غالباً ما تترجم إلى إطارات في الثانية أعلى.
Link to this sectionحالات الاستخدام والتوصيات#
يعتمد الاختيار بين DAMO-YOLO و YOLOv6 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
Link to this sectionمتى تختار DAMO-YOLO#
يعد DAMO-YOLO خياراً قوياً لما يلي:
- تحليلات الفيديو ذات الإنتاجية العالية: معالجة تدفقات الفيديو ذات معدل الإطارات العالي على بنية تحتية ثابتة لوحدات GPU من NVIDIA حيث يكون إنتاجية الدفعة-1 هو المقياس الأساسي.
- خطوط التصنيع الصناعية: السيناريوهات ذات قيود زمن انتقال GPU صارمة على أجهزة مخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
- أبحاث البحث في البنية العصبية: دراسة تأثيرات البحث الآلي في البنية (MAE-NAS) والهياكل الأساسية المعاد برمجتها بكفاءة على أداء الاكتشاف.
Link to this sectionمتى تختار YOLOv6#
يوصى بـ YOLOv6 لـ:
- النشر المدرك للأجهزة الصناعية: السيناريوهات التي يوفر فيها التصميم المدرك للأجهزة وإعادة تحديد المعلمات الفعال للنموذج أداءً محسناً على أجهزة مستهدفة محددة.
- الكشف السريع في مرحلة واحدة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الخام على GPU لمعالجة الفيديو الفوري في بيئات خاضعة للتحكم.
- تكامل نظام Meituan البيئي: الفرق التي تعمل بالفعل ضمن مكدس التكنولوجيا والبنية التحتية للنشر الخاصة بـ Meituan.
Link to this sectionمتى تختار Ultralytics (YOLO26)#
بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
- بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
Link to this sectionميزة Ultralytics: تقديم YOLO26#
على الرغم من أن كلاً من DAMO-YOLO و YOLOv6-3.0 يتمتعان بقدرات عالية، إلا أنهما يعانيان من أنظمة بيئية مجزأة، وقيود المهمة الواحدة، وخطوط أنابيب نشر معقدة. بالنسبة لفرق الهندسة الحديثة، توفر Ultralytics models تجربة مطور أفضل بكثير، وتتوج في YOLO26 الرائد.
تم إصداره في يناير 2026، ويمثل YOLO26 المعيار الجديد للنشر على الحافة (edge) وفي السحابة، مع تحسين كبير لـ memory requirements والكفاءة الحسابية.
Link to this sectionلماذا تختار YOLO26؟#
- تصميم من طرف إلى طرف خالٍ من NMS: بناءً على مفاهيم من YOLOv10، يلغي YOLO26 محلياً معالجة ما بعد الكشف غير الأقصى (Non-Maximum Suppression). وهذا يبسط بشكل كبير كود النشر ويقلل من تباين زمن استدلال عبر جميع أجهزة الحافة.
- تحسين متفوق: يستخدم YOLO26 مُحسِّن MuSGD، وهو هجين من SGD و Muon (مستوحى من النماذج اللغوية الكبيرة)، والذي ينتج عنه عمليات تدريب مستقرة للغاية وتقارب أسرع.
- تنوع الأجهزة: من خلال تنفيذ إزالة DFL (خسارة التنسيق البؤري)، يتم تبسيط رؤوس الإخراج، مما يعزز توافق جهاز الحافة. في الواقع، يحقق YOLO26 استدلالاً أسرع لوحدة المعالجة المركزية (CPU) بنسبة تصل إلى 43%، مما يجعله متفوقاً بشكل كبير على YOLOv6 لبيئات الهاتف المحمول أو إنترنت الأشياء (IoT).
- Enhanced Accuracy: Utilizing ProgLoss + STAL, YOLO26 sees dramatic improvements in small object detection, making it the optimal choice for aerial imagery and defect inspection.
- تنوع لا مثيل له: على عكس النماذج الصناعية التي تقوم فقط بصناديق الإحاطة، تدعم عائلة YOLO26 المهام متعددة الوسائط، بما في ذلك Image Classification، و Instance Segmentation، و Pose Estimation، و Oriented Bounding Boxes (OBB).
Link to this sectionتجربة نظام بيئي سلسة#
تحول Ultralytics Platform دورة حياة التعلم الآلي بأكملها. لم يعد تدريب النموذج صداعاً للتقطير متعدد المراحل. مع زيادة البيانات التلقائية، وضبط المعلمات الفائقة الموحد، والتصدير بنقرة واحدة إلى تنسيقات مثل ONNX و OpenVINO و CoreML، يمكنك الانتقال من مجموعة البيانات إلى الإنتاج في ساعات، وليس أسابيع.
بالإضافة إلى ذلك، تشتهر نماذج Ultralytics بـ memory efficiency الخاصة بها، متجنبة اختناقات VRAM الهائلة التي تعاني منها بنيات المحولات مثل RT-DETR.
Link to this sectionمثال كود للبدء السريع#
التدريب والاستدلال باستخدام نموذج Ultralytics مثل YOLO26 بسيط وأنيق. يوضح سكربت Python التالي كيف يمكنك البدء فوراً في تتبع الأجسام ببضعة أسطر فقط من الكود:
from ultralytics import YOLO
# Load the highly efficient, NMS-free YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on your custom dataset seamlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a sample image
prediction = model("https://ultralytics.com/images/bus.jpg")
# Export to TensorRT for maximum GPU throughput
model.export(format="engine", dynamic=True)Link to this sectionالخلاصة#
يعد كل من DAMO-YOLO و YOLOv6-3.0 إنجازات هندسية مبهرة تدفع حدود كشف الأجسام الصناعي. ومع ذلك، فهي أدوات متخصصة للغاية وغالباً ما تتطلب إعدادات معقدة وقيوداً صارمة على الأجهزة.
بالنسبة للمطورين والباحثين الذين يطالبون بـ توازن مثالي في الأداء، وقدرات المهام المتعددة، و well-maintained ecosystem نشط، فإن YOLO26 من Ultralytics لا مثيل له. من خلال دمج المحسنات المستوحاة من LLM مع بنية نظيفة وخالية من NMS، يبسط YOLO26 AI deployment مع تقديم دقة متطورة عبر بيئات الحافة والسحابة.
إذا كنت تقيم نماذج لمشروع رؤية حاسوبية جديد، فإننا نوصي بشدة باستكشاف قدرات نظام Ultralytics YOLO البيئي. قد تجد أيضاً أنه من المفيد مقارنة هذه النماذج ببنيات أخرى مثل EfficientDet أو معالم سابقة مثل YOLO11 لفهم تطور ذكاء الرؤية في الوقت الفعلي بشكل كامل.