Link to this sectionDAMO-YOLO مقابل YOLOX#
يشهد مجال الرؤية الحاسوبية في الوقت الفعلي تطوراً مستمراً. وتعد كل من DAMO-YOLO و YOLOX محطتين بارزتين في هذه الرحلة، حيث قدمت كل منهما ابتكارات فريدة لمعالجة تحديات اكتشاف الكائنات بسرعة ودقة عاليتين. وبينما ساهم كلا النموذجين بشكل كبير في مجتمع المصادر المفتوحة، يظل فهم اختلافاتهم المعمارية، ومنهجيات التدريب، وسيناريوهات النشر المثالية أمراً حاسماً لمهندسي تعلم الآلة.
يستكشف هذا الدليل الشامل الفروق التقنية لكلا النموذجين ويوضح لماذا توفر البدائل الحديثة مثل منصة Ultralytics YOLO26 أداءً فائقاً وسهولة في الاستخدام لبيئات الإنتاج الحالية.
Link to this sectionنظرة عامة على النماذج#
Link to this sectionتفاصيل DAMO-YOLO#
تم تطوير DAMO-YOLO بواسطة فريق من الباحثين في مجموعة Alibaba، وتم تقديمه كطريقة اكتشاف كائنات عالية الكفاءة تعتمد على اكتشاف البنية تلقائياً.
المؤلفون: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, و Xiuyu Sun
المنظمة: Alibaba Group
التاريخ: 23-11-2022
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO
التوثيق: DAMO-YOLO Documentation
Link to this sectionتفاصيل YOLOX#
تم إنشاء YOLOX بواسطة باحثين في Megvii، وكان الهدف منه سد الفجوة بين الأبحاث والمجتمعات الصناعية من خلال تحويل سلسلة YOLO إلى تصميم خالٍ من نقاط الارتكاز (anchor-free)، مما أدى إلى تبسيط المعمارية بشكل كبير مع تحقيق أداء أفضل في ذلك الوقت.
المؤلفون: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, و Jian Sun
المنظمة: Megvii
التاريخ: 18-07-2021
Arxiv: https://arxiv.org/abs/2107.08430
GitHub: https://github.com/Megvii-BaseDetection/YOLOX
التوثيق: YOLOX Documentation
Link to this sectionتحليل المعمارية#
Link to this sectionمعمارية DAMO-YOLO#
يعتمد DAMO-YOLO بشكل كبير على البحث في معمارية الشبكات العصبية (NAS). وتشمل المكونات الأساسية:
- MAE-NAS Backbones: يستخدم خوارزمية بحث تطورية متعددة الأهداف لاكتشاف الهياكل الأساسية التي توفر التوازن الأمثل بين سرعة الاستدلال والدقة.
- Efficient RepGFPN: تصميم عنق ثقيل (heavy-neck) مكيّف لدمج الميزات، مما يساعد النموذج في الحفاظ على دقة عالية عبر أحجام كائنات متفاوتة.
- ZeroHead: رأس اكتشاف مبسط وخفيف الوزن يعمل على تقليل العبء الحسابي في طبقات التنبؤ النهائية.
Link to this sectionهندسة YOLOX#
اتبع YOLOX نهجاً مختلفاً، حيث ركز على البساطة الهيكلية والتصميم الخالي من نقاط الارتكاز:
- آلية خالية من نقاط الارتكاز (Anchor-Free): من خلال التنبؤ بإحداثيات مربعات الإحاطة (BBox) مباشرة دون نقاط ارتكاز محددة مسبقاً، يقلل YOLOX من عدد معلمات التصميم والضبط التجريبي المطلوب.
- رأس مفكك (Decoupled Head): يقوم بفصل مهام التصنيف والانحدار إلى فروع ميزات مختلفة، مما يحسن سرعة التقارب والدقة الإجمالية.
- SimOTA Label Assignment: استراتيجية متقدمة لتخصيص التسميات تخصص العينات الإيجابية ديناميكياً للحقائق الأرضية (ground truths)، مما يحسن كفاءة التدريب.
بينما يستخدم DAMO-YOLO عمليات بحث NAS مدفوعة بالآلة لإيجاد بنى مثالية تحت قيود صارمة، يستفيد YOLOX من تبسيطات ذكية صممها البشر (مثل الرؤوس الخالية من نقاط الارتكاز) لتبسيط خط أنابيب اكتشاف الكائنات.
Link to this sectionمقارنة الأداء#
يتطلب تقييم هذه النماذج النظر في متوسط دقة متوسط المقياس (mAP)، وسرعات الاستدلال، وعدد المعلمات. يوجد أدناه جدول مقارنة مفصل للمتغيرات القياسية وخفيفة الوزن لكلا المعمارتين.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
بينما يحقق YOLOXx أعلى mAP مطلق عند 51.1، يقدم DAMO-YOLOl دقة mAP تنافسية للغاية تبلغ 50.8 مع أقل من نصف عدد المعلمات (42.1 مليون مقابل 99.1 مليون) وتنفيذ TensorRT أسرع بشكل ملحوظ.
Link to this sectionمنهجيات التدريب#
Link to this sectionتدريب DAMO-YOLO#
يستخدم DAMO-YOLO تحسيناً معقداً للتقطير (distillation) أثناء التدريب. غالباً ما يتم تدريب نموذج "معلم" كبير أولاً، ثم تُنقل معرفته إلى نماذج "طالب" أصغر. كما يوظف AlignedOTA لتخصيص التسميات الديناميكي. على الرغم من فعاليته العالية، فإن عملية التدريب متعددة المراحل هذه تزيد بشكل كبير من وقت GPU compute وعبء الذاكرة المطلوب.
Link to this sectionتدريب YOLOX#
يعتمد YOLOX على استراتيجيات قوية لزيادة البيانات (augmentation) مثل MixUp و Mosaic. ومع ذلك، اكتشف المؤلفون أن إيقاف هذه الزيادات القوية في الحقب الـ 15 الأخيرة يسمح للنموذج بسد فجوة الواقع، مما يعزز مقاييس الدقة النهائية بشكل كبير.
Link to this sectionحالات الاستخدام المثالية#
- DAMO-YOLO: الأنسب لعمليات النشر الصناعية عالية المخاطر حيث يمكن دعم خطوط أنابيب التقطير من جانب الخادم، وحيث تستفيد الأجهزة المستهدفة (مثل بعض NVIDIA GPUs) بشكل مباشر من معمارية العنق الثقيل NAS الخاصة به.
- YOLOX: ممتاز للمطورين الذين يسعون لنهج خالص خالٍ من نقاط الارتكاز. يجعل
YOLOXnanoخفيف الوزن للغاية قابلاً للاستخدام على أجهزة Android القديمة، و edge computing، ومستشعرات IoT مقيدة جداً حيث يعد عدد المعلمات هو عنق الزجاجة المطلق.
Link to this sectionميزة Ultralytics: ظهور YOLO26#
بينما تمثل DAMO-YOLO و YOLOX معالم ممتازة، يطالب المطورون اليوم بحلول أكثر شمولاً وتنوعاً وسهولة في الاستخدام. وهنا تتألق Ultralytics Platform و Ultralytics YOLO26 التي تم إصدارها حديثاً.
تم إصدار YOLO26 في يناير 2026، وهو النموذج النهائي الموصى به لجميع مهام computer vision. يقدم مجموعة من الاختراقات التي تتفوق على البنى القديمة:
- تصميم NMS-Free من الطرف إلى الطرف: يلغي YOLO26 أصلاً معالجة ما بعد الاستدلال باستخدام NMS (كبت غير الحد الأقصى). وهذا يسمح بنشر أبسط وأسرع بكثير، مما يتجنب اختناقات زمن الوصول المتأصلة في رؤوس الاكتشاف التقليدية.
- أسرع بنسبة تصل إلى 43% في استدلال CPU: من خلال إزالة DFL (خسارة التركيز التوزيعية) استراتيجياً وتحسين الطبقات، يوفر YOLO26 سرعات لا مثيل لها على وحدات المعالجة المركزية (CPUs) وأجهزة الحافة.
- محسن MuSGD: مستوحى من تقنيات تدريب نماذج اللغات الكبيرة (LLM)، يقدم YOLO26 محسن MuSGD (هجين من SGD و Muon)، مما يؤدي إلى عمليات تدريب مستقرة للغاية وتقارب أسرع بكثير مقارنة بالإعدادات القديمة في YOLOX.
- ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، مما يجعل YOLO26 متفوقاً بشكل كبير في تصوير الطائرات بدون طيار والروبوتات.
- تعدد الاستخدامات: على عكس DAMO-YOLO، الذي يقتصر فقط على اكتشاف الكائنات، يتعامل YOLO26 بسلاسة مع instance segmentation، و pose estimation، و classification، و Oriented Bounding Boxes (OBB) أصلاً داخل نفس النظام البيئي الذي يتم صيانته جيداً.
Link to this sectionسهولة الاستخدام مع Ultralytics#
تعمل واجهة برمجة تطبيقات Python من Ultralytics على تبسيط تجربة المطورين. يتطلب تدريب نموذج YOLO26 متطور كوداً نموذجياً أقل بكثير ويتجنب خطوط أنابيب التقطير المعقدة في DAMO-YOLO. علاوة على ذلك، تتميز نماذج Ultralytics بمتطلبات ذاكرة CUDA منخفضة بشكل استثنائي أثناء التدريب مقارنة بنماذج Transformer الثقيلة.
from ultralytics import YOLO
# Load the latest Ultralytics YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on your custom dataset with one line of code
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run fast, NMS-free inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")يمكنك التعليق تلقائياً وتدريب ونشر النماذج على الحافة باستخدام Ultralytics Platform، التي تتعامل مع جميع إصدارات البيانات وتوفير GPU السحابي نيابة عنك.
Link to this sectionالخلاصة#
يعتمد الاختيار بين DAMO-YOLO و YOLOX على قيود محددة: يقدم DAMO-YOLO نسب سرعة إلى دقة استثنائية على وحدات GPU معينة عبر NAS، بينما يوفر YOLOX تصميماً نظيفاً خالياً من نقاط الارتكاز مثالياً لسيناريوهات الحافة خفيفة الوزن.
ومع ذلك، بالنسبة للفرق التي تبحث عن حل حديث ومستقبلي مع مجتمع نشط، فإن معمارية Ultralytics YOLO26 هي الخيار النهائي. إن تصميمه الخالي من NMS، واستدلال CPU السريع، وواجهة برمجة التطبيقات الموحدة لمهام الاكتشاف والتجزئة والوضع تجعله لا مثيل له للانتقال بسلاسة من البحث إلى الإنتاج الواقعي القوي.
للمطورين المهتمين باستكشاف بنيات حديثة أخرى، نوصي أيضاً بالتحقق من Ultralytics YOLO11 أو النماذج القائمة على Transformer مثل RT-DETR المتاحة في توثيق Ultralytics الشامل.