Link to this sectionمقارنة بين DAMO-YOLO و YOLOv5#
تميز تطور رؤية الحاسوب بابتكار مستمر في مجال اكتشاف الكائنات في الوقت الفعلي. اليوم، يواجه المطورون والباحثون عددًا لا يحصى من الخيارات المعمارية عند تصميم مسارات عمل الرؤية الحاسوبية. تستعرض هذه المقارنة التقنية الشاملة الفروق الدقيقة بين DAMO-YOLO و Ultralytics YOLOv5، مع تسليط الضوء على معمارياتها، ومنهجيات التدريب، ومقاييس الأداء، وسيناريوهات النشر المثالية لكل منها.
Link to this sectionمقدمة حول DAMO-YOLO#
طرحت مجموعة Alibaba Group نموذج DAMO-YOLO، والذي قدم العديد من التقنيات المبتكرة التي تهدف إلى تجاوز حدود سرعة ودقة الاكتشاف.
- المؤلفون: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, و Xiuyu Sun
- المؤسسة: Alibaba Group
- التاريخ: 23 نوفمبر 2022
- Arxiv: 2211.15444v2
- GitHub: tinyvision/DAMO-YOLO
- المستندات: README.md
Link to this sectionالابتكارات المعمارية#
يعتمد DAMO-YOLO على أساس البحث في بنية الشبكات العصبية (NAS). استخدم المؤلفون MAE-NAS لتصميم هياكل أساسية (backbones) توازن تلقائيًا بين وقت الاستجابة والدقة. يقدم النموذج بنية RepGFPN (شبكة هرمية للميزات العامة المعاد معلمتها) والتي تعمل على تحسين دمج الميزات عبر مقاييس مختلفة. علاوة على ذلك، يدمج DAMO-YOLO تصميم "ZeroHead"، مما يلغي رؤوس التنبؤ المعقدة متعددة الفروع لصالح هيكل أبسط وأكثر كفاءة يعتمد بشكل كبير على إعادة المعلمة (rep-parameterization) أثناء الاستدلال.
لتحسين التدريب، يستخدم النموذج AlignedOTA لتعيين التسميات وعملية تعزيز تقطير ثقيلة، حيث يوجه نموذج "معلم" أكبر نموذج "طالب" أصغر لتحقيق دقة أعلى.
Link to this sectionمقدمة حول Ultralytics YOLOv5#
يعد Ultralytics YOLOv5 أحد أكثر معماريات الرؤية اعتمادًا في العالم، وهو معروف باستقراره، وسهولة استخدامه، ونظام النشر البيئي الواسع الخاص به.
- المؤلفون: Glenn Jocher
- المنظمة: Ultralytics
- التاريخ: 26 يونيو 2020
- GitHub: ultralytics/yolov5
- التوثيق: توثيق YOLOv5
Link to this sectionمعيار النظام البيئي#
أعاد YOLOv5 تعريف معيار الصناعة من حيث سهولة الاستخدام. تم بناؤه أصليًا باستخدام PyTorch، ويستخدم بنية CSPNet عالية التحسين ورقبة PANet لتجميع الميزات القوي. وعلى الرغم من أنه سبق توجه النماذج الخالية من المرساة (anchor-free) التي ظهرت في النماذج اللاحقة، إلا أن نهجه القائم على المرساة والمصقول للغاية، جنبًا إلى جنب مع تعلم المرساة التلقائي، يضمن أداءً ممتازًا خارج الصندوق.
تكمن القوة الحقيقية لـ YOLOv5 في نظامها البيئي المدار جيدًا. فهو يتكامل بسلاسة مع أدوات التتبع مثل Comet و Weights & Biases، ويدعم التصدير بنقرة واحدة إلى تنسيقات مثل ONNX، و TensorRT، و CoreML.
يعد YOLOv5 سهل التدريب بشكل لا يصدق على مجموعات البيانات المخصصة. تعمل واجهة برمجة التطبيقات (API) المبسطة على تقليل الاحتكاك من النموذج الأولي إلى الإنتاج، مما يجعله المفضل لدى فرق الهندسة الرشيقة.
Link to this sectionمقارنة الأداء والمقاييس#
عند مقارنة هذه النماذج، من الضروري النظر في التوازن بين متوسط دقة الاكتشاف (mAP)، وسرعة الاستدلال، وعدد المعلمات.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Link to this sectionتحليل المقايضات#
يحقق DAMO-YOLO نتائج mAP مبهرة بالنسبة لأحجام معلماته، مستفيدًا بشكل كبير من مرحلة تدريب التقطير. ومع ذلك، يأتي هذا على حساب كفاءة التدريب. تتطلب عملية التقطير متعددة المراحل تدريب نموذج معلم ثقيل أولاً، مما يزيد بشكل كبير من وقت معالجة GPU وذاكرة الفيديو (VRAM) اللازمة.
في المقابل، يوفر YOLOv5 متطلبات ذاكرة ممتازة. تشتهر نماذج Ultralytics YOLO بانخفاض استخدام الذاكرة أثناء التدريب والاستدلال مقارنة بخطوط أنابيب التقطير المعقدة أو النماذج القائمة على Transformer مثل RT-DETR. هذا يسمح بتدريب YOLOv5 بكفاءة على الأجهزة الاستهلاكية أو بيئات السحابة المتاحة مثل Google Colab.
Link to this sectionالتطبيقات الواقعية وتعدد الاستخدامات#
غالبًا ما يعتمد اختيار البنية الصحيحة على بيئة النشر.
Link to this sectionأين يتفوق DAMO-YOLO#
يعد DAMO-YOLO نموذجًا مخصصًا بدقة لـ اكتشاف الكائنات. وهو خيار ممتاز للبحث الأكاديمي، وخاصة للفرق التي تدرس البحث في بنية الشبكات العصبية أو أولئك الذين يهدفون إلى إعادة إنتاج تقنيات إعادة المعلمة المفصلة في الورقة البحثية. إذا كان لدى المشروع موارد حاسوبية واسعة لتنفيذ مرحلة تدريب التقطير وكان التركيز فقط على استخلاص آخر جزء من الدقة لصناديق الإحاطة ثنائية الأبعاد، فإن DAMO-YOLO يعتبر منافسًا قويًا.
Link to this sectionميزة Ultralytics#
للإنتاج في العالم الحقيقي، تجعل سهولة الاستخدام وتعدد الاستخدامات لنماذج Ultralytics منها الخيار المفضل. بينما يظل YOLOv5 ركيزة أساسية للاكتشاف وتصنيف الصور، يسمح نظام Ultralytics البيئي الأوسع للمطورين بالتبديل بين المهام دون عناء.
على سبيل المثال، تدعم التكرارات الأحدث في عائلة Ultralytics أصليًا تقسيم المثيلات، وتقدير الوضعية، واكتشاف صناديق الإحاطة الموجهة (OBB). تضمن قدرة المهام المتعددة هذه أن تتمكن الفرق من استخدام واجهة برمجة تطبيقات Python موحدة لمسارات العمل المعقدة، مثل الجمع بين التعرف الآلي على لوحات الأرقام وتقسيم المركبات.
Link to this sectionحالات الاستخدام والتوصيات#
يعتمد الاختيار بين DAMO-YOLO و YOLOv5 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
Link to this sectionمتى تختار DAMO-YOLO#
يعد DAMO-YOLO خياراً قوياً لما يلي:
- تحليلات الفيديو ذات الإنتاجية العالية: معالجة تدفقات الفيديو ذات معدل الإطارات العالي على بنية تحتية ثابتة لوحدات GPU من NVIDIA حيث يكون إنتاجية الدفعة-1 هو المقياس الأساسي.
- خطوط التصنيع الصناعية: السيناريوهات ذات قيود زمن انتقال GPU صارمة على أجهزة مخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
- أبحاث البحث في البنية العصبية: دراسة تأثيرات البحث الآلي في البنية (MAE-NAS) والهياكل الأساسية المعاد برمجتها بكفاءة على أداء الاكتشاف.
Link to this sectionمتى تختار YOLOv5#
يُنصح باستخدام YOLOv5 في الحالات التالية:
- أنظمة الإنتاج المثبتة: عمليات النشر الحالية حيث يتم تقدير سجل YOLOv5 الطويل من الاستقرار، والوثائق الشاملة، ودعم المجتمع الضخم.
- التدريب محدود الموارد: البيئات ذات موارد GPU المحدودة حيث تكون خط أنابيب التدريب الفعال لـ YOLOv5 ومتطلبات الذاكرة الأقل ميزة.
- دعم واسع لتنسيقات التصدير: المشاريع التي تتطلب النشر عبر العديد من التنسيقات بما في ذلك ONNX وTensorRT وCoreML وTFLite.
Link to this sectionمتى تختار Ultralytics (YOLO26)#
بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
- بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
Link to this sectionالمستقبل: الانتقال إلى YOLO26#
بينما يعد YOLOv5 أسطوريًا ويقدم DAMO-YOLO رؤى أكاديمية مثيرة للاهتمام، فقد تطورت حالة الفن. يمثل Ultralytics YOLO26، الذي تم إصداره في يناير 2026، قفزة هائلة للأمام لمجتمع الرؤية الحاسوبية.
يعالج YOLO26 الاختناقات التقليدية لنشر الحافة وعدم استقرار التدريب:
- End-to-End NMS-Free Design: YOLO26 natively eliminates Non-Maximum Suppression post-processing. This breakthrough simplifies deployment logic and drastically reduces latency variability, making it ideal for high-speed robotics and autonomous systems.
- مُحسِّن MuSGD: مستوحى من ابتكارات تدريب النماذج اللغوية الكبيرة (مثل Kimi K2 من Moonshot AI)، يستخدم YOLO26 مُحسِّن MuSGD (هجين من SGD و Muon). وهذا يضمن تشغيلات تدريب مستقرة للغاية وتقاربًا أسرع بشكل ملحوظ.
- سرعة استدلال CPU أسرع بنسبة تصل إلى 43%: من خلال إزالة Distribution Focal Loss (DFL) بشكل استراتيجي، يحقق YOLO26 سرعات فائقة على وحدات المعالجة المركزية (CPU) وأجهزة الحافة مقارنة بأسلافه مثل YOLO11 و YOLOv8.
- ProgLoss + STAL: تحقق وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو أمر بالغ الأهمية لتحليل صور الطائرات بدون طيار ومغذيات مستشعرات إنترنت الأشياء.
Link to this sectionمثال كودي: البساطة في العمل#
تسمح حزمة Ultralytics لك بتدريب ونشر النماذج ببضعة أسطر من الكود فقط. سواء كنت تستخدم YOLOv5 أو تقوم بالترقية إلى YOLO26 الموصى به، تظل الواجهة متسقة وبديهية.
from ultralytics import YOLO
# Load the state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")
# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
# Export the model for edge deployment
model.export(format="onnx")Link to this sectionالخلاصة#
ساهم كل من DAMO-YOLO و YOLOv5 بشكل كبير في مشهد رؤية الحاسوب. يعرض DAMO-YOLO قوة البحث في بنية الشبكات العصبية والتقطير، مما يجعله دراسة مثيرة للاهتمام للباحثين. ومع ذلك، يظل YOLOv5 قوة عملية بفضل توازن الأداء، ومتطلبات الذاكرة المنخفضة، وسهولة الاستخدام التي لا مثيل لها.
للمطورين الذين يبدأون مشاريع جديدة اليوم، التوصية هي الاستفادة من منصة Ultralytics واعتماد YOLO26. فهو يجمع بين النظام البيئي سهل الاستخدام المحبوب في YOLOv5 والتقدم المعماري الرائد، مما يضمن دقة عالية المستوى واستدلالًا فائق السرعة لتطبيقات الذكاء الاصطناعي في السحابة والحافة. قد يرغب المطورون أيضًا في استكشاف نماذج فعالة أخرى مثل YOLOv6 أو YOLOX اعتمادًا على قيود الأجهزة القديمة المحددة.