Link to this sectionDAMO-YOLO في مقابل YOLO11: مقارنة فنية شاملة#
عند اختيار بنية لاكتشاف الأشياء في الوقت الفعلي لمشروعك القادم في مجال رؤية الكمبيوتر، يعد فهم الفروق الدقيقة بين النماذج الرائدة أمراً بالغ الأهمية. يوفر هذا الدليل الشامل تحليلاً فنياً متعمقاً يقارن بين DAMO-YOLO وUltralytics YOLO11، ويستعرض بنيتهما، ومقاييس الأداء، ومنهجيات التدريب، وسيناريوهات النشر الواقعية المثالية.
تفاصيل DAMO-YOLO: المؤلفون: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, و Xiuyu Sun المنظمة: Alibaba Group التاريخ: 2022-11-23 Arxiv: 2211.15444v2 GitHub: tinyvision/DAMO-YOLO الوثائق: توثيق DAMO-YOLO
تفاصيل YOLO11: المؤلفون: Glenn Jocher و Jing Qiu المنظمة: Ultralytics التاريخ: 2024-09-27 GitHub: ultralytics/ultralytics الوثائق: توثيق YOLO11
Link to this sectionفلسفة التصميم المعماري#
تحدد البنية الأساسية لنموذج اكتشاف الأشياء سرعة الاستدلال، والدقة، والقدرة على التكيف عبر بيئات الأجهزة المختلفة.
يقدم DAMO-YOLO العديد من الابتكارات الأكاديمية، معتمداً بشكل كبير على البحث في البنية العصبية (NAS) لتصميم هيكله الأساسي تلقائياً. وهو يستخدم شبكة RepGFPN (شبكة هرمية للميزات المعممة والمعاد برمجتها) فعالة لتعزيز دمج الميزات، وتصميماً يعتمد على ZeroHead يقلل بشكل كبير من رأس التنبؤ الثقيل الذي غالباً ما يوجد في البنى السابقة. وعلى الرغم من أن هذا النهج القائم على NAS يسمح لـ DAMO-YOLO بتحقيق كفاءات محددة على وحدات معالجة رسوميات (GPUs) مختارة، إلا أن البنى الناتجة يمكن أن تفتقر أحياناً إلى المرونة اللازمة للتعميم بسلاسة عبر أجهزة الحافة المتنوعة.
على النقيض من ذلك، يبني YOLO11 على سنوات من الأبحاث الأساسية لتقديم بنية محسنة للغاية ومصممة يدوياً. وهو يركز على هيكل أساسي مبسط ورقبة (neck) عالية الكفاءة تقلل من الحسابات الزائدة. تتمثل إحدى المزايا الأساسية لـ YOLO11 في كفاءة المعاملات (parameter efficiency) المحسنة؛ فهو يحقق تمثيلاً عالياً للميزات دون متطلبات VRAM الثقيلة النموذجية لنماذج المحولات (transformer-based) مثل RT-DETR. وهذا يجعل YOLO11 متعدد الاستخدامات بشكل استثنائي، وقادراً على العمل بسلاسة على وحدات معالجة الرسوميات للمستهلكين، والأجهزة المحمولة، ومسرعات الحافة المتخصصة.
Link to this sectionالأداء والمقاييس#
يتطلب تقييم الأداء النظر إلى ما هو أبعد من الدقة الإجمالية لمراعاة التوازن بين السرعة، وحجم النموذج، والحمل الحسابي (FLOPs).
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
كما يوضح الجدول، يحقق YOLO11 توازناً ممتازاً في الأداء. فمثلاً، يتفوق متغير YOLO11s على DAMO-YOLOs في الدقة مع الحفاظ على حجم معاملات أصغر بكثير. يترجم هذا الانخفاض في متطلبات الذاكرة مباشرة إلى تكاليف نشر أقل وأداء أكثر مرونة على أجهزة الحافة.
Link to this sectionمنهجيات التدريب وسهولة الاستخدام#
مسار التدريب هو المكان الذي يقضي فيه المطورون معظم وقتهم، مما يجعل كفاءة التدريب مصدر قلق بالغ الأهمية.
يستخدم DAMO-YOLO عملية تدريب متعددة المراحل تعتمد بشكل كبير على تقطير المعرفة (knowledge distillation). وهو يستخدم AlignedOTA (تخصيص النقل الأمثل) لتخصيص التسميات وغالباً ما يتطلب تدريب نموذج "معلم" أكبر لتقطير المعرفة إلى نماذج "طالب" أصغر. تزيد هذه المنهجية بشكل كبير من بصمة ذاكرة CUDA ووقت الحوسبة الإجمالي المطلوب لتحقيق التقارب الأمثل.
وعلى العكس من ذلك، تجرد بيئة Ultralytics تعقيد تدريب النموذج. تم تصميم YOLO11 لسهولة استثنائية في الاستخدام، حيث يتميز بواجهة برمجة تطبيقات (API) بلغة Python مبسطة وواجهات CLI شاملة تسمح للمهندسين ببدء التدريب على مجموعات بيانات مخصصة بأمر واحد. مسار التدريب فعال في استخدام الموارد بطبيعته، مما يقلل من ارتفاعات استهلاك الذاكرة بحيث يمكن تدريب حتى النماذج الأكبر على الأجهزة القياسية.
يتطلب تدريب نموذج Ultralytics صفراً من التعليمات البرمجية المتكررة (boilerplate code). تم تحسين مسارات تحميل البيانات، والزيادة (augmentation)، وحساب الخسارة المدمجة بالكامل بشكل جاهز للاستخدام.
فيما يلي مثال سريع على مدى بساطة تدريب ونشر نموذج Ultralytics:
from ultralytics import YOLO
# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
# Export the trained model to ONNX for seamless deployment
model.export(format="onnx")Link to this sectionالتطبيقات الواقعية وتعدد الاستخدامات#
غالباً ما يعتمد الاختيار بين هذه البنى على اتساع المهام المطلوبة من قبل بيئة النشر الخاصة بك.
Link to this sectionأين يتناسب DAMO-YOLO#
يعد DAMO-YOLO إطار عمل لاكتشاف الأشياء بشكل صارم. وهو يتفوق في بيئات البحث الأكاديمي حيث تستكشف الفرق إعادة برمجة المعاملات (rep-parameterization) أو إعادة إنتاج تجارب معينة للبحث في البنية العصبية. يمكن أيضاً نشره في البيئات الصناعية المقيدة للغاية حيث يتطابق مسرع GPU محدد جداً تماماً مع الهيكل الأساسي الذي تم إنشاؤه بواسطة NAS.
Link to this sectionميزة Ultralytics#
تتألق نماذج Ultralytics، بما في ذلك YOLO11، في التطبيقات التجارية الواقعية بفضل تعدد استخداماتها الذي لا مثيل له ونظامها البيئي الذي تتم صيانته جيداً. على عكس DAMO-YOLO، يدعم إطار عمل Ultralytics المهام متعددة الوسائط محلياً. من تجزئة المثيلات في التصوير الطبي إلى تقدير الوضعية للتحليل الميكانيكي الحيوي في الرياضة، تتعامل قاعدة تعليمات برمجية واحدة موحدة مع كل ذلك.
تشمل الصناعات التي تستفيد من YOLO11 ما يلي:
- الزراعة الذكية: استخدام اكتشاف الأشياء لمراقبة صحة المحاصيل وأتمتة آلات الحصاد.
- تحليلات التجزئة: تنفيذ المراقبة الذكية لتحليل حركة العملاء وأتمتة إدارة المخزون.
- الخدمات اللوجستية وسلسلة التوريد: اكتشاف الرموز الشريطية والحزم عالي السرعة باستخدام صناديق التحديد الموجهة (OBB) على سيور النقل سريعة الحركة.
Link to this sectionحالات الاستخدام والتوصيات#
يعتمد الاختيار بين DAMO-YOLO وYOLO11 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
Link to this sectionمتى تختار DAMO-YOLO#
يعد DAMO-YOLO خياراً قوياً لما يلي:
- تحليلات الفيديو ذات الإنتاجية العالية: معالجة تدفقات الفيديو ذات معدل الإطارات العالي على بنية تحتية ثابتة لوحدات GPU من NVIDIA حيث يكون إنتاجية الدفعة-1 هو المقياس الأساسي.
- خطوط التصنيع الصناعية: السيناريوهات ذات قيود زمن انتقال GPU صارمة على أجهزة مخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
- أبحاث البحث في البنية العصبية: دراسة تأثيرات البحث الآلي في البنية (MAE-NAS) والهياكل الأساسية المعاد برمجتها بكفاءة على أداء الاكتشاف.
Link to this sectionمتى تختار YOLO11#
يوصى بـ YOLO11 لـ:
- نشر الإنتاج عند الحافة: التطبيقات التجارية على أجهزة مثل Raspberry Pi أو NVIDIA Jetson حيث تكون الموثوقية والصيانة النشطة أمراً بالغ الأهمية.
- تطبيقات الرؤية متعددة المهام: المشاريع التي تتطلب اكتشافاً، وتجزئة، وتقدير وضعية، وOBB ضمن إطار عمل واحد موحد.
- النماذج الأولية السريعة والنشر: الفرق التي تحتاج إلى التحرك بسرعة من جمع البيانات إلى الإنتاج باستخدام Ultralytics Python API الانسيابي.
Link to this sectionمتى تختار Ultralytics (YOLO26)#
بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
- بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
Link to this sectionالجيل القادم: تقديم YOLO26#
بينما يظل YOLO11 خياراً قوياً وموثوقاً، فإن مشهد رؤية الكمبيوتر يتحرك بسرعة. بالنسبة للمطورين الذين يبدؤون مشاريع جديدة، يمثل أحدث نموذج YOLO26 أحدث ما توصلت إليه التقنية.
تم إصداره في يناير 2026، ويقدم YOLO26 العديد من التطورات الرائدة:
- تصميم من طرف إلى طرف بدون NMS: من خلال القضاء على معالجة ما بعد الكبت غير الأقصى (Non-Maximum Suppression)، يضمن YOLO26 أوقات استدلال أسرع وحتمية ويبسط بشكل كبير مسارات النشر.
- استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): من خلال إزالة خسارة التركيز التوزيعي (DFL)، يعد النموذج مناسباً تماماً لأجهزة الحافة والأجهزة منخفضة الطاقة التي تفتقر إلى وحدات GPU مخصصة.
- مُحسن MuSGD: بدمج ابتكارات تدريب النماذج اللغوية الكبيرة (المستوحاة من Moonshot AI)، يضمن هذا المُحسن الهجين تقارباً مستقراً وسريعاً أثناء التدريب.
- دوال خسارة متقدمة: باستخدام ProgLoss + STAL، يظهر YOLO26 تحسينات ملحوظة في التعرف على الأشياء الصغيرة، وهو أمر حيوي للصور الجوية والروبوتات.
Link to this sectionالخلاصة#
ساهم كل من DAMO-YOLO وYOLO11 بشكل كبير في تقدم رؤية الكمبيوتر السريعة والدقيقة. بينما يقدم DAMO-YOLO رؤى أكاديمية مثيرة للاهتمام حول البحث في البنية والتقطير، يوفر Ultralytics YOLO11 (والنموذج الرائد YOLO26) تجربة مطور متفوقة.
مع متطلبات ذاكرة أقل، ووثائق شاملة، وقدرات متعددة المهام، والتكامل مع منصة Ultralytics القوية، تظل نماذج Ultralytics التوصية الأولى للباحثين ومهندسي المؤسسات الذين يتطلعون إلى بناء حلول ذكاء اصطناعي قوية وقابلة للتطوير. بالنسبة لأولئك الذين يستكشفون بنيات متقدمة أخرى، توفر مقارنة YOLO26 مقابل RT-DETR رؤى إضافية حول البدائل القائمة على المحولات.