YOLO11 مقابل DAMO-YOLO: مقارنة بين الجيل التالي من كاشفات الكائنات
يعد اختيار البنية الأمثل خطوة حاسمة في أي مشروع للرؤية الحاسوبية. يقدم هذا الدليل التقني مقارنة شاملة بين نموذجين قويين لكشف الكائنات: Ultralytics YOLO11 وDAMO-YOLO. سنغوص في ابتكاراتهما المعمارية، ونماذج التدريب، وقابلية التطبيق في العالم الحقيقي لمساعدتك في اختيار أفضل أداة لاحتياجات النشر الخاصة بك.
نظرة عامة على النماذج
Ultralytics YOLO11
تم تطوير YOLO11 بواسطة فريق Ultralytics، وهو يمثل تكراراً محسناً للغاية في عائلة YOLO، حيث يعمل على تحسين كل من الدقة والكفاءة بشكل كبير. إنه مصمم للباحثين والمهندسين الذين يسعون للحصول على نظام بيئي موحد وجاهز للإنتاج يمتد من إدارة مجموعات البيانات إلى النشر على الحافة (Edge).
- المؤلفون: Glenn Jocher و Jing Qiu
- المنظمة: Ultralytics
- التاريخ: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- الوثائق: https://docs.ultralytics.com/models/yolo11/
يتميز YOLO11 بتعدد استخداماته. فبينما تركز العديد من النماذج التقليدية فقط على مربعات الإحاطة (bounding boxes)، يدعم YOLO11 أصلاً كشف الكائنات، وتقسيم المثيلات، وتصنيف الصور، وتقدير الوضعية. تتيح هذه القدرة متعددة الوسائط للمطورين دمج مسارات رؤية الذكاء الاصطناعي الخاصة بهم ضمن إطار عمل واحد ومصان جيداً.
DAMO-YOLO
تم تطوير DAMO-YOLO بواسطة باحثين في Alibaba Group. وهو يستفيد من البحث عن البنية العصبية (NAS) لاكتشاف بنيات أساسية (backbones) عالية الكفاءة مصممة للاستدلال في الوقت الفعلي على وحدات معالجة الرسومات (GPUs) والمسرعات الأخرى.
- المؤلفون: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, و Xiuyu Sun
- المنظمة: Alibaba Group
- التاريخ: 2022-11-23
- Arxiv: https://arxiv.org/abs/2211.15444v2
- GitHub: https://github.com/tinyvision/DAMO-YOLO
- المستندات: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
تتمحور الفلسفة الأساسية لـ DAMO-YOLO حول إعادة تحديد المعلمات (rep-parameterization) والبحث الآلي. باستخدام MAE-NAS (البحث عن البنية العصبية التطورية متعددة الأهداف)، قام المؤلفون بهندسة بنية أساسية مخصصة تعزز سرعات الاستدلال بشكل كبير على الأجهزة المتخصصة. كما أنه يتضمن هيكلاً محسناً للغاية يسمى Efficient RepGFPN وبنية ZeroHead مبسطة لتقليل زمن الاستجابة.
عند مقارنة YOLO11 و DAMO-YOLO، فكر في التحقق من Ultralytics YOLO26 الأحدث. إنه يقدم استدلالاً أصلياً شاملاً (end-to-end) بدون NMS ويقدم سرعات وحدة معالجة مركزية (CPU) أسرع بنسبة تصل إلى 43%. قد ترغب أيضاً في استكشاف المقارنات التي تشمل YOLOX أو YOLOv8.
مقارنة الأداء والبنية
يعد فهم مقايضات الأداء أمراً حيوياً عند نشر تطبيقات ذكاء اصطناعي على الحافة. يوضح الجدول أدناه المقاييس الرئيسية مثل متوسط الدقة (mAP)، وزمن الاستجابة، والحجم الحسابي.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ملي ثانية) | السرعة T4 TensorRT10 (ملي ثانية) | المعلمات (مليون) | FLOPs (مليار) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
نظرة معمارية متعمقة
يعتمد YOLO11 على بنية أساسية عالية الكفاءة ومصممة خصيصاً توازن تماماً بين عدد المعلمات والقدرة التمثيلية. إنه مُحسّن ليعمل بشكل رائع عبر مجموعة من الأجهزة، ويتفوق أصلاً مع الحد الأدنى من استخدام ذاكرة CUDA أثناء التدريب والاستدلال. وهذا يجعله خياراً ممتازاً لأجهزة المستهلك القياسية أو أجهزة IoT المحدودة الموارد.
على العكس من ذلك، تم ضبط البنيات الأساسية التي تم إنشاؤها بواسطة MAE-NAS في DAMO-YOLO بدقة لبيئات وحدات معالجة الرسومات (GPUs) ذات الإنتاجية العالية. تدمج شبكتها Efficient RepGFPN (شبكة هرمية ميزات معمة) مقاييس متعددة بقوة. ومع ذلك، بينما تسرع إعادة تحديد المعلمات من الاستدلال، فإنها قد تعقد عملية النشر إذا كانت حزمة أجهزتك لا تدعم هذه العمليات بشكل جيد صراحةً.
سهولة الاستخدام وكفاءة التدريب
عند حساب وقت التطوير، تصبح سهولة الاستخدام للنموذج بنفس أهمية معايير أدائه الخام.
تم بناء YOLO11 بشكل كبير على مبدأ سهولة وصول المطورين. تقوم حزمة ultralytics الشاملة بتجريد المهام الشاقة لتحليل مجموعات البيانات، والزيادة (augmentation)، وضبط المعلمات الفائقة. يتطلب تصدير النماذج إلى تنسيقات الإنتاج مثل ONNX، وTensorRT، وOpenVINO أمراً واحداً فقط.
from ultralytics import YOLO
# Initialize YOLO11 object detection model
model = YOLO("yolo11s.pt")
# Train the model with mixed precision on COCO8
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to TensorRT for edge deployment
model.export(format="engine", device=0)يقدم DAMO-YOLO، الذي ينبع من خلفية أكاديمية وبحثية مكثفة، منحنى تعلم أكثر حدة. غالباً ما يتضمن تحقيق أقصى دقة له مسارات معقدة لتقطير المعرفة (knowledge distillation) - مما يعني أنه يجب عليك أولاً تدريب شبكة "معلم" ضخمة قبل تمرير هذه المعرفة إلى شبكة "طالب" أصغر. هذا يؤدي إلى تضخيم كبير في عبء حوسبة GPU المطلوب ومدة التدريب الإجمالية مقارنة بحلقات التدريب البسيطة لنماذج Ultralytics.
حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLO11 و DAMO-YOLO على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
متى تختار YOLO11
يعد YOLO11 خياراً قوياً لـ:
- نشر الحافة في الإنتاج: التطبيقات التجارية على أجهزة مثل Raspberry Pi أو NVIDIA Jetson حيث الموثوقية والصيانة النشطة أمران بالغ الأهمية.
- تطبيقات الرؤية متعددة المهام: المشاريع التي تتطلب اكتشاف، تجزئة، تقدير وضع، وOBB ضمن إطار عمل واحد موحد.
- النماذج الأولية السريعة والنشر: الفرق التي تحتاج إلى التحرك بسرعة من جمع البيانات إلى الإنتاج باستخدام Python API المبسط من Ultralytics.
متى تختار DAMO-YOLO
يُنصح بـ DAMO-YOLO من أجل:
- تحليلات الفيديو عالية الإنتاجية: معالجة تدفقات الفيديو عالية معدل الإطارات على بنية تحتية ثابتة لـ NVIDIA GPU حيث تعد إنتاجية الدفعة 1 المقياس الأساسي.
- خطوط التصنيع الصناعية: سيناريوهات ذات قيود زمن انتقال صارمة لوحدة معالجة الرسومات على أجهزة مخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
- أبحاث البحث عن البنية العصبية: دراسة تأثيرات البحث المؤتمت عن البنية (MAE-NAS) والهياكل الأساسية المعاد معلمات ذات الكفاءة على أداء الكشف.
متى تختار Ultralytics (YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطورين:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استدلالاً ثابتاً ومنخفض التأخير دون تعقيد المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئات تعتمد فقط على CPU: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث توفر سرعة استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
التطبيقات وحالات الاستخدام في العالم الحقيقي
الأنظمة المستقلة والطائرات بدون طيار
بالنسبة للصور الجوية ونشر الطائرات بدون طيار (UAV)، يوفر YOLO11 توازناً مذهلاً في الأداء. يعد كشف الكائنات الصغيرة عقبة ضخمة في تحليلات الطائرات بدون طيار، لكن YOLO11 يتعامل مع المقاييس المتغيرة أصلاً وبشكل جاهز. بالإضافة إلى ذلك، تسمح متطلبات الذاكرة المنخفضة لمتغيرات YOLO11 Nano و Small بالعمل مباشرة على وحدات معالجة مركزية (CPUs) خفيفة الوزن أو وحدات NPU مرتبطة بالطائرة بدون طيار.
الأتمتة الصناعية ومراقبة الجودة
في المصانع الذكية، يعد زمن الاستجابة أمراً بالغ الأهمية. بينما يوفر DAMO-YOLO سرعات استدلال قوية على وحدات معالجة الرسومات القوية الخاصة بالخوادم بفضل هيكل RepGFPN، قد يكون التكامل الصارم مبالغاً فيه. غالباً ما يعمل YOLO11 كبديل متفوق لمراقبة الجودة المؤتمتة نظراً لـ واجهات برمجة تطبيقات التتبع البسيطة والقدرة على الانتقال بسلاسة من الكشف البحت إلى مهام مربع الإحاطة الموجه (OBB) إذا كانت العيوب تتطلب التعرف على الحدود بزوايا معينة.
الرعاية الصحية الذكية والتصوير الطبي
مجموعات بيانات التصوير الطبي غالباً ما تكون صغيرة نسبياً، ويعد تجنب الإفراط في الملاءمة (overfitting) أمراً صعباً. تساعد تقنيات الزيادة النشطة، جنباً إلى جنب مع مسارات التعلم بالنقل القياسية التي يوفرها النظام البيئي المصان جيداً لـ Ultralytics، الأطباء والمطورين على نشر نماذج دقيقة لـ كشف الأورام بشكل موثوق. يضمن دعم المجتمع الواسع حل المشكلات في المجالات المعقدة مثل الرعاية الصحية بسرعة.
إذا كنت تبني تطبيقاً جديداً من الصفر، ففكر في استكشاف YOLO26. تم إصداره في أوائل عام 2026، وهو يستخدم مُحسِّن MuSGD ووظائف ProgLoss، مما يوفر دقة استثنائية على الكائنات الصغيرة ويقدم مساراً شاملاً (end-to-end) بدون NMS جاهزاً للاستخدام!
في النهاية، بينما يظل DAMO-YOLO عرضاً قوياً للبحث عن البنية العصبية، يظل YOLO11 وعائلة Ultralytics الموسعة التوصية الحاسمة لمهام الرؤية الحاسوبية في العالم الحقيقي، مع إعطاء الأولوية للنشر السريع، وسهولة المطورين، والأداء متعدد الوسائط من الطراز الأول.