YOLO11 YOLO: مقارنة بين أجهزة الكشف عن الأجسام من الجيل التالي
يعد اختيار البنية المثلى خطوة حاسمة في أي مشروع رؤية حاسوبية. يقدم هذا الدليل الفني مقارنة شاملة بين نموذجين قويين لاكتشاف الكائنات: Ultralytics YOLO11 و DAMO-YOLO. سنتعمق في ابتكاراتهما المعمارية، ونماذج التدريب، وقابليتهما للتطبيق في العالم الحقيقي لمساعدتك في اختيار الأداة الأفضل لاحتياجات النشر الخاصة بك.
نظرات عامة على النموذج
Ultralytics YOLO11
تم تطويره بواسطة فريق Ultral Ultralytics، YOLO11 يمثل إصدارًا متطورًا للغاية في YOLO حيث يعمل على تحسين الدقة والكفاءة بشكل كبير. وهو مصمم للباحثين والمهندسين الذين يبحثون عن نظام بيئي موحد وجاهز للإنتاج يمتد من إدارة مجموعات البيانات إلى النشر المتطور.
- المؤلفون: غلين جوشر وجينغ تشيو
- المؤسسة:Ultralytics
- التاريخ: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- الوثائق:https://docs.ultralytics.com/models/yolo11/
YOLO11 بتعدد استخداماته. في حين أن العديد من النماذج التقليدية تركز فقط على الصناديق المحددة، يدعم YOLO11 اكتشاف الكائنات وتقسيم الحالات وتصنيف الصور وتقدير الوضع. تتيح هذه القدرة متعددة الوسائط للمطورين دمج خطوط إنتاج الذكاء الاصطناعي البصري الخاصة بهم في إطار عمل واحد جيد الصيانة.
DAMO-YOLO
DAMO-YOLO تم تطويره بواسطة باحثين في مجموعة Alibaba. يستفيد من البحث عن البنية العصبية (NAS) لاكتشاف أعمدة فقرية عالية الكفاءة مصممة خصيصًا للاستدلال في الوقت الفعلي على وحدات GPU والمسرعات الأخرى.
- المؤلفون: شيانزه شو، يي تشي جيانغ، وي هوا تشن، ييلون هوانغ، يوان تشانغ، وشيو يو صن
- المؤسسة:مجموعة علي بابا
- التاريخ: 2022-11-23
- Arxiv:https://arxiv.org/abs/2211.15444v2
- GitHub:https://github.com/tinyvision/DAMO-YOLO
- الوثائق:https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
YOLO الفلسفة الأساسية لـYOLO حول إعادة تحديد المعلمات والبحث الآلي. من خلال استخدام MAE-NAS (البحث عن البنية العصبية التطورية متعددة الأهداف)، صمم المؤلفون بنية أساسية مخصصة تعزز بشكل كبير سرعات الاستدلال على الأجهزة المتخصصة. كما أنها تتضمن عنقًا محسّنًا للغاية يسمى Efficient RepGFPN وبنية ZeroHead مبسطة لتقليل زمن الاستجابة إلى الحد الأدنى.
نماذج أخرى يجب أخذها في الاعتبار
عند مقارنة YOLO11 YOLO، ننصحك بالاطلاع على Ultralytics الأحدث. فهو يقدم استنتاجًا شاملاً NMS ويوفر CPU أسرع بنسبة تصل إلى 43٪. يمكنك أيضًا استكشاف المقارنات التي تتضمن YOLOX أو YOLOv8.
مقارنة الأداء والهندسة المعمارية
من الضروري فهم المفاضلات في الأداء عند نشر تطبيقات الذكاء الاصطناعي المتطورة. يوضح الجدول أدناه المقاييس الرئيسية مثل متوسط الدقة (mAP) والكمون وحجم الحوسبة.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
نظرة معمارية متعمقة
YOLO11 يعتمد على بنية أساسية عالية الكفاءة ومصممة خصيصًا توازن تمامًا بين عدد المعلمات والقدرة التمثيلية. إنه محسّن للعمل بكفاءة عبر مجموعة من الأجهزة، ويتفوق أصلاً بأقل استخدام لذاكرة CUDA أثناء التدريب والاستدلال. وهذا يجعله خيارًا ممتازًا للأجهزة الاستهلاكية القياسية أو أجهزة IoT محدودة الموارد.
على العكس من ذلك، تم ضبط البنى الأساسية التي تم إنشاؤها بواسطة MAE-NAS في DAMO-YOLO بدقة لبيئات GPU عالية الإنتاجية. يدمج RepGFPN (شبكة الهرم الميزة المعممة) الفعال الخاص به مقاييس متعددة بقوة. ومع ذلك، بينما تسرع إعادة التوصيف الاستدلال، إلا أنها قد تعقد عملية النشر إذا لم تدعم حزمة الأجهزة الخاصة بك هذه العمليات بشكل صريح.
سهولة الاستخدام وكفاءة التدريب
عند أخذ وقت التطوير في الاعتبار، تصبح سهولة استخدام النموذج بنفس أهمية معاييره الأولية.
YOLO11 يعتمد بشكل كبير على مبدأ إمكانية الوصول للمطورين. الشامل ultralytics تقوم الحزمة بتجريد عملية تحليل مجموعات البيانات وتوسيعها وضبط المعلمات الفائقة من عبء العمل الثقيل. تصدير النماذج إلى تنسيقات الإنتاج مثل ONNX, TensorRT، و OpenVINO يتطلب أمرًا واحدًا فقط.
from ultralytics import YOLO
# Initialize YOLO11 object detection model
model = YOLO("yolo11s.pt")
# Train the model with mixed precision on COCO8
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to TensorRT for edge deployment
model.export(format="engine", device=0)
DAMO-YOLO، النابع من خلفية أكاديمية وبحثية مكثفة، يقدم منحنى تعلم أكثر حدة. غالبًا ما يتضمن تحقيق أقصى دقة له خطوط أنابيب معقدة لتقطير المعرفة—مما يعني أنه يجب عليك أولاً تدريب شبكة "معلم" ضخمة قبل نقل تلك المعرفة إلى شبكة "طالب" أصغر. يؤدي هذا إلى تضخيم كبير في الحمل الزائد المطلوب لحسابات GPU ومدة التدريب الإجمالية مقارنة بحلقات التدريب الخفيفة لنماذج Ultralytics.
حالات الاستخدام والتوصيات
يعتمد الاختيار بين YOLO11 و DAMO-YOLO على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
متى تختار YOLO11
YOLO11 خيار قوي لـ:
- النشر الإنتاجي على الحافة: التطبيقات التجارية على أجهزة مثل Raspberry Pi أو NVIDIA Jetson حيث الموثوقية والصيانة النشطة أمران بالغا الأهمية.
- تطبيقات الرؤية متعددة المهام: المشاريع التي تتطلب الكشف (detect)، والـsegmentation، وتقدير الوضعية (pose estimation)، وOBB ضمن إطار عمل موحد واحد.
- النماذج الأولية والنشر السريع: الفرق التي تحتاج إلى الانتقال بسرعة من جمع البيانات إلى الإنتاج باستخدام واجهة برمجة تطبيقات Ultralytics Python المبسطة.
متى تختار DAMO-YOLO
يوصى بـ DAMO-YOLO لـ:
- تحليلات الفيديو عالية الإنتاجية: معالجة تدفقات الفيديو عالية معدل الإطارات (FPS) على بنية تحتية ثابتة لوحدات معالجة الرسوميات (GPU) من NVIDIA حيث يكون معدل نقل الدفعة الواحدة هو المقياس الأساسي.
- خطوط التصنيع الصناعية: سيناريوهات ذات قيود صارمة على زمن استجابة GPU على الأجهزة المخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
- بحث في بحث البنية العصبية: دراسة تأثيرات البحث التلقائي عن البنية (MAE-NAS) والهياكل الخلفية المُعاد تحديد معلماتها بكفاءة على أداء detect.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
- بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
- اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.
التطبيقات الواقعية وحالات الاستخدام
الأنظمة ذاتية التحكم والطائرات المسيرة
بالنسبة للصور الجوية ونشر الطائرات بدون طيار، YOLO11 توازنًا رائعًا في الأداء. يمثل اكتشاف الأجسام الصغيرة عقبة كبيرة في تحليلات الطائرات بدون طيار، ولكن YOLO11 المقاييس المتنوعة بشكل أصلي فور تشغيله. بالإضافة إلى ذلك، تسمح متطلبات الذاكرة المنخفضة بتشغيل YOLO11 و Small مباشرة على وحدات المعالجة المركزية (CPU) أو وحدات المعالجة العصبية (NPU) الخفيفة المثبتة على الطائرة بدون طيار.
الأتمتة الصناعية ومراقبة الجودة
في المصانع الذكية، يعد زمن الاستجابة أمراً بالغ الأهمية. في حين أن YOLO يوفر سرعات استدلال قوية على وحدات معالجة الرسومات (GPU) الثقيلة من فئة الخوادم بفضل عنق RepGFPN، إلا أن التكامل الصارم قد يكون مبالغاً فيه. YOLO11 يكون YOLO11 بديلاً ممتازاً لمراقبة الجودة الآلية بفضل واجهات برمجة التطبيقات (API) البسيطة للتتبع والقدرة على الانتقال بسلاسة من مهام الكشف البحت إلى مهام الصندوق المحدد الموجه (OBB) إذا كانت العيوب تتطلب التعرف على الحدود الزاوية.
الرعاية الصحية الذكية والتصوير الطبي
غالبًا ما تكون مجموعات بيانات التصوير الطبي صغيرة نسبيًا، ومن الصعب تجنب الإفراط في التكييف. تساعد تقنيات التوسيع النشطة، جنبًا إلى جنب مع خطوط أنابيب التعلم النقلي القياسية التي يوفرها نظام Ultralytics البيئي جيد الصيانة ، الأطباء والمطورين على نشر نماذج دقيقة للكشف عن الأورام بشكل موثوق. يضمن الدعم الواسع من المجتمع حل المشكلات في المجالات المعقدة مثل الرعاية الصحية بسرعة.
احتضان المستقبل مع YOLO26
إذا كنت تقوم ببناء تطبيق جديد من الصفر، ففكر في استكشاف YOLO26. تم إصداره في أوائل عام 2026، ويستخدم وظائف MuSGD Optimizer و ProgLoss، مما يوفر دقة استثنائية على الكائنات الصغيرة ويوفر خط أنابيب شامل NMS جاهز للاستخدام!
في النهاية، بينماYOLO دليلاً قوياً على فعالية البحث في الهندسة العصبية، YOLO11Ultralytics الموسعة تظل التوصية النهائية لمهام الرؤية الحاسوبية في العالم الواقعي، مع إعطاء الأولوية للنشر السريع وسهولة التطوير والأداء متعدد الوسائط من الدرجة الأولى.