Link to this sectionYOLO26 مقابل DAMO-YOLO#
عند اختيار نموذج رؤية حاسوبية متطور، فإن إيجاد التوازن الأمثل بين سرعة الاستدلال، والدقة، وسهولة النشر يعد أمراً حاسماً. يقارن هذا الدليل الشامل بين نموذجين بارزين في مجال رؤية الذكاء الاصطناعي: Ultralytics YOLO26 وDAMO-YOLO. ورغم أن كلتا البنيتين تدفعان حدود كشف الكائنات في الوقت الفعلي، إلا أن فلسفات التصميم الأساسية وحالات الاستخدام المقصودة لكل منهما تختلف بشكل كبير.
Link to this sectionالابتكارات المعمارية والتصميم#
Link to this sectionUltralytics YOLO26: معيار الرؤية الأول للحافة (Edge-First)#
تم تطوير YOLO26 بواسطة جلين جوشر وجينغ كيو في Ultralytics وأُصدر في 14 يناير 2026، ويمثل قفزة نوعية هائلة في سلالة YOLO. لقد تم تصميمه من الأساس لحوسبة الحافة، حيث يمزج بسلاسة بين ممارسات تدريب النماذج اللغوية الكبيرة (LLM) المتطورة وبين بنيات الرؤية المتقدمة.
تشمل الاختراقات المعمارية الرئيسية لـ YOLO26 ما يلي:
- تصميم من طرف إلى طرف (End-to-End) بدون NMS: بناءً على العمل الرائد من YOLOv10، يعد YOLO26 نموذجاً من طرف إلى طرف بشكل أصلي. ومن خلال القضاء تماماً على كبت غير الأقصى (NMS) أثناء المعالجة اللاحقة، فإنه يضمن زمن انتقال حتمي ويبسط خطوط أنابيب النشر بشكل هائل.
- إزالة DFL: تعمل إزالة خسارة التوزيع البؤري (Distribution Focal Loss) على تبسيط مخطط النموذج. وهذا يجعل التصدير إلى أطر عمل النشر مثل ONNX وTensorRT أكثر سلاسة ويضمن توافقاً أفضل مع أجهزة الحافة ذات الطاقة المنخفضة.
- مُحسن MuSGD: مستوحى من Kimi K2 التابع لشركة Moonshot AI، يجمع هذا الهجين بين الانحدار العشوائي (SGD) وMuon، مما يجلب ابتكارات تدريب النماذج اللغوية الكبيرة إلى رؤية الحاسوب، مما يؤدي إلى تدريب مستقر بشكل ملحوظ وتقارب سريع.
- ProgLoss + STAL: تقدم دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو أمر ضروري للغاية لـ تحليل الصور الجوية المعتمد على الطائرات بدون طيار وخطوط أنابيب الروبوتات المعقدة.
Link to this sectionDAMO-YOLO: البحث في البنية العصبية على نطاق واسع#
تم تطوير DAMO-YOLO بواسطة شيانزي شو، ويقي جيانغ، وويهوا تشن، ويلون هوانغ، ويوان تشانغ، وشيويو صن من مجموعة علي بابا (أُصدر في 23 نوفمبر 2022)، ويركز بشكل كبير على اكتشاف البنية المؤتمتة. يستخدم البحث، المفصل في ورقة arXiv الخاصة بهم، البحث في البنية العصبية (NAS) للعثور على الهياكل الأساسية المثلى ضمن ميزانيات زمن انتقال صارمة.
تشمل الميزات المعمارية الرئيسية لـ DAMO-YOLO ما يلي:
- هيكل MAE-NAS: يستخدم بحثاً تطورياً متعدد الأهداف لتصميم الهياكل الأساسية تلقائياً التي توازن بين الدقة وسرعة النشر المستهدفة.
- Efficient RepGFPN: تصميم قوي للعنق (Heavy-Neck) يعمل على تحسين دمج الميزات عبر مقاييس مختلفة، مما يجعله قادراً للغاية على معالجة المشاهد المرئية المعقدة.
- ZeroHead: رأس كشف مبسط بشكل جذري مصمم لتقليل العبء الحسابي في طبقات التنبؤ النهائية.
في حين أن بنية DAMO-YOLO المدفوعة بـ NAS ممتازة لقيود أجهزة محددة ومحددة مسبقاً، فإن التصميم الخالي من NMS وإزالة DFL في YOLO26 يجعله خياراً أكثر تنوعاً وقابلية للتنبؤ عبر مجموعة واسعة من بيئات الحافة والسحابة المتغيرة.
Link to this sectionمقارنة الأداء والمقاييس#
تكشف المقارنة المباشرة لمتغيرات النماذج المدربة على مجموعة بيانات COCO القياسية عن ملفات تعريف أداء متميزة. يوضح الجدول أدناه المقايضات بين الدقة (mAP)، والسرعة، والبصمة الحسابية (المعلمات وFLOPs).
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Link to this sectionتحليل الأداء#
عند تحليل البيانات، يميل توازن الأداء بشدة نحو YOLO26 للتطبيقات الحديثة. يتميز متغير Nano (YOLO26n) بخفة وزن استثنائية حيث تبلغ معلماته 2.4 مليون فقط، مما يوفر سرعات مذهلة تصل إلى 1.7 مللي ثانية على وحدة معالجة الرسومات NVIDIA T4. علاوة على ذلك، تم تصميم YOLO26 خصيصاً لتوفير استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU)، مما يجعله البطل بلا منازع لأجهزة الحافة التي تفتقر إلى مسرعات GPU مخصصة.
على الرغم من أن DAMO-YOLOt يتفوق قليلاً على YOLO26n في دقة mAP الصرفة، إلا أنه يفعل ذلك بتكلفة تتطلب ما يقرب من أربعة أضعاف عدد المعلمات (8.5 مليون). ومع انتقالنا إلى المتغيرات الأكبر، يتفوق YOLO26 باستمرار على DAMO-YOLO في الدقة مع الحفاظ على بصمة ذاكرة أصغر، واستخدام أقل لذاكرة CUDA أثناء التدريب، وسرعات TensorRT أسرع بشكل كبير.
Link to this sectionالنظام البيئي، وسهولة الاستخدام، وكفاءة التدريب#
لا تكمن القوة الحقيقية لنموذج التعلم الآلي في مقاييسه الخام فحسب، بل في مدى سهولة استخدامه من قبل المطورين والباحثين.
Link to this sectionميزة Ultralytics#
يضمن اختيار نموذج Ultralytics الوصول إلى نظام بيئي مصقول للغاية ومتمحور حول المطور. يتم اختصار سير العمل المعقد الذي يتضمن زيادة البيانات، وضبط المعلمات الفائقة، وتتبع التجارب القوي في أوامر بديهية.
علاوة على ذلك، يوفر YOLO26 تنوعاً لا مثيل له. فبينما يعد DAMO-YOLO كاشف كائنات فقط، يوفر YOLO26 تحسينات شاملة وخاصة بالمهمة عبر مجالات متعددة خارج الصندوق:
- تجزئة المثيل (Instance Segmentation): باستخدام خسارة التجزئة الدلالية المتخصصة والنماذج الأولية متعددة المقاييس.
- تقدير الوضع (Pose Estimation): الاستفادة من تقدير الاحتمالية اللوغاريتمية المتبقية (RLE) المتقدم.
- صندوق الإحاطة الموجه (OBB): دمج دوال خسارة الزاوية المتخصصة لحل مشكلات الحدود الصعبة بشكل مثالي.
- تصنيف الصور (Image Classification): لتوسيم الصور العالمية السريع والخفيف.
Link to this sectionمنهجيات التدريب#
غالباً ما يتضمن تدريب DAMO-YOLO عملية تقطير معقدة حيث يقوم نموذج "معلم" كبير بتدريب نموذج "طالب" أصغر. ورغم أن هذه التقنية تستخرج مكاسب دقة هامشية، إلا أنها تتطلب ذاكرة GPU واسعة ودورات تدريب أطول.
على العكس من ذلك، فإن متطلبات الذاكرة لـ YOLO26 أقل بكثير. وبفضل مُحسن MuSGD، يتدرب YOLO26 بسرعة وكفاءة على أجهزة المستهلك العادية. إليك مدى سهولة تدريب نموذج YOLO26 باستخدام واجهة برمجة تطبيقات Ultralytics Python المدعومة بـ PyTorch:
from ultralytics import YOLO
# Initialize the natively end-to-end YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
# Export the optimized, NMS-free model
model.export(format="onnx")Link to this sectionتطبيقات العالم الحقيقي#
يعتمد الاختيار بين هذه البنيات في النهاية على بيئة النشر الخاصة بك.
Link to this sectionذكاء الحافة وأجهزة IoT#
بالنسبة للكاميرات الذكية للبيع بالتجزئة، أو شاشات المراقبة الزراعية المؤتمتة، أو الروبوتات، فإن موارد الحوسبة محدودة للغاية. هنا، يعد YOLO26 هو الخيار النهائي. إن استدلاله الأسرع بنسبة 43% على وحدة المعالجة المركزية، وخط الأنابيب الخالي تماماً من NMS، وبصمة المعلمات الصغيرة تسمح له بالعمل بسلاسة على أجهزة الحافة مثل Raspberry Pi دون التضحية بالدقة الحاسمة.
Link to this sectionالتصنيع عالي السرعة ومراقبة الجودة#
في خطوط أتمتة التصنيع سريعة الوتيرة، يتطلب اكتشاف العيوب على أحزمة النقل سريعة الحركة زمن انتقال ضئيلاً وحتمياً. وفي حين يمكن لـ DAMO-YOLO الأداء بشكل كافٍ على تكوينات GPU محددة، فإن زمن الانتقال المتقلب الناجم عن معالجة NMS اللاحقة التقليدية يمكن أن يؤدي إلى إلغاء مزامنة مشغلات الروبوتات. تضمن طبيعة YOLO26 من الطرف إلى الطرف أوقات معالجة إطارات متسقة وقابلة للتنبؤ، مما يضمن تكاملاً مثالياً في الروبوتات الصناعية عالية السرعة.
Link to this sectionالطائرات بدون طيار والتصوير الجوي#
اكتشاف الأجسام الصغيرة من ارتفاعات عالية أمر صعب للغاية. يؤدي دمج ProgLoss وSTAL في YOLO26 إلى تحسين التعرف على الكائنات الصغيرة بشكل كبير. سواء كنت تتعقب الحياة البرية أو تحلل ازدحام المرور من الطائرات بدون طيار (UAVs)، يحدد YOLO26 باستمرار كائنات أصغر مساحة بالبكسل والتي تفوتها البنيات الأقدم، بما في ذلك DAMO-YOLO، بشكل متكرر.
Link to this sectionحالات الاستخدام والتوصيات#
يعتمد الاختيار بين YOLO26 وDAMO-YOLO على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
Link to this sectionمتى تختار YOLO26#
YOLO26 هو خيار قوي لـ:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
- بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
Link to this sectionمتى تختار DAMO-YOLO#
يوصى باستخدام DAMO-YOLO من أجل:
- تحليلات الفيديو ذات الإنتاجية العالية: معالجة تدفقات الفيديو ذات معدل الإطارات العالي على بنية تحتية ثابتة لوحدات GPU من NVIDIA حيث يكون إنتاجية الدفعة-1 هو المقياس الأساسي.
- خطوط التصنيع الصناعية: السيناريوهات ذات قيود زمن انتقال GPU صارمة على أجهزة مخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
- أبحاث البحث في البنية العصبية: دراسة تأثيرات البحث الآلي في البنية (MAE-NAS) والهياكل الأساسية المعاد برمجتها بكفاءة على أداء الاكتشاف.
Link to this sectionالخلاصة#
بينما يظل DAMO-YOLO دراسة رائعة لقدرات البحث في البنية العصبية لأهداف أجهزة محددة، فإن Ultralytics YOLO26 يبرز كحل متفوق ومتكامل لممارس الذكاء الاصطناعي الحديث. بفضل بنيته الخالية من NMS من الطرف إلى الطرف، ومتطلبات الذاكرة الأقل بشكل كبير، ومُحسن MuSGD الهجين، ونظام بيئي مُصان بشكل لا تشوبه شائبة، يعمل YOLO26 على تمكين المطورين من بناء ونشر أنظمة رؤية متطورة بشكل أسرع وأكثر موثوقية من أي وقت مضى.