YOLO26 مقابلYOLO: مقارنة تقنية بين أجهزة الكشف عن الأجسام في الوقت الفعلي
عند اختيار نموذج رؤية حاسوبية متطور، من الضروري إيجاد التوازن الأمثل بين سرعة الاستدلال والدقة وسهولة النشر. يقارن هذا الدليل الشامل بين نموذجين بارزين في مجال الذكاء الاصطناعي للرؤية: Ultralytics و YOLO. في حين أن كلا البنيتين توسعان حدود الكشف عن الكائنات في الوقت الفعلي، فإن فلسفات التصميم الأساسية وحالات الاستخدام المقصودة تختلف بشكل كبير.
الابتكارات المعمارية والتصميم
Ultralytics : معيار الرؤية الذي يركز على الحافة أولاً
تم تطويره بواسطة Glenn Jocher و Jing Qiu في Ultralytics وأُطلق في 14 يناير 2026، يمثل YOLO26 قفزة هائلة إلى الأمام في YOLO . وقد تم تصميمه من الألف إلى الياء للحوسبة المتطورة، حيث يمزج بسلاسة بين ممارسات التدريب المتطورة LLM وبنيات الرؤية المتقدمة.
تشمل الإنجازات المعمارية الرئيسية لـ YOLO26 ما يلي:
- تصميم شامل NMS: بناءً على العمل الرائد من YOLOv10، فإن YOLO26 هو تصميم شامل أصلاً. من خلال التخلص تماماً من تقنية Non-Maximum Suppression (NMS) أثناء المعالجة اللاحقة، فإنه يضمن زمن انتقال حتمي ويبسط بشكل كبير خطوط أنابيب النشر.
- إزالة DFL: تؤدي إزالة Distribution Focal Loss إلى تبسيط الرسم البياني للنموذج. وهذا يجعل التصدير إلى أطر النشر مثل ONNX و TensorRT أكثر سلاسة ويضمن توافقًا أفضل مع الأجهزة الطرفية منخفضة الطاقة.
- MuSGD Optimizer: مستوحى من Kimi K2 من Moonshot AI، هذا المزيج من Stochastic Gradient Descent (SGD) و Muon يجلب ابتكارات تدريب LLM إلى الرؤية الحاسوبية، مما ينتج عنه تدريب مستقر بشكل ملحوظ وتقارب سريع.
- ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر ضروري للغاية لتحليل الصور الجوية الملتقطة بواسطة الطائرات بدون طيار وخطوط الأنابيب الروبوتية المعقدة.
YOLO: البحث عن بنية عصبية على نطاق واسع
تم تطويرYOLO بواسطة Xianzhe Xu و Yiqi Jiang و Weihua Chen و Yilun Huang و Yuan Zhang و Xiuyu Sun من مجموعة Alibaba (تم إصداره في 23 نوفمبر 2022)،YOLO بشكل كبير على اكتشاف البنية التلقائية. تستخدم الأبحاث، التي تم تفصيلها في ورقة arXiv الخاصة بهم، البحث العصبي في البنية (NAS) للعثور على الهياكل الأساسية المثلى في ظل ميزانيات زمن انتقال صارمة.
YOLO الميزات المعمارية الرئيسية لـYOLO ما يلي:
- MAE-NAS Backbone: يستخدم البحث التطوري متعدد الأهداف لتصميم البنية الأساسية تلقائيًا بحيث تحقق التوازن بين الدقة وسرعة النشر المستهدفة.
- RepGFPN الفعال: تصميم قوي ذو عنق ثقيل يعمل على تحسين دمج الميزات عبر مستويات مختلفة، مما يجعله قادرًا على معالجة المشاهد المرئية المعقدة.
- ZeroHead: رأس كشف مبسط للغاية مصمم لتقليل الحمل الحسابي في طبقات التنبؤ النهائية.
اختيار البنية المناسبة
في حين أن بنيةYOLO المدعومة بـ NAS ممتازة لقيود الأجهزة المحددة مسبقًا، فإن التصميمNMS وإزالة DFL في YOLO26 يجعلها خيارًا أكثر تنوعًا وقابلية للتنبؤ عبر مجموعة واسعة من بيئات الحافة والسحابة المتنوعة.
مقارنة الأداء والمقاييس
تكشف المقارنة المباشرة بين نماذج المتغيرات التي تم تدريبها على COCO القياسية عن ملامح أداء مميزة. يوضح الجدول أدناه المفاضلة بين الدقة (mAP) والسرعة والآثار الحسابية (المعلمات وعمليات FLOP).
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
تحليل الأداء
عند تحليل البيانات، يميل ميزان الأداء بشكل كبير نحو YOLO26 للتطبيقات الحديثة. يتميز الإصدار Nano (YOLO26n) بخفة وزنه الاستثنائية حيث يبلغ عدد معلماته 2.4 مليون معلمة فقط، ويوفر سرعات فائقة تصل إلى 1.7 مللي ثانية على GPU NVIDIA . علاوة على ذلك، تم تصميم YOLO26 خصيصًا لتوفير CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعله البطل بلا منازع للأجهزة المتطورة التي تفتقر إلى GPU المخصصة.
في حين أن DAMO-YOLO يتفوق قليلاً على YOLO26n في mAP الخالص، إلا أنه يفعل ذلك على حساب الحاجة إلى ما يقرب من أربعة أضعاف عدد المعلمات (8.5 مليون). مع انتقالنا إلى المتغيرات الأكبر حجماً، يتفوق YOLO26 باستمرار علىYOLO الدقة مع الحفاظ على مساحة ذاكرة أصغر، و CUDA أثناء التدريب، TensorRT أسرع بشكل كبير.
النظام البيئي وقابلية الاستخدام وكفاءة التدريب
تكمن القوة الحقيقية لنموذج التعلم الآلي ليس فقط في مقاييسه الأولية، بل في سهولة استخدامه من قبل المطورين والباحثين.
ميزة Ultralytics
يضمن اختيار Ultralytics الوصول إلى نظام بيئي متطور للغاية ومتمحور حول المطورين. يتم تجريد سير العمل المعقد الذي يتضمن زيادة البيانات وضبط المعلمات الفائقة وتتبع التجارب القوية إلى أوامر بديهية.
علاوة على ذلك، يوفر YOLO26 تنوعًا لا مثيل له. في حين أنYOLO مجرد كاشف للأجسام، فإن YOLO26 يوفر تحسينات شاملة ومخصصة للمهام في مجالات متعددة جاهزة للاستخدام:
- تجزئة الحالات: استخدام خسارة التجزئة الدلالية المتخصصة والنماذج الأولية متعددة المقاييس.
- تقدير الوضع: الاستفادة من تقدير احتمالية اللوغاريتم المتبقية المتقدم (RLE).
- مربع الحدود الموجه (OBB): دمج وظائف فقدان الزاوية المتخصصة لحل مشكلات الحدود الصعبة بشكل مثالي.
- تصنيف الصور: لتصنيف الصور بسرعة وسهولة على مستوى العالم.
منهجيات التدريب
YOLO يتضمن تدريبYOLO عملية تقطير معقدة حيث يقوم نموذج "مدرس" كبير بتدريب نموذج "طالب" أصغر. في حين أن هذه التقنية تحقق مكاسب هامشية في الدقة، إلا أنها تتطلب GPU واسعة ودورات تدريب أطول.
على العكس من ذلك، فإن متطلبات الذاكرة لـ YOLO26 أقل بكثير. مدعومًا بمحسّن MuSGD، يتم تدريب YOLO26 بسرعة وكفاءة على أجهزة قياسية مخصصة للمستهلكين. إليك كيفية تدريب نموذج YOLO26 بسهولة باستخدام PyTorchUltralytics Python المدعوم بـ PyTorch:
from ultralytics import YOLO
# Initialize the natively end-to-end YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
# Export the optimized, NMS-free model
model.export(format="onnx")
استكشاف نماذج أخرى
إذا كنت مهتمًا باستكشاف هياكل حديثة أخرى ضمن نظام Ultralytics ، فإن YOLO11 خيارًا رائعًا للخطوط القديمة. أو يمكن للباحثين المهتمين بالبنى القائمة على المحولات استكشاف RT-DETR .
تطبيقات عملية في أرض الواقع
يعتمد الاختيار بين هذه البنى في النهاية على بيئة النشر الخاصة بك.
أجهزة الذكاء الاصطناعي الحافة وأجهزة إنترنت الأشياء
بالنسبة للكاميرات الذكية المستخدمة في متاجر البيع بالتجزئة، وأجهزة المراقبة الزراعية الآلية، أو الروبوتات، فإن موارد الحوسبة محدودة للغاية. هنا، يعد YOLO26 الخيار الأمثل. CPU الأسرع بنسبة 43٪، وخط الأنابيب NMS تمامًا NMS، والمساحة الصغيرة التي تشغلها المعلمات، تسمح له بالعمل بسلاسة على الأجهزة الطرفية مثل Raspberry Pi دون التضحية بالدقة الحاسمة.
التصنيع عالي السرعة ومراقبة الجودة
في خطوط أتمتة التصنيع سريعة الوتيرة، يتطلب اكتشاف العيوب على سيور النقل سريعة الحركة زمن انتقال حتميًا ضئيلًا. في حين أنYOLO يعمل بشكل مناسب على GPU محددة، فإن زمن الانتقال المتقلب الناتج عن NMS التقليدية NMS يمكن أن يؤدي إلى عدم تزامن المشغلات الروبوتية. تضمن طبيعة YOLO26 الشاملة أوقات معالجة إطارات متسقة ويمكن التنبؤ بها، مما يضمن تكاملًا لا تشوبه شائبة في الروبوتات الصناعية عالية السرعة.
الصور الملتقطة بواسطة الطائرات بدون طيار والطائرات
من المعروف أن اكتشاف الأجسام الصغيرة من ارتفاعات عالية أمر صعب للغاية. أدى دمج ProgLoss و STAL في YOLO26 إلى تحسين كبير في التعرف على الأجسام الصغيرة. سواء كان ذلك في تتبع الحيوانات البرية أو تحليل الازدحام المروري من الطائرات بدون طيار، فإن YOLO26 يتعرف باستمرار على الأجسام ذات مساحة البكسل الأصغر التي غالبًا ما تفوت البنى القديمة، بما في ذلكYOLO.
حالات الاستخدام والتوصيات
YOLO الاختيار بين YOLO26 وYOLO على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار YOLO26
YOLO26 هو خيار قوي لـ:
- نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
- كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.
متى تختار DAMO-YOLO
YOLO في الحالات التالية:
- تحليلات الفيديو عالية الإنتاجية: معالجة تدفقات الفيديو عالية معدل الإطارات في الثانية علىGPU NVIDIA GPU الثابتة حيث يكون إنتاجية الدفعة 1 هو المقياس الأساسي.
- خطوط التصنيع الصناعي: سيناريوهات ذات قيود صارمة GPU على الأجهزة المخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
- أبحاث البحث عن البنية العصبية: دراسة تأثيرات البحث الآلي عن البنية (MAE-NAS) والبنى الأساسية المعاد معايرتها بكفاءة على أداء الكشف.
الخلاصة
بينماYOLO دراسة رائعة في قدرات البحث عن البنية العصبية لأهداف أجهزة محددة، فإن Ultralytics يمثل الحل المتفوق والشامل لممارسي الذكاء الاصطناعي المعاصرين. بفضل بنيته الشاملة NMS ومتطلبات الذاكرة المنخفضة بشكل ملحوظ، ومحسن MuSGD الهجين، ونظام بيئي يتم صيانته بشكل لا تشوبه شائبة، يتيح YOLO26 للمطورين إنشاء ونشر أنظمة رؤية متطورة بشكل أسرع وأكثر موثوقية من أي وقت مضى.