Meet YOLO26: next-gen vision AI.

Link to this sectionمقارنة بين DAMO-YOLO و EfficientDet#

أنتج تطور الرؤية الحاسوبية مجموعة من البنى التحتية القوية المصممة لتلبية متطلبات العالم الحقيقي المتنوعة. فبينما تعطي بعض الأطر الأولوية لقابلية التوسع الهائلة، يركز البعض الآخر بشكل كبير على سرعة الاستنتاج في الوقت الفعلي. في هذه المقارنة التقنية، نستكشف DAMO-YOLO و EfficientDet، وهما نموذجان مؤثران للغاية يظهران نهجاً متميزاً لحل مشكلة كشف الأشياء. سنقوم بتحليل بنيتهما، ومقارنة أداء قياساتهما، وفي النهاية استكشاف سبب كون Ultralytics YOLO26 الذي تم إصداره حديثاً يمثل الخيار الأمثل لعمليات النشر الإنتاجية الحديثة.

Link to this sectionنظرة عامة على البنية#

تم تصميم كلا النموذجين لمعالجة المقايضة بين الكفاءة والدقة، لكنهما يعتمدان على آليات مختلفة جذرياً لتحقيق أهدافهما.

Link to this sectionDAMO-YOLO: السرعة من خلال البحث في بنية الشبكة العصبية#

تم تطوير DAMO-YOLO لدفع حدود الكشف في الوقت الفعلي، حيث يستفيد من تقنيات البحث الآلي لبناء شبكات عالية الكفاءة مصممة للبيئات ذات زمن الاستجابة المنخفض.

تفاصيل DAMO-YOLO:
المؤلفون: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, و Xiuyu Sun
المؤسسة: Alibaba Group
التاريخ: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO

تم بناء DAMO-YOLO حول عمود فقري يعتمد على البحث في بنية الشبكة العصبية (NAS) والذي يعمل على تحسين كل من السرعة والدقة. يقدم النموذج RepGFPN (شبكة هرمية للميزات المعممة والمعاد برمجتها)، والتي تعزز دمج الميزات مع الحفاظ على سرعات استنتاج عالية. علاوة على ذلك، يقلل تصميم ZeroHead الخاص به من العبء الحسابي المرتبط عادةً برؤوس الكشف. يستفيد النموذج أيضاً من AlignedOTA (تخصيص النقل الأمثل المحاذاة) وتحسين التقطير، مما يضمن تعلم حتى أصغر المتغيرات تمثيلات غنية من النماذج الأكبر.

اعرف المزيد عن DAMO-YOLO

Link to this sectionEfficientDet: قابلية التوسع من خلال التوسع المركب#

على النقيض من النهج الذي يضع السرعة في المقام الأول، يركز EfficientDet على قابلية التوسع المنهجي عبر ميزانيات حوسبة متنوعة.

تفاصيل EfficientDet:
المؤلفون: Mingxing Tan, Ruoming Pang, و Quoc V. Le
المؤسسة: Google Brain
التاريخ: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: https://github.com/google/automl/tree/master/efficientdet

يقدم EfficientDet تقنية BiFPN (شبكة هرمية للميزات ثنائية الاتجاه)، والتي تسمح بدمج ميزات متعددة المقاييس بسهولة وسرعة. على عكس الطرق التقليدية التي توسع البنى عن طريق إضافة طبقات أو قنوات بشكل عشوائي، يستخدم EfficientDet طريقة توسع مركبة تقوم بتوسيع الدقة والعمق والعرض للعمود الفقري وشبكة الميزات وشبكات توقع الصندوق/الفئة بشكل موحد في وقت واحد. يسمح هذا للنموذج بتحقيق دقة متطورة على الأجهزة المتطورة مع تقديم متغيرات أصغر للبيئات ذات الموارد المحدودة.

اعرف المزيد عن EfficientDet

Link to this sectionمقارنة الأداء والمقاييس#

عند مقارنة هذه النماذج جنباً إلى جنب، تصبح المقايضة بين الدقة المطلقة وسرعة الاستنتاج واضحة. يوضح الجدول أدناه مقاييس الأداء الرئيسية، مع تسليط الضوء على كيفية مقارنة قدرات الاستنتاج لـ DAMO-YOLO مع عائلة نماذج EfficientDet.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

كما رأينا أعلاه، يحقق EfficientDet-d7 أعلى دقة إجمالية، مما يجعله مناسباً للتطبيقات السحابية الصارمة. في المقابل، توفر سلسلة DAMO-YOLO دقة تنافسية للغاية مع زمن استجابة أقل بكثير على أجهزة GPU، مما يجعلها مرشحاً أقوى لنشرها في الحافة في الوقت الفعلي.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين DAMO-YOLO و EfficientDet على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار DAMO-YOLO#

يعد DAMO-YOLO خياراً قوياً لما يلي:

  • تحليلات الفيديو ذات الإنتاجية العالية: معالجة تدفقات الفيديو ذات معدل الإطارات العالي على بنية تحتية ثابتة لوحدات GPU من NVIDIA حيث يكون إنتاجية الدفعة-1 هو المقياس الأساسي.
  • خطوط التصنيع الصناعية: السيناريوهات ذات قيود زمن انتقال GPU صارمة على أجهزة مخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
  • أبحاث البحث في البنية العصبية: دراسة تأثيرات البحث الآلي في البنية (MAE-NAS) والهياكل الأساسية المعاد برمجتها بكفاءة على أداء الاكتشاف.

Link to this sectionمتى تختار EfficientDet#

يُنصح باستخدام EfficientDet في الحالات التالية:

  • خطوط أنابيب Google Cloud وTPU: الأنظمة المتكاملة بعمق مع واجهات برمجة تطبيقات Google Cloud Vision أو بنية TPU التحتية حيث يتمتع EfficientDet بتحسين أصلي.
  • أبحاث القياس المركب (Compound Scaling): المقارنة المعيارية الأكاديمية التي تركز على دراسة تأثيرات موازنة عمق الشبكة، وعرضها، وتوسيع نطاق الدقة.
  • النشر عبر الهاتف المحمول باستخدام TFLite: المشاريع التي تتطلب تحديداً تصدير TensorFlow Lite لأجهزة Android أو أجهزة Linux المدمجة.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionالبديل الحديث: Ultralytics YOLO26#

بينما يمثل كل من DAMO-YOLO و EfficientDet معالم أكاديمية مهمة، غالباً ما يتطلب النشر في العالم الحقيقي نهجاً أكثر توازناً وغنى بالميزات وصديقاً للمطورين. وهنا يضع Ultralytics YOLO26 معياراً صناعياً جديداً.

تم إصدار YOLO26 في يناير 2026، وهو يبني على إرث أسلافه، بما في ذلك Ultralytics YOLO11 و YOLOv8، مما يوفر تحولاً جذرياً في كيفية تعاملنا مع كشف الأشياء.

بساطة شاملة (End-to-End)

يتميز YOLO26 بتصميم أصلي End-to-End NMS-Free. من خلال القضاء على قمع الحدود غير القصوى (NMS) أثناء المعالجة اللاحقة - وهو عنق زجاجة أرقّ كاشفات الأشياء لسنوات - يوفر YOLO26 خط أنابيب نشر أبسط وأسرع بكثير، خاصة على أجهزة الحافة.

Link to this sectionأداء وتعدد استخدامات لا مثيل لهما#

لا يحسن YOLO26 السرعة فحسب، بل يعيد تعريف استقرار التدريب والدقة. إنه يقدم MuSGD Optimizer، وهو هجين من SGD و Muon مستوحى من ابتكارات تدريب LLM، مما يؤدي إلى معدلات تقارب أسرع بشكل كبير وكفاءة تدريب متفوقة. على عكس البدائل الثقيلة القائمة على Transformer مثل RT-DETR، يحافظ YOLO26 على متطلبات ذاكرة منخفضة بشكل لا يصدق، مما يضمن إمكانية تدريبه على أجهزة المستهلك العادية.

علاوة على ذلك، يدمج YOLO26 تقنية ProgLoss + STAL، مما يحسن بشكل كبير التعرف على الأشياء الصغيرة وهو أمر حيوي لحالات الاستخدام مثل الصور الجوية للطائرات بدون طيار والروبوتات. ولتحسين الأجهزة منخفضة الطاقة، أزال YOLO26 خسارة التنسيق التوزيعي (DFL)، مما أدى إلى سرعة استنتاج على CPU أسرع بنسبة تصل إلى 43% مقارنة بالأجيال السابقة.

Link to this sectionالنظام البيئي وسهولة الاستخدام#

أحد أكبر العقبات التي تواجه نماذج مثل EfficientDet هو عملية التكامل المعقدة. في المقابل، توفر منصة Ultralytics نظاماً بيئياً متكاملاً يتم صيانته جيداً. من خلال API موحد، يمكن للمستخدمين التبديل بسهولة بين الكشف، تجزئة المثيلات، تقدير الوضع، تصنيف الصور، و صناديق التحديد الموجهة (OBB).

إليك مدى بساطة التدريب وتشغيل الاستنتاج باستخدام YOLO26 عبر حزمة Ultralytics Python:

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset with minimal memory footprint
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run ultra-fast NMS-free inference
predictions = model.predict("image.jpg")

تعرف على المزيد حول YOLO26

Link to this sectionالخلاصة#

في حين أن استكشاف DAMO-YOLO في مواجهة EfficientDet يوفر رؤى ممتازة حول المقايضات بين البحث في بنية الشبكة العصبية والتوسع المركب، يحتاج المطورون المعاصرون إلى أدوات تسد الفجوة بين البحث الأكاديمي وواقع الإنتاج.

بالنسبة للمطورين الذين يعطون الأولوية لسهولة الاستخدام، ومجتمع مفتوح المصدر نشط، وتوازن لا يضاهى بين السرعة والدقة، فإن Ultralytics YOLO26 هو الخيار النهائي. إن بنيته الخالية من NMS، وانخفاض عبء التدريب، والتكامل السلس مع نظام Ultralytics البيئي الشامل تجعله الإطار الأمثل لمشروع الرؤية الحاسوبية التالي الخاص بك.

المساهمون

التعليقات