Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDet مقابل DAMO-YOLO#

عند بناء خطوط أنابيب رؤية حاسوبية قابلة للتوسع، يُعد اختيار بنية النموذج الصحيحة قراراً حاسماً يؤثر على كل من جدوى النشر ودقة الاكتشاف. يقدم هذا الدليل مقارنة تقنية متعمقة بين بنيتين معروفتين في مجال التعرف البصري: EfficientDet و DAMO-YOLO.

بينما قدم كلا النموذجين ابتكارات مهمة في مجال اكتشاف الكائنات، مهد التطور السريع لذكاء الرؤية الاصطناعي الطريق لأنظمة بيئية أكثر تكاملاً. خلال هذا التحليل، سوف نستكشف الآليات الأساسية لهذه الشبكات القديمة مع توضيح سبب كون الحلول الحديثة مثل منصة Ultralytics و Ultralytics YOLO26 قد أصبحت المعيار الصناعي لبيئات الإنتاج.

Link to this sectionEfficientDet: اكتشاف كائنات قابل للتوسع وفعال#

تم تصميم EfficientDet، الذي قدمه باحثون في Google، لتوسيع بنية النموذج بشكل منهجي مع الحفاظ على كفاءة عالية. وقد حقق ذلك من خلال الاستفادة من التوسع المركب عبر عمق الشبكة، وعرضها، ودقة المدخلات.

تفاصيل EfficientDet: المؤلفون: Mingxing Tan، وRuoming Pang، وQuoc V. Le
المؤسسة: Google Brain
التاريخ: 2019-11-20
Arxiv: 1911.09070
GitHub: google/automl

Link to this sectionالابتكارات المعمارية#

تتمثل المساهمة الرئيسية لـ EfficientDet في شبكة هرمية للميزات ثنائية الاتجاه (BiFPN). وعلى عكس شبكات FPN التقليدية، تتيح BiFPN دمجاً سهلاً وسريعاً للميزات متعددة النطاقات باستخدام أوزان قابلة للتعلم لفهم أهمية ميزات المدخلات المختلفة. يتم دمج هذا مع العمود الفقري الخاص بـ EfficientNet، مما ينتج عنه عائلة من النماذج (من D0 إلى D7) تتوسع بشكل يمكن التنبؤ به.

Link to this sectionنقاط القوة والضعف#

تكمن القوة الرئيسية لـ EfficientDet في كفاءة معلماتها. بالنسبة للمهام التي تتطلب زيادة متوسط الدقة (mAP) إلى الحد الأقصى في بيئات سحابية مقيدة بشدة، فإن طريقة التوسع المركب الخاصة بها يمكن التنبؤ بها بشكل كبير. ومع ذلك، فإن EfficientDet معقدة للغاية للتدريب من الصفر وغالباً ما تتطلب ضبطاً للمعاملات الفائقة بشكل كبير. علاوة على ذلك، فإن اعتمادها الكبير على عمليات TensorFlow محددة يجعل الانتقال إلى عمليات النشر على الحافة عبر ONNX أو TensorRT أكثر تعقيداً مقارنة بـ قدرات التصدير المبسطة الموجودة في نماذج YOLO الحديثة.

اعرف المزيد عن EfficientDet

Link to this sectionDAMO-YOLO: البحث الآلي عن البنية قيد التنفيذ#

يمثل DAMO-YOLO نهجاً متميزاً، حيث يستخدم البحث عن بنية الشبكة العصبية (NAS) لتصميم هياكل الشبكة المثلى للاستنتاج في الوقت الفعلي تلقائياً.

تفاصيل DAMO-YOLO: المؤلفون: Xianzhe Xu، وYiqi Jiang، وWeihua Chen، وYilun Huang، وYuan Zhang، وXiuyu Sun
المؤسسة: Alibaba Group
التاريخ: 2022-11-23
Arxiv: 2211.15444v2
GitHub: tinyvision/DAMO-YOLO

Link to this sectionالابتكارات المعمارية#

يقدم DAMO-YOLO العديد من التقنيات الجديدة. فهو يستخدم عموداً فقرياً تم إنشاؤه بواسطة NAS يسمى MAE-NAS، وشبكة RepGFPN فعالة لعنق النموذج، وتصميم ZeroHead الذي يقلل بشكل كبير من التكلفة الحسابية لـ رأس الاكتشاف. علاوة على ذلك، فإنه يستخدم AlignedOTA لتعيين التسميات ويعتمد بشكل كبير على تعزيز تقطير المعرفة لتحسين أداء متغيراته الأصغر.

Link to this sectionنقاط القوة والضعف#

يتألق DAMO-YOLO في سرعات استنتاج GPU، حيث تم تصميمه خصيصاً للنشر على بنية NVIDIA باستخدام TensorRT. من خلال إزالة هياكل الرأس الثقيلة، يقدم النموذج تنبؤات ذات زمن انتقال منخفض. وعلى العكس من ذلك، يمكن للبحث الآلي عن البنية أن يجعل هيكل النموذج غامضاً ويصعب تصحيحه أو ضبطه يدوياً لأجهزة الحافة المخصصة. وعلى عكس Ultralytics YOLO11 متعدد الاستخدامات، يركز DAMO-YOLO بشكل أساسي على اكتشاف صناديق الإحاطة القياسية، ويفتقر إلى دعم أصلي لمهام متقدمة مثل تقدير الوضع أو اكتشاف صندوق الإحاطة الموجه (OBB) خارج الصندوق.

تعرف على المزيد حول DAMO-YOLO

Link to this sectionمقارنة الأداء#

إن فهم المقايضات التجريبية ضروري لاختيار النموذج. يقارن الجدول أدناه عائلة EfficientDet مقابل سلسلة DAMO-YOLO عبر مقاييس أداء حاسمة.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
تحليل البيانات

يحقق EfficientDet-d7 أعلى دقة نظرية ولكنه يتطلب قدرة حوسبة هائلة، مما يجعله غير مناسب لـ edge AI. يوفر DAMO-YOLO سرعات TensorRT استثنائية، على الرغم من أنه يتطلب بشكل عام معاملات أكثر من نماذج EfficientDet ذات الفئة الأدنى لتحقيق دقة مماثلة.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين EfficientDet و DAMO-YOLO على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار EfficientDet#

يعد EfficientDet خياراً قوياً في الحالات التالية:

  • خطوط أنابيب Google Cloud وTPU: الأنظمة المتكاملة بعمق مع واجهات برمجة تطبيقات Google Cloud Vision أو بنية TPU التحتية حيث يتمتع EfficientDet بتحسين أصلي.
  • أبحاث القياس المركب (Compound Scaling): المقارنة المعيارية الأكاديمية التي تركز على دراسة تأثيرات موازنة عمق الشبكة، وعرضها، وتوسيع نطاق الدقة.
  • النشر عبر الهاتف المحمول باستخدام TFLite: المشاريع التي تتطلب تحديداً تصدير TensorFlow Lite لأجهزة Android أو أجهزة Linux المدمجة.

Link to this sectionمتى تختار DAMO-YOLO#

يوصى باستخدام DAMO-YOLO من أجل:

  • تحليلات الفيديو ذات الإنتاجية العالية: معالجة تدفقات الفيديو ذات معدل الإطارات العالي على بنية تحتية ثابتة لوحدات GPU من NVIDIA حيث يكون إنتاجية الدفعة-1 هو المقياس الأساسي.
  • خطوط التصنيع الصناعية: السيناريوهات ذات قيود زمن انتقال GPU صارمة على أجهزة مخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
  • أبحاث البحث في البنية العصبية: دراسة تأثيرات البحث الآلي في البنية (MAE-NAS) والهياكل الأساسية المعاد برمجتها بكفاءة على أداء الاكتشاف.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionميزة Ultralytics: التقدم إلى ما بعد النماذج القديمة#

بينما توفر EfficientDet و DAMO-YOLO رؤى أكاديمية قيمة، يحتاج المطورون المعاصرون إلى أطر عمل توازن بين الأداء المتطور وبيئة عمل المطور. وهنا يتفوق نظام Ultralytics البيئي.

Link to this sectionسهولة استخدام ونظام بيئي لا مثيل لهما#

غالباً ما يؤدي نشر النماذج من مستودعات أبحاث منفصلة ومخصصة بشكل كبير إلى كوابيس في التكامل. توفر Ultralytics نظاماً بيئياً موحداً ومصاناً جيداً مع وثائق شاملة وواجهة برمجة تطبيقات (API) برمجية بلغة Python. سواء كنت تستخدم Google Colab للتدريب أو التصدير إلى CoreML للاستنتاج على الأجهزة المحمولة، فإن خط الأنابيب يتطلب بضعة أسطر فقط من التعليمات البرمجية.

from ultralytics import YOLO

# Load the highly recommended YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Export the trained model to ONNX for production
model.export(format="onnx")

Link to this sectionثورة YOLO26#

بالنسبة للمطورين الذين يقيمون EfficientDet أو DAMO-YOLO، يمثل Ultralytics YOLO26 الخطوة التطورية النهائية. تم إصداره في أوائل عام 2026، ويقدم قدرات تغير النموذج الفكري:

  • تصميم بدون NMS من البداية للنهاية: تم ابتكاره لأول مرة بواسطة YOLOv10، يلغي YOLO26 أصلياً الحاجة إلى معالجة لاحقة بقمع غير الأقصى (NMS). وهذا يترجم إلى بنى نشر أبسط بكثير وزمن انتقال ثابت عبر الأجهزة المتنوعة.
  • استنتاج أسرع بنسبة تصل إلى 43% على CPU: بالنسبة لعمليات النشر على الحافة التي تفتقر إلى وحدات GPU ثقيلة - وهي سيناريوهات يعاني فيها DAMO-YOLO - تم تحسين YOLO26 بشكل كبير، مما يوفر تسريعات هائلة على وحدات CPU القياسية.
  • مُحسِّن MuSGD: لسد الفجوة بين ابتكارات النماذج اللغوية الكبيرة (LLM) والرؤية الحاسوبية، يدمج YOLO26 مُحسِّن MuSGD (المستوحى من Moonshot AI)، مما يضمن تدريباً مستقراً بشكل لا يصدق وتقارباً سريعاً مقارنة بحلقات التدريب الهشة لـ EfficientDet.
  • إزالة DFL: إزالة خسارة التوزيع البؤري (Distribution Focal Loss) تبسط عملية التصدير، مما يضمن توافقاً فائقاً مع المتحكمات الدقيقة منخفضة الطاقة وأجهزة Raspberry Pi.
  • ProgLoss + STAL: تحقق هذه الدوال المتقدمة للخسارة تحسينات دراماتيكية في التعرف على الكائنات الصغيرة، وهو مجال تفشل فيه البنيات القديمة تقليدياً.

Link to this sectionكفاءة الذاكرة وتنوع المهام#

على عكس نماذج transformer أو شبكات NAS المدمجة بكثافة، تتميز نماذج Ultralytics بكفاءة الذاكرة الصارمة. فهي تستهلك ذاكرة CUDA أقل بشكل ملحوظ أثناء التدريب، مما يتيح تكراراً سريعاً على الأجهزة الموجهة للمستهلكين.

علاوة على ذلك، في حين أن EfficientDet و DAMO-YOLO مقيدان بصرامة بصناديق الإحاطة، تدعم Ultralytics أصلياً تجزئة المثيلات و تصنيف الصور ضمن نفس إطار العمل البديهي تماماً. للمستخدمين الذين يحتفظون بمشاريع قديمة، يظل Ultralytics YOLOv8 بديلاً قوياً وموسع الانتشار يستحق الاستكشاف.

Link to this sectionالخلاصة#

يتضمن اختيار بنية الرؤية الصحيحة موازنة الأداء النظري الخام مقابل واقع النشر. يقدم EfficientDet نهج توسيع أنيق رياضياً، ويقدم DAMO-YOLO سرعات GPU خام مقنعة. ومع ذلك، بالنسبة للفرق التي تعطي الأولوية للتطوير السريع، وعمليات النشر الموثوقة، والميزات المتطورة، تبرز نماذج Ultralytics بوضوح في المقدمة. من خلال الجمع بين ابتكارات مثل الاستنتاج بدون NMS وتحسين MuSGD، يضمن YOLO26 بناء مشاريع الرؤية الحاسوبية الخاصة بك على أكثر الأسس قدرة وقابلية للصيانة وكفاءة متاحة اليوم.

المساهمون

التعليقات