Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDet مقابل RTDETRv2: مقارنة متعمقة لمعماريات الكشف عن الأجسام#

يتطلب اختيار المعمارية الأمثل لمشاريع الرؤية الحاسوبية التعامل مع مشهد متنوع من الشبكات العصبية. يستعرض هذا الدليل مقارنة تقنية مفصلة بين نهجين متميزين: EfficientDet، وهي عائلة من الشبكات العصبية التلافيفية (CNN) عالية القابلية للتوسع، وRTDETRv2، وهو نموذج محولات (Transformer) حديث وعالي الأداء في الوقت الفعلي. نقوم بتقييم الاختلافات الهيكلية، ومنهجيات التدريب، ومدى ملاءمة النشر عبر بيئات الأجهزة المختلفة.

من خلال فهم المفاضلات بين كفاءة المعماريات التقليدية وقدرات المحولات الحديثة، يمكن للمطورين اتخاذ قرارات مدروسة. علاوة على ذلك، سنستكشف كيف تعمل البدائل الحديثة مثل Ultralytics YOLO26 الجديد على سد الفجوة، مما يوفر سرعة ودقة وسهولة في الاستخدام لا مثيل لها.

Link to this sectionفهم EfficientDet#

أحدثت EfficientDet ثورة في الكشف عن الأجسام من خلال تقديم نهج منهجي لتوسيع نطاق النموذج.

Link to this sectionالمعمارية والمفاهيم الأساسية#

في جوهرها، تستخدم EfficientDet نموذج EfficientNet كعمود فقري وتقدم شبكة هرمية ميزات ثنائية الاتجاه (BiFPN). تتيح BiFPN دمج الميزات متعددة المقاييس بسهولة وسرعة من خلال تطبيق أوزان قابلة للتعلم لمعرفة أهمية ميزات الإدخال المختلفة. يتم دمج هذا مع طريقة تحجيم مركبة تقوم بتوسيع الدقة والعمق والعرض بشكل موحد لجميع شبكات العمود الفقري، وشبكة الميزات، وشبكات التنبؤ بالصناديق/الفئات في نفس الوقت.

Link to this sectionنقاط القوة والقيود#

تكمن القوة الأساسية لـ EfficientDet في كفاءة معاملاتها. في وقت الإصدار، حققت نماذج مثل EfficientDet-D0 دقة أعلى مع عدد أقل من المعاملات وعمليات النقطة العائمة (FLOPs) مقارنة بإصدارات YOLO السابقة. وهذا جعلها جذابة للغاية للبيئات ذات قيود الحوسبة الصارمة.

ومع ذلك، تعتمد EfficientDet على كبت الحد الأقصى غير (NMS) القياسي أثناء المعالجة اللاحقة لتصفية الصناديق المحيطة المتداخلة، مما قد يسبب اختناقات في زمن الاستجابة في خطوط المعالجة في الوقت الفعلي. بالإضافة إلى ذلك، بينما عملية التدريب موثقة جيدًا، قد يكون الضبط الدقيق لـ EfficientDet مرهقًا مقارنة بتجارب المطورين المحسنة بشكل كبير الموجودة في الأدوات الحديثة.

اعرف المزيد عن EfficientDet

دعم الأنظمة القديمة

بينما مهدت EfficientDet الطريق للشبكات القابلة للتوسع، فإن نشر هذه النماذج على وحدات NPU الحديثة يتطلب غالبًا تحسينًا يدويًا مكثفًا. ولتسهيل عمليات النشر، توفر نماذج Ultralytics الأحدث وظيفة التصدير بنقرة واحدة.

Link to this sectionاستكشاف RTDETRv2#

يمثل RTDETRv2 تطور المعماريات القائمة على المحولات، مما ينقل النموذج بعيدًا عن شبكات CNN التقليدية القائمة على المرساة (Anchor-based).

Link to this sectionالتقدم في المحولات#

يعتمد RTDETRv2 على أساس محول الكشف في الوقت الفعلي (RT-DETR). إنه يستفيد من آليات الانتباه العالمية، مما يتيح للنموذج فهم سياقات المشهد المعقدة دون القيود الموضعية للتلافيف القياسية. الميزة المعمارية الأكثر أهمية هي تصميمه الخالي من NMS بشكل أصلي. من خلال التنبؤ بالأجسام مباشرة من صورة الإدخال، فإنه يبسط خط أنابيب الاستدلال، متجنبًا الضبط الاستدلالي المطلوب بواسطة المعالجة اللاحقة لـ NMS.

Link to this sectionنقاط القوة والضعف#

يتفوق RTDETRv2 في البيئات عالية الكثافة حيث تسبب الأجسام المتداخلة ارتباكًا لشبكات CNN التقليدية. وهو دقيق للغاية في مجموعات بيانات قياسية مثل COCO.

على الرغم من دقته، تتطلب نماذج المحولات بشكل طبيعي ذاكرة كبيرة. كفاءة التدريب أقل بشكل ملحوظ؛ فهي تتطلب عددًا أكبر بكثير من الدورات (Epochs) ومساحات ذاكرة CUDA أكبر للتقارب مقارنة بـ CNN. وهذا يجعل RTDETRv2 أقل مثالية للمطورين الذين يعملون بميزانيات سحابية محدودة أو أولئك الذين يحتاجون إلى نماذج أولية سريعة.

اعرف المزيد عن RTDETRv2

قيود ذاكرة المحولات

يتطلب تدريب نماذج المحولات مثل RTDETRv2 عادةً وحدات GPU متطورة. إذا واجهت أخطاء نفاد الذاكرة (OOM)، فكر في استخدام نماذج ذات متطلبات ذاكرة أقل أثناء التدريب، مثل سلسلة Ultralytics YOLO.

Link to this sectionمقارنة مقاييس الأداء#

يعد فهم مقاييس الأداء الخام أمرًا حيويًا لاختيار النموذج. يعرض الجدول التالي المقارنة بين EfficientDet وRTDETRv2 عبر أحجام مختلفة.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين EfficientDet وRT-DETR على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار EfficientDet#

يعد EfficientDet خياراً قوياً في الحالات التالية:

  • خطوط أنابيب Google Cloud وTPU: الأنظمة المتكاملة بعمق مع واجهات برمجة تطبيقات Google Cloud Vision أو بنية TPU التحتية حيث يتمتع EfficientDet بتحسين أصلي.
  • أبحاث القياس المركب (Compound Scaling): المقارنة المعيارية الأكاديمية التي تركز على دراسة تأثيرات موازنة عمق الشبكة، وعرضها، وتوسيع نطاق الدقة.
  • النشر على الأجهزة المحمولة عبر TFLite: المشاريع التي تتطلب بشكل خاص التصدير إلى TensorFlow Lite لأجهزة Android أو أجهزة Linux المدمجة.

Link to this sectionمتى تختار RT-DETR#

يوصى بـ RT-DETR لـ:

  • أبحاث الاكتشاف القائمة على Transformer: المشاريع التي تستكشف آليات الانتباه وهياكل transformer لاكتشاف الكائنات بنهاية واحدة دون NMS.
  • سيناريوهات الدقة العالية مع زمن انتقال مرن: التطبيقات التي تكون فيها دقة الاكتشاف هي الأولوية القصوى ويكون زمن انتقال الاستنتاج الأعلى قليلاً مقبولاً.
  • اكتشاف الكائنات الكبيرة: المشاهد التي تحتوي بشكل أساسي على كائنات متوسطة إلى كبيرة حيث توفر آلية الانتباه العالمي للمحولات ميزة طبيعية.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionميزة Ultralytics: تقديم YOLO26#

بينما عززت EfficientDet وRTDETRv2 مكانتهما في تاريخ الرؤية الحاسوبية، تتطلب بيئات الإنتاج الحديثة توازنًا مثاليًا بين السرعة والدقة وتجربة مطور استثنائية. يدمج Ultralytics YOLO26 الذي تم إصداره مؤخرًا أفضل جوانب هذه المعماريات المتباينة.

يبرز YOLO26 من خلال الجمع بين النظام البيئي المبسط الذي تشتهر به Ultralytics والآليات الداخلية الرائدة.

Link to this sectionلماذا تختار YOLO26 على المنافسين؟#

  • تصميم شامل خالٍ من NMS: استلهامًا من المحولات مثل RTDETRv2، فإن YOLO26 أصلي وشامل. إنه يلغي المعالجة اللاحقة لـ NMS، مما يضمن خطوط نشر أسرع وأبسط دون تضخم المعاملات الهائل للمحولات البحتة.
  • مُحسِّن MuSGD: مستوحى من ابتكارات تدريب نماذج اللغة الكبيرة (مثل Kimi K2 من Moonshot AI)، يستخدم YOLO26 هجينًا من SGD وMuon. وهذا يوفر استقرارًا غير مسبوق في التدريب ومعدلات تقارب أسرع بكثير مقارنة بالجداول الزمنية المطولة المطلوبة لـ RTDETRv2.
  • محسن للحافة: مع زيادة تصل إلى 43% في سرعة الاستدلال على وحدة المعالجة المركزية (CPU)، صُمم YOLO26 لـ الذكاء الاصطناعي على الحافة. إنه يتفوق بسهولة على نماذج المحولات الثقيلة على الأجهزة المقيدة مثل الهواتف المحمولة والكاميرات الذكية.
  • إزالة DFL: تعمل إزالة خسارة التوزيع البؤري (Distribution Focal Loss) على تبسيط رسم بياني للنموذج، مما يسهل عمليات التصدير السلسة لـ TensorRT وONNX.
  • ProgLoss + STAL: تؤدي دوال الخسارة المتقدمة هذه إلى تحسينات ملحوظة في التعرف على الأجسام الصغيرة، مما يحل عنق زجاجة شائعًا في الصور الجوية والروبوتات.
  • تعدد الاستخدامات: على عكس RTDETRv2، الذي يركز بشكل أساسي على الكشف، يدعم YOLO26 بشكل أصلي تجزئة الأجسام، وتقدير الوضعية، وتصنيف الصور، والصناديق المحيطة الموجهة (OBB) مع تحسينات خاصة بالمهمة مثل RLE للوضعية وخسارة زاوية متخصصة لـ OBB.
نظام بيئي متكامل

من خلال الاستفادة من منصة Ultralytics، يمكنك إدارة مجموعات البيانات الخاصة بك، وتدريب نماذج مثل YOLO26 أو YOLO11 في السحابة، ونشرها بسلاسة عبر واجهات برمجة التطبيقات المرنة.

Link to this sectionبساطة الكود مع Ultralytics#

تجعل واجهة برمجة تطبيقات Python الخاصة بـ Ultralytics المتميزة تدريب النماذج والاستدلال أمرًا تافهًا. يمكن للمطورين بسهولة قياس أداء النماذج أو تشغيل نصوص التدريب البرمجية بأقل قدر من الكود الجاهز.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on a test image
predictions = model.predict("image.jpg")

بالنسبة لأولئك الذين يديرون بنية تحتية قديمة، لا يزال Ultralytics YOLOv8 المشهور خيارًا مستقرًا وقويًا، مما يوضح الموثوقية طويلة المدى لنظام Ultralytics البيئي. سواء كنت تقوم بتشغيل خوارزميات تتبع في الوقت الفعلي معقدة أو كشف بسيط عن العيوب، فإن الترقية إلى YOLO26 تضمن أن نظامك مستعد للمستقبل، وعالي الدقة، وفعال في الذاكرة.

التعليقات