Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv8 مقابل RTDETRv2#

يشهد مجال الرؤية الحاسوبية تطوراً مستمراً، حيث تدفع البنيات الجديدة حدود الممكن في اكتشاف الأشياء في الوقت الفعلي. من أبرز النماذج التي حظيت باهتمام كبير Ultralytics YOLOv8 و RTDETRv2 من Baidu. يقدم هذا الدليل مقارنة فنية شاملة بين هذين النموذجين القويين، مع استكشاف بنيتهما، ومقاييس الأداء، وسيناريوهات النشر المثالية.

Link to this sectionنظرة عامة على YOLOv8#

يمثل Ultralytics YOLOv8 علامة فارقة في عائلة نماذج YOLO (You Only Look Once). وهو يستند إلى سنوات من الأبحاث الأساسية لتقديم سرعة ودقة استثنائيتين وسهولة في الاستخدام لمجموعة واسعة من المهام.

الخصائص الرئيسية:

Link to this sectionالمعمارية ونقاط القوة#

يقدم YOLOv8 بنية انسيابية تعمل على تحسين استخراج الميزات وانحدار مربعات الإحاطة. إنه كاشف خالٍ من المراسي (anchor-free)، مما يبسط رأس التنبؤ ويقلل من عدد تعديلات المعلمات الفائقة المطلوبة أثناء التدريب. تضمن هذه البنية توازناً رائعاً في الأداء بين سرعة الاستدلال ومتوسط الدقة (mAP)، مما يجعله مناسباً جداً للنشر في العالم الحقيقي على كل من أجهزة الحافة وخوادم السحابة.

علاوة على ذلك، يتطلب YOLOv8 متطلبات ذاكرة أقل بكثير أثناء التدريب مقارنة بالبنيات القائمة على المحولات (transformer-based). وهذا يسمح للمطورين بتدريب النماذج على وحدات معالجة الرسومات الاستهلاكية القياسية دون مواجهة أخطاء نفاد الذاكرة.

Link to this sectionتعدد الاستخدامات#

إحدى نقاط القوة المحددة لـ YOLOv8 هي تعدد استخداماته الأصلي. فبينما يركز العديد من النماذج فقط على مربعات الإحاطة، يوفر YOLOv8 دعماً جاهزاً لـ اكتشاف الأشياء، وتجزئة الحالات، وتصنيف الصور، وتقدير الوضعية، واكتشاف مربعات الإحاطة الموجهة (OBB).

تعرف على المزيد حول YOLOv8

Link to this sectionنظرة عامة على RTDETRv2#

يعتمد RTDETRv2 (Real-Time Detection Transformer version 2) على RT-DETR الأصلي، بهدف جلب آليات الانتباه القوية في Vision Transformers إلى تطبيقات اكتشاف الأشياء في الوقت الفعلي.

الخصائص الرئيسية:

Link to this sectionالمعمارية ونقاط القوة#

يستفيد RTDETRv2 من بنية هجينة تجمع بين العمود الفقري للشبكة العصبية التلافيفية (CNN) وبنية ترميز-فك تشفير المحولات. يسمح هذا للنموذج بالتقاط علاقات مكانية معقدة وسياق عالمي من خلال آليات الانتباه الذاتي. باستخدام مجموعة من استراتيجيات التدريب "bag-of-freebies"، يحقق RTDETRv2 درجات mAP تنافسية على مجموعات بيانات قياسية مثل مجموعة بيانات COCO.

Link to this sectionنقاط الضعف#

على الرغم من دقته العالية، فإن الطبيعة القائمة على المحولات لـ RTDETRv2 تؤدي إلى زيادة استهلاك الذاكرة وأوقات تدريب أبطأ مقارنة ببنيات CNN الصرفة. تتطلب المحولات بطبيعتها المزيد من VRAM، مما يجعل تدريبها تحدياً على الأجهزة ذات الموارد المحدودة. بالإضافة إلى ذلك، بينما يتمتع RTDETRv2 بقوة في الاكتشاف، فإنه يفتقر إلى تعدد المهام (مثل تقدير الوضعية والتجزئة) المتأصل في نظام Ultralytics البيئي.

تعرف على المزيد حول RTDETRv2

Link to this sectionمقارنة الأداء#

عند تقييم النماذج للإنتاج، يعد التوازن بين حجم النموذج، وسرعة الاستدلال، والدقة أمراً بالغ الأهمية. يوفر الجدول أدناه مقارنة مباشرة بين متغيرات YOLOv8 و RTDETRv2.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259
الأجهزة والمقاييس

تم قياس السرعات باستخدام مثيل Amazon EC2 P4d. استفاد استدلال CPU من ONNX، بينما تم اختبار سرعات GPU باستخدام TensorRT.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOv8 و RT-DETR على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOv8#

يعد YOLOv8 خياراً قوياً لـ:

  • النشر متعدد المهام المتنوع: المشاريع التي تتطلب نموذجاً ثابتاً لـ الكشف، والتجزئة، والتصنيف، وتقدير الوضعية داخل نظام Ultralytics البيئي.
  • أنظمة الإنتاج الراسخة: بيئات الإنتاج الحالية المبنية بالفعل على بنية YOLOv8 مع خطوط أنابيب نشر مستقرة ومختبرة جيداً.
  • دعم مجتمعي ونظام بيئي واسع: التطبيقات التي تستفيد من دروس YOLOv8 الواسعة، والتكاملات مع أطراف ثالثة، وموارد المجتمع النشطة.

Link to this sectionمتى تختار RT-DETR#

يوصى بـ RT-DETR لـ:

  • أبحاث الاكتشاف القائمة على Transformer: المشاريع التي تستكشف آليات الانتباه وهياكل transformer لاكتشاف الكائنات بنهاية واحدة دون NMS.
  • سيناريوهات الدقة العالية مع زمن انتقال مرن: التطبيقات التي تكون فيها دقة الاكتشاف هي الأولوية القصوى ويكون زمن انتقال الاستنتاج الأعلى قليلاً مقبولاً.
  • اكتشاف الكائنات الكبيرة: المشاهد التي تحتوي بشكل أساسي على كائنات متوسطة إلى كبيرة حيث توفر آلية الانتباه العالمي للمحولات ميزة طبيعية.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionميزة Ultralytics#

يتجاوز اختيار النموذج مجرد المقاييس الخام؛ فالنظام البيئي البرمجي المحيط أمر بالغ الأهمية لإنتاجية المطورين. يشتهر نظام Ultralytics البيئي بسهولة استخدامه، حيث يوفر واجهة برمجة تطبيقات Python موحدة تبسط دورة حياة التعلم الآلي بأكملها.

من إدارة مجموعات البيانات إلى التدريب الموزع، يقوم Ultralytics بتجريد التعليمات البرمجية المعقدة. يستفيد المطورون من الأوزان المدربة مسبقاً المتاحة بسهولة والتكامل السلس مع منصات مثل Hugging Face وأدوات المراقبة. يضمن هذا النظام البيئي المُدار جيداً التطوير النشط، والتحديثات المتكررة، ودعم المجتمع القوي.

علاوة على ذلك، تعد كفاءة التدريب سمة مميزة لنماذج Ultralytics YOLO. فهي مُحسّنة للغاية للتقارب السريع وتقليل آثار الذاكرة أثناء عملية التدريب، مما يسرع بشكل كبير دورات التجريب مقارنة بالكواشف القائمة على المحولات مثل RTDETRv2.

Link to this sectionنظرة إلى المستقبل: قوة YOLO26#

بينما يظل YOLOv8 قوة رائدة، يجب على المطورين الذين يبحثون عن أحدث التقنيات التفكير في الترقية إلى YOLO26 المرتقب بشدة، الذي تم إصداره في يناير 2026. يعيد YOLO26 تعريف أحدث التقنيات بعدة ابتكارات رائدة:

  • تصميم شامل (End-to-End) بدون NMS: يلغي YOLO26 معالجة Non-Maximum Suppression (NMS) اللاحقة، مما يؤدي إلى سير عمل نشر أسرع وأكثر حتمية.
  • إزالة DFL: تعمل إزالة Distribution Focal Loss على تبسيط النموذج لتعزيز التوافق مع أجهزة الحافة والأجهزة منخفضة الطاقة.
  • محسن MuSGD: من خلال دمج ابتكارات تدريب LLM، يضمن محسن MuSGD عمليات تدريب أكثر استقراراً وتقارباً أسرع.
  • سرعة استدلال على CPU تصل إلى 43% أسرع: مُحسّن بشكل كبير للبيئات التي تفتقر إلى وحدات معالجة رسومات مخصصة.
  • ProgLoss + STAL: تحقق وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية للصور الجوية والروبوتات.

تشمل البدائل الحديثة الأخرى التي تستحق الاستكشاف ضمن مجموعة Ultralytics طراز YOLO11، الذي يوفر أداءً قوياً للمشاريع القديمة، على الرغم من أن YOLO26 موصى به لجميع عمليات النشر الجديدة.

Link to this sectionمثال برمجي: التدريب والاستدلال#

تعني بساطة واجهة برمجة تطبيقات Ultralytics أنه يمكنك تحميل النماذج وتدريبها ونشرها في بضعة أسطر فقط من كود Python. تأكد من تثبيت PyTorch قبل تشغيل المثال التالي.

from ultralytics import YOLO

# Load a pretrained YOLOv8 small model
model = YOLO("yolov8s.pt")

# Train the model on your custom dataset
# Memory efficient training allows for larger batch sizes
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, batch=16)

# Run inference on a test image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

# Export seamlessly for edge deployment
export_path = model.export(format="onnx")
جاهز للنشر

يدعم Ultralytics التصدير بنقرة واحدة إلى تنسيقات عديدة، بما في ذلك ONNX و TensorRT و CoreML، مما يبسط خيارات نشر النموذج عبر بنيات الأجهزة المختلفة.

Link to this sectionالخلاصة#

يوفر كل من YOLOv8 و RTDETRv2 قدرات مقنعة لاكتشاف الأشياء في الوقت الفعلي. يوضح RTDETRv2 قوة المحولات في التقاط السياق العالمي، مما يجعله مناسباً لمهام التفكير المكاني المعقدة حيث لا تكون سرعة الاستدلال وحمل الذاكرة هما القيد الأساسي.

ومع ذلك، بالنسبة للمطورين الذين يعطون الأولوية لتوازن استثنائي بين السرعة والدقة وكفاءة الموارد، تظل نماذج Ultralytics YOLO الخيار المتفوق. الطبيعة خفيفة الوزن لـ YOLOv8، جنباً إلى جنب مع سهولة استخدامه التي لا مثيل لها، وتعدد استخداماته عبر مهام الرؤية المتعددة، ونظام بيئي مزدهر مفتوح المصدر، تجعله الحل الأمثل لبيئات الإنتاج القابلة للتطوير. بالنسبة لأولئك الذين يبحثون عن قمة أداء الحافة، يوفر YOLO26 الذي تم إصداره حديثاً كفاءة لا مثيل لها بدون NMS والتي تواصل قيادة الصناعة.

التعليقات