Meet YOLO26: next-gen vision AI.

Link to this sectionRTDETRv2 مقابل YOLOv5#

لقد تم تحديد تطور رؤية الحاسوب إلى حد كبير من خلال السعي الدؤوب لتحقيق التوازن بين الدقة وسرعة الاستدلال في الوقت الفعلي. عند المقارنة بين RTDETRv2 و Ultralytics YOLOv5، يوازن المطورون في الأساس بين قدرات السياق العالمي المتطورة لبنيات Transformer وبين كفاءة الشبكات العصبية التلافيفية (CNNs) التي أثبتت جدارتها والمحسنة للغاية.

يقدم هذا الدليل تحليلاً تقنياً متعمقاً لهاتين البنيتين البارزتين، موضحاً مقاييس الأداء ومنهجيات التدريب ومتطلبات الذاكرة وسيناريوهات النشر المثالية لمساعدتك في اختيار أفضل نموذج لـ اكتشاف الكائنات لحالة الاستخدام الخاصة بك.

Link to this sectionRTDETRv2: نهج المحولات (Transformer) للكشف في الوقت الفعلي#

بناءً على نموذج Real-Time Detection Transformer (RT-DETR) الأصلي، يقدم RTDETRv2 سلسلة من "مجموعة الإضافات المجانية" (bag-of-freebies) لتحسين البنية الأساسية دون التضحية بزمن انتقال الاستدلال.

Link to this sectionالهيكلية والقدرات#

يستفيد RTDETRv2 من بنية هجينة تجمع بين CNN و Transformer. تعمل CNN كعمود فقري لاستخراج الميزات المرئية الدقيقة، بينما تعالج طبقات الترميز وفك الترميز في Transformer خريطة الميزات بأكملها لفهم السياق العالمي. ومن السمات الرئيسية لـ RTDETRv2 طبيعته الشاملة (end-to-end)، مما يلغي تماماً الحاجة إلى المعالجة اللاحقة بـ Non-Maximum Suppression (NMS).

بينما يحقق RTDETRv2 دقة مبهرة - خاصة في المشاهد المعقدة والمكتظة حيث تتداخل الكائنات - إلا أنه يأتي مع مقايضات ملحوظة. تتطلب آلية الانتباه المتأصلة في Transformer ذاكرة CUDA أعلى بكثير أثناء التدريب مقارنة بـ CNN القياسية. علاوة على ذلك، ورغم أنه يعمل بشكل جيد على وحدات معالجة الرسومات (GPUs) المتطورة مثل NVIDIA A100 أو T4، إلا أن بنيته أبطأ بشكل ملحوظ على وحدات المعالجة المركزية (CPUs) القياسية والأجهزة الطرفية محدودة الموارد بشدة.

اعرف المزيد عن RTDETRv2

Link to this sectionUltralytics YOLOv5: معيار الصناعة للكفاءة#

لقد غير Ultralytics YOLOv5 المشهد الأساسي للتعلم الآلي التطبيقي عند إصداره، مما جعل رؤية الحاسوب عالية الأداء في متناول المطورين في جميع أنحاء العالم من خلال إطار عمل بديهي بشكل استثنائي.

Link to this sectionالتوازن بين النظام البيئي والأداء#

تم بناء YOLOv5 بالكامل على إطار عمل PyTorch ويعتمد على بنية CNN فعالة للغاية. تم تصميمه من الأساس من أجل سهولة الاستخدام، ويتميز بـ API مبسط وبعض أكثر التوثيقات شمولاً في صناعة الذكاء الاصطناعي.

تكمن الميزة الأكبر لـ YOLOv5 في تعدد استخداماته الفريد ومتطلبات الذاكرة المنخفضة. يتطلب تدريب نموذج YOLOv5 ذاكرة فيديو (VRAM) أقل بكثير من النماذج القائمة على Transformer، مما يجعله في متناول الباحثين والمهندسين ذوي ميزانيات الأجهزة المحدودة. علاوة على ذلك، بينما يركز RTDETRv2 حصرياً على اكتشاف مربعات الإحاطة (bounding box)، تطور YOLOv5 ليصبح قوة متعددة الاستخدامات تدعم تجزئة المثيلات و تصنيف الصور.

إدارة نماذج المؤسسات

لتجربة سير عمل مبسط ومثالي، يمكنك تدريب YOLOv5 والتحقق منه ونشره مباشرة باستخدام منصة Ultralytics. توفر المنصة إمكانات التدريب السحابي وخطوط أنابيب نشر بدون برمجة (zero-code).

اعرف المزيد عن YOLOv5

Link to this sectionمقارنة الأداء والمقاييس#

عند تحليل الأداء الخام على مجموعة بيانات COCO القياسية، يمكننا رؤية تميزات واضحة في كيفية تحديد هذه النماذج لأولويات الموارد.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionتحليل المقايضات#

The data reveals that RTDETRv2-x achieves a peak mean Average Precision (mAP) of 54.3%, slightly outperforming YOLOv5x's 50.7%. However, this minor accuracy gain comes at a massive computational cost. YOLOv5x operates with lower latency (11.89 ms vs 15.03 ms on TensorRT) and requires a fraction of the memory footprint. For ultra-low-power edge deployments, YOLOv5n (Nano) remains unchallenged, completing inferences in just 1.12ms with a minuscule 2.6M parameter footprint—a tier that RTDETRv2 does not even attempt to compete in.

Link to this sectionكفاءة التدريب وبساطة الكود#

إحدى نقاط القوة الرئيسية لنظام Ultralytics البيئي هي واجهة البرمجة الموحدة (Unified API). حتى إذا قررت استخدام بنية Transformer لنموذج RT-DETR لمهمة معينة تتطلب حسابات مكثفة، يمكنك القيام بذلك بالكامل داخل حزمة Ultralytics Python، مع تبديل النماذج بسلاسة بسطر واحد فقط من الكود.

from ultralytics import RTDETR, YOLO

# Load the Ultralytics YOLOv5 small model
model_yolo = YOLO("yolov5s.pt")

# Load the RT-DETR large model via Ultralytics
model_rtdetr = RTDETR("rtdetr-l.pt")

# Train YOLOv5 effortlessly on your custom data
model_yolo.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with both models seamlessly
results_yolo = model_yolo("https://ultralytics.com/images/bus.jpg")
results_rtdetr = model_rtdetr("https://ultralytics.com/images/bus.jpg")

results_yolo[0].show()

من خلال الاستفادة من مكتبة Ultralytics، يحصل المطورون تلقائياً على إمكانية الوصول إلى نظام بيئي جيد الصيانة يتميز بـ تكامل تتبع التجارب (مثل Weights & Biases و Comet ML) وعمليات تصدير بنقرة واحدة إلى تنسيقات نشر مثل ONNX و OpenVINO.

Link to this sectionتطبيقات العالم الحقيقي وحالات الاستخدام المثالية#

Link to this sectionأين يتألق RTDETRv2#

يعد RTDETRv2 الأنسب للبيئات التي لا توجد فيها قيود على الأجهزة، ويكون تحقيق أقصى دقة ممكنة هو الهدف الوحيد.

  • التصوير الطبي في جانب الخادم: اكتشاف التشوهات المجهرية في صور الأشعة السينية عالية الدقة.
  • صور الأقمار الصناعية: تتبع الكائنات الكثيفة والمتداخلة في مهام المراقبة الجوية على مجموعات سحابية قوية.

Link to this sectionأين يسيطر YOLOv5#

YOLOv5 هو البطل الذي لا جدال فيه للنشر العملي في العالم الحقيقي عبر أجهزة متنوعة.

  • أجهزة الذكاء الاصطناعي الطرفية (Edge AI): نشر أنظمة إنذار أمنية على أجهزة Raspberry Pi أو NVIDIA Jetson حيث تكون الذاكرة محدودة بشكل صارم.
  • تطبيقات الهاتف المحمول: تشغيل استدلال سريع في الوقت الفعلي لمربعات الإحاطة والتجزئة مباشرة على الهواتف الذكية عبر CoreML أو TFLite.
  • التصنيع الصناعي عالي السرعة: فحص الأجزاء على خطوط الإنتاج السريعة حيث يكون زمن الانتقال بالمللي ثانية أمراً حاسماً للنجاح التشغيلي.
استكشاف نماذج Ultralytics الأخرى

بينما يعد YOLOv5 نموذجاً أسطورياً، فإن نظام Ultralytics البيئي يدفع باستمرار حدود الذكاء الاصطناعي. إذا كنت تقارن بين النماذج لمشروع جديد في عام 2026، فيجب عليك التفكير في استكشاف أحدث ما توصلت إليه التقنية Ultralytics YOLO26. يتضمن YOLO26 تصميماً أصلياً End-to-End NMS-Free (مشابهاً لـ Transformers ولكن بسرعة CNN)، ويتميز بـ MuSGD Optimizer الثوري لتدريب مستقر بشكل لا يصدق، ويوفر استدلالاً أسرع على CPU بنسبة تصل إلى 43%. بدلاً من ذلك، يظل YOLO11 خياراً رائعاً ومدعوماً للغاية لعمليات النشر متعددة الاستخدامات التي تتطلب تقدير الوضعية و اكتشاف OBB.

في النهاية، بينما يرفع RTDETRv2 سقف الدقة باستخدام طبقات Transformer، يوفر إطار عمل Ultralytics YOLO توازناً لا مثيل له بين السرعة ومتطلبات الذاكرة خفيفة الوزن وتجربة مطور هندسية ببراعة تقلل بشكل كبير من الوقت المستغرق من النموذج الأولي إلى الإنتاج.

التعليقات