Meet YOLO26: next-gen vision AI.

Link to this sectionمقارنة بين PP-YOLOE+ و RTDETRv2#

شهد مجال الرؤية الحاسوبية تطوراً هائلاً في السنوات الأخيرة، لا سيما في نطاق الكشف عن الكائنات في الوقت الفعلي. إن اختيار البنية الصحيحة لنشر نماذجك يمكن أن يحدث فرقاً جوهرياً بين تطبيق بطيء ومستهلك للذاكرة، وبين نظام محسن للغاية وسريع الاستجابة. في هذه المقارنة التقنية، نستكشف نموذجين بارزين من Baidu: نموذج PP-YOLOE+ المعتمد على CNN ونموذج RTDETRv2 المعتمد على المحولات (Transformer). سنقوم بتحليل بنيتهما، ومقاييس الأداء، وحالات الاستخدام المثالية، مع فحص كيفية مقارنتهما بمنصة Ultralytics YOLO26 الرائدة.

Link to this sectionPP-YOLOE+: دفع عجلة نموذج CNN إلى الأمام#

تم تطوير PP-YOLOE+ كتكرار لسابقيها، وهو يدفع حدود ما يمكن أن تحققه الشبكات العصبية التلافيفية (CNNs) التقليدية في الكشف عن الكائنات. إنه كاشف قوي للغاية لا يعتمد على الصناديق المرجعية (anchor-free)، ويعتمد على الآليات الأساسية لسلسلة YOLO مع إدخال تحسينات محددة لنظام PaddlePaddle البيئي.

تفاصيل النموذج:

Link to this sectionالهندسة المعمارية والمنهجيات#

يعتمد PP-YOLOE+ على هيكل أساسي (backbone) محسن بشكل كبير وشبكة هرمية للميزات مخصصة لتجميع الميزات متعددة المقاييس بفعالية. يستخدم تصميماً لا يعتمد على الصناديق المرجعية، مما يبسط عملية الضبط التجريبي التي تكون مطلوبة عادةً لإنشاء صناديق المرجع (anchor box). علاوة على ذلك، تتضمن منهجية تدريبه استراتيجيات متقدمة لتخصيص التصنيفات لتطابق التنبؤات بشكل أفضل مع الصناديق الحقيقية (ground truth boxes) أثناء مرحلة التعلم.

Link to this sectionنقاط القوة وحالات الاستخدام#

تكمن القوة الأساسية لـ PP-YOLOE+ في أدائه القوي على أجهزة الخوادم القياسية وتكامله العميق مع أدوات Baidu. إنه مناسب جداً لسير العمل الصناعي التقليدي، مثل اكتشاف العيوب الثابت في بيئات التصنيع حيث لا تكون قيود الأجهزة صارمة للغاية.

تعرف على المزيد حول PP-YOLOE+

اعتبارات النظام البيئي

على الرغم من أن PP-YOLOE+ يوفر دقة قوية، فإن نشره خارج نظامه البيئي الأصلي قد يتطلب أحياناً خطوات تحويل إضافية، على عكس تنسيقات التصدير الأصلية المتاحة بسهولة في خطوط أنابيب Ultralytics الحديثة.

Link to this sectionRTDETRv2: محولات اكتشاف الوقت الفعلي#

بالابتعاد عن نماذج CNN البحتة، يمثل RTDETRv2 (محول الكشف في الوقت الفعلي الإصدار 2) قفزة نوعية نحو الآليات القائمة على الانتباه لمهام الرؤية الحاسوبية. إنه يحاول الجمع بين فهم السياق العالمي للمحولات (transformers) وبين زمن الانتقال المنخفض المطلوب للتطبيقات الواقعية.

تفاصيل النموذج:

Link to this sectionالهندسة المعمارية والمنهجيات#

يستفيد RTDETRv2 من بنية هجينة، تجمع بين هيكل أساسي CNN لاستخراج الميزات مع مشفر ومفكك ترميز محول مبسط. ومن الخصائص المميزة لـ RTDETRv2 تصميمه الأصلي من البداية إلى النهاية (end-to-end) الذي يتجاوز معالجة ما بعد الكشف التقليدية مثل كبت غير الحد الأقصى (NMS). كما يقدم ميزات مثل الكشف متعدد المقاييس ومعالجة المشاهد المعقدة، مستخدماً الانتباه الذاتي لفهم العلاقات المكانية بين الكائنات المتباعدة.

Link to this sectionنقاط القوة وحالات الاستخدام#

تجعل بنية المحول RTDETRv2 فعالاً للغاية في السيناريوهات التي يكون فيها فهم السياق العالمي أمراً حاسماً. ومع ذلك، تتطلب نماذج المحولات عادةً ذاكرة CUDA أعلى بكثير أثناء التدريب والاستدلال مقارنة بنماذج CNN خفيفة الوزن. إنه الأنسب للبيئات ذات الأجهزة غير المقيدة، مثل تحليلات الفيديو المستندة إلى السحابة والتي تعمل على خوادم GPU قوية.

تعرف على المزيد حول RTDETR

Link to this sectionمقارنة الأداء والمقاييس#

عند تقييم هذه النماذج، فإن المقايضة بين متوسط الدقة المتوسطة (mAP) والتكلفة الحسابية (المقاسة بـ FLOPs وزمن انتقال الاستدلال) هي أمر بالغ الأهمية. يوضح الجدول أدناه المقاييس الرئيسية لمختلف أحجام كل من PP-YOLOE+ و RTDETRv2.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

بينما يُظهر RTDETRv2 دقة mAP قوية على حساب عدد أكبر من المعلمات و FLOPs، يواجه المطورون الذين يتطلعون إلى النشر على أجهزة الحافة المقيدة غالباً اختناقات بسبب متطلبات الذاكرة الثقيلة التي تميز طبقات المحول.

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين PP-YOLOE+ و RT-DETR على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار PP-YOLOE+#

يعد PP-YOLOE+ خياراً قوياً في الحالات التالية:

  • التكامل مع نظام PaddlePaddle البيئي: للمؤسسات التي لديها بنية تحتية موجودة مبنية على إطار عمل Baidu's PaddlePaddle.
  • النشر على أجهزة الحافة (Paddle Lite): عند النشر على أجهزة ذات أنوية استنتاج محسّنة خصيصاً لمحرك Paddle Lite أو محرك استنتاج Paddle.
  • الكشف عالي الدقة من جانب الخادم: السيناريوهات التي تعطي الأولوية لأقصى دقة للكشف على خوادم GPU قوية حيث لا يمثل الاعتماد على إطار عمل معين مصدر قلق.

Link to this sectionمتى تختار RT-DETR#

يوصى بـ RT-DETR لـ:

  • أبحاث الاكتشاف القائمة على Transformer: المشاريع التي تستكشف آليات الانتباه وهياكل transformer لاكتشاف الكائنات بنهاية واحدة دون NMS.
  • سيناريوهات الدقة العالية مع زمن انتقال مرن: التطبيقات التي تكون فيها دقة الاكتشاف هي الأولوية القصوى ويكون زمن انتقال الاستنتاج الأعلى قليلاً مقبولاً.
  • اكتشاف الكائنات الكبيرة: المشاهد التي تحتوي بشكل أساسي على كائنات متوسطة إلى كبيرة حيث توفر آلية الانتباه العالمي للمحولات ميزة طبيعية.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionميزة Ultralytics: تقديم YOLO26#

بينما يمثل كل من PP-YOLOE+ و RTDETRv2 معالم مهمة، يحتاج المطور الحديث إلى نظام بيئي يوازن تماماً بين الأداء الفائق وسهولة الاستخدام المبسطة. توفر منصة Ultralytics ونموذج YOLO26 الرائد هذا التوازن تماماً.

تم إصدار YOLO26 في يناير 2026، وهو يضع المعيار الجديد للرؤية الحاسوبية الموجهة للحافة. إنه يحل ببراعة عقبات النشر المرتبطة بالبنيات القديمة مع تجاوزها في كل من السرعة والدقة.

Link to this sectionالابتكارات المعمارية#

يقدم YOLO26 العديد من التحسينات الرائدة التي تتفوق على نماذج CNN التقليدية والمحولات الثقيلة:

  • تصميم من البداية للنهاية بدون NMS: مثل RTDETRv2، يعمل YOLO26 أصلاً من البداية إلى النهاية. من خلال إلغاء معالجة ما بعد الكشف غير الحد الأقصى (NMS)، فإنه يوفر نشراً أسرع وأبسط مع تقليل تذبذب زمن الانتقال، وهو مثالي لـ الروبوتات والأنظمة المستقلة في الوقت الفعلي.
  • استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): من خلال تحسينات معمارية عميقة، يتفوق YOLO26 بشكل كبير على النماذج المنافسة على أجهزة الحافة التي تفتقر إلى وحدات GPU منفصلة، مما يجعله الخيار الأول لتطبيقات إنترنت الأشياء والمدن الذكية.
  • محسن MuSGD: مستوحى من ابتكارات تدريب النماذج اللغوية الكبيرة (LLM)، يستخدم YOLO26 هجيناً من SGD و Muon. وهذا يوفر مسارات تدريب أكثر استقراراً وتقارباً أسرع بشكل ملحوظ، مما يقلل بشكل كبير من ساعات تدريب GPU.
  • ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو مجال كانت تعاني فيه نماذج مثل PP-YOLOE+ تاريخياً، مما يثبت أهميتها الحاسمة لـ الصور الجوية وتطبيقات الطائرات بدون طيار.
  • إزالة DFL: تبسط إزالة Distribution Focal Loss عملية التصدير، مما يضمن توافقاً سلساً عبر مختلف أجهزة الحافة والأجهزة منخفضة الطاقة.

تعرف على المزيد حول YOLO26

تعدد الاستخدامات الخاص بالمهمة

على عكس كاشفات الكائنات المتخصصة، يتميز YOLO26 بتعدد استخداماته العالي، حيث يدعم تجزئة المثيلات، وتقدير الوضع، والتصنيف، وصناديق التحديد الموجهة (OBB). ويتضمن تحسينات مخصصة مثل RLE للوضع وزاوية خسارة متخصصة لـ OBB.

Link to this sectionسهولة استخدام لا تضاهى#

أحد أكبر عيوب اعتماد بنيات معقدة مثل RTDETRv2 هو منحنى التعلم الحاد وعمليات التكامل غير المتصلة. يعمل نظام Ultralytics البيئي على تجريد هذه التعقيدات تماماً من خلال واجهة برمجة تطبيقات Python بديهية والمنصة الشاملة المستندة إلى الويب.

سواء كنت تقوم بـ تدريب مجموعات بيانات مخصصة أو تشغيل استدلال سريع، فإن العملية سلسة:

from ultralytics import RTDETR, YOLO

# Initialize the state-of-the-art YOLO26 model
model_yolo = YOLO("yolo26n.pt")

# Alternatively, initialize an RT-DETR model via the same simple API
model_rtdetr = RTDETR("rtdetr-l.pt")

# Run real-time inference effortlessly
results = model_yolo("https://ultralytics.com/images/zidane.jpg")
results[0].show()

# Export for edge deployment in one line
model_yolo.export(format="engine", quantize=16)

تعني متطلبات الذاكرة المنخفضة التي تتميز بها نماذج Ultralytics YOLO أنه يمكنك التدريب بشكل أسرع والنشر على أجهزة أرخص مقارنة بنظيراتها القائمة على المحولات. علاوة على ذلك، يضمن التطوير النشط والوثائق ذات المستوى العالمي بقاء خطوط أنابيب الإنتاج الخاصة بك مستقرة.

بالنسبة للفرق التي تستكشف بدائل أخرى، يظل YOLO11 سلفاً مدعوماً بشكل كبير وقادراً بشكل استثنائي داخل النظام البيئي، مما يوفر أساساً ممتازاً لتكامل الأجهزة القديمة. قد تجد أيضاً أنه من المفيد قراءة مقارنتنا حول YOLO11 vs RTDETR.

Link to this sectionملخص#

لقد قدم كل من PP-YOLOE+ و RTDETRv2 مساهمات كبيرة في تطور الرؤية الحاسوبية، مما يثبت جدوى خطوط أنابيب CNN المتقدمة ومحولات الوقت الفعلي، على التوالي. ومع ذلك، بالنسبة للمؤسسات التي تتطلع إلى نشر تطبيقات رؤية حاسوبية قوية ومتعددة الاستخدامات ومحسنة للغاية في عام 2026، يوفر Ultralytics YOLO26 حلاً لا مثيل له. إن بنيته الأصلية الخالية من NMS، والاستدلال الأسرع بشكل ملحوظ على وحدة المعالجة المركزية، والنظام البيئي المبسط، تمكن المطورين من الانتقال من التصور إلى الإنتاج القابل للتوسع بشكل أسرع من أي وقت مضى.

التعليقات