تخطي إلى المحتوى

PP-YOLOE+ مقابل YOLO26: نظرة عميقة في أحدث كاشفات الكائنات (SOTA)

يتطور مشهد الكشف عن الكائنات باستمرار، مع سعي الباحثين لدفع حدود الدقة والسرعة والكفاءة. يقارن هذا التحليل الشامل بين نموذجين مهمين: PP-YOLOE+، وهو كاشف متقدم من فريق PaddlePaddle التابع لشركة Baidu، وYOLO26، أحدث نموذج متطور من Ultralytics.

بينما قدم PP-YOLOE+ ابتكارات رئيسية في الكشف الخالي من المراسي (anchor-free detection) عند إصداره، يمثل YOLO26 قفزة نوعية للأمام، حيث يوفر إمكانيات شاملة أصلية، ونشرًا مبسطًا، وأداءً فائقًا لتطبيقات الحافة الحديثة.

PP-YOLOE+: كشف مُحسَّن بدون نقاط ارتكاز

PP-YOLOE+ هو نسخة مطورة من PP-YOLOE، تم تطويره بواسطة فريق PaddlePaddle في Baidu. صدر في عام 2022، ويركز على تحسين تقارب التدريب وأداء المهام اللاحقة من خلال بنية أساسية قوية وتصميم رأس فعال.

تفاصيل PP-YOLOE+:

البنية المعمارية والمنهجية

يعتمد PP-YOLOE+ على البنية الأساسية CSPRepResNet، التي تستخدم تصميم نواة كبيرة لالتقاط ميزات أكثر ثراءً. ويستخدم استراتيجية TAL (تعلم محاذاة المهام) لتعيين التصنيفات ديناميكيًا، مما يضمن محاذاة عالية الجودة بين مهام التصنيف وتحديد المواقع.

تشمل الميزات المعمارية الرئيسية ما يلي:

  • تصميم خالٍ من المراسي (Anchor-Free): يلغي الحاجة إلى مربعات المراسي (anchor boxes) المحددة مسبقًا، مما يقلل من ضبط المعلمات الفائقة (hyperparameter tuning).
  • رأس محاذٍ للمهام فعال (ET-Head): يحسن التوازن بين السرعة والدقة.
  • تخصيص التسميات الديناميكي: يستخدم استراتيجية تخصيص تسميات مرنة لتحسين استقرار التدريب.

بينما كان مبتكرًا في وقته، يعتمد PP-YOLOE+ على قمع غير أقصى (NMS) التقليدي للمعالجة اللاحقة. تضيف هذه الخطوة زمن انتقال أثناء الاستدلال وتعقد مسارات النشر، حيث يمكن أن تختلف تطبيقات NMS عبر منصات الأجهزة المختلفة مثل TensorRT أو ONNX Runtime.

YOLO26: المعيار الجديد للذكاء الاصطناعي على الحافة

تم إطلاق YOLO26 في أوائل عام 2026، وقد تم تصميمه من الألف إلى الياء لحل اختناقات النشر الشائعة في الأجيال السابقة. يقدم بنية شاملة خالية من NMS بشكل أصيل، مما يجعله أسرع بكثير وأسهل في النشر على الأجهزة ذات الموارد المحدودة.

تفاصيل YOLO26:

الهندسة المعمارية والابتكارات

يتجاوز YOLO26 النماذج التقليدية القائمة على المراسٍ أو الخالية من المراسٍ من خلال دمج منطق تخصيص التسميات وفك التشفير مباشرة في بنية النموذج.

  • شامل وخالٍ من NMS: من خلال التنبؤ بالمطابقات الفردية أثناء التدريب، يلغي YOLO26 الحاجة إلى NMS تمامًا. يؤدي هذا الإنجاز، الذي كان رائدًا لأول مرة في YOLOv10، إلى زمن انتقال يمكن التنبؤ به ومنطق تصدير أبسط.
  • إزالة DFL: تبسط إزالة Distribution Focal Loss رؤوس الإخراج، مما يجعل النموذج أكثر ملاءمة للتحويل الكمي 8 بت والنشر على الحافة.
  • مُحسِّن MuSGD: مزيج من SGD والميون، مستوحى من تدريب نماذج اللغة الكبيرة (Kimi K2)، يوفر تقاربًا مستقرًا وتعميمًا محسنًا.
  • ProgLoss + STAL: وظائف خسارة جديدة تستهدف بشكل خاص اكتشاف الكائنات الصغيرة، وهو ضعف شائع في الكاشفات السابقة.

تعرف على المزيد حول YOLO26

لماذا يعتبر النهج الشامل مهماً

تنتج كاشفات الكائنات التقليدية آلاف الصناديق المرشحة، مما يتطلب NMS لتصفية التكرارات. NMS مكلفة حسابيًا ويصعب تحسينها على مسرعات الأجهزة (مثل TPUs أو NPUs). يقوم تصميم YOLO26 الشامل بإخراج الصناديق النهائية مباشرة، مما يزيل هذا الاختناق ويسرع الاستدلال بنسبة تصل إلى 43% على CPUs.

مقارنة الأداء

عند مقارنة الأداء، يُظهر YOLO26 ميزة واضحة في الكفاءة، خاصة للاستدلال المعتمد على CPU وسير عمل النشر المبسط. بينما يظل PP-YOLOE+ معيارًا أكاديميًا قويًا، يقدم YOLO26 قيمة mAPval أعلى بعدد أقل من المعلمات وزمن انتقال أقل بكثير.

يبرز الجدول أدناه مقاييس الأداء على مجموعة بيانات COCO.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

النقاط الرئيسية

  1. الكفاءة: يحقق YOLO26n دقة أعلى (40.9 mAP) من PP-YOLOE+t (39.9 mAP) بينما يستخدم عددًا أقل بكثير من عمليات FLOPs (5.4 مليار مقابل 19.15 مليار). وهذا يجعل YOLO26 أفضل بشكل ملحوظ لتطبيقات الأجهزة المحمولة التي تعمل بالبطارية.
  2. قابلية التوسع: على أوسع نطاق، يتفوق YOLO26x على PP-YOLOE+x بنحو 3.0 mAP مع الحفاظ على عدد معلمات أصغر (55.7 مليون مقابل 98.42 مليون).
  3. سرعة الاستدلال: تسمح إزالة NMS وDFL لـ YOLO26 بالتنفيذ بسرعة تصل إلى 43% أسرع على CPUs، وهو مقياس حاسم للأجهزة مثل Raspberry Pis أو مثيلات السحابة العامة حيث لا تتوفر GPUs.

سهولة الاستخدام والنظام البيئي

تمتد القيمة الحقيقية للنموذج إلى ما هو أبعد من المقاييس الخام لتشمل مدى سهولة دمجه في الإنتاج.

ميزة النظام الإيكولوجي لـ Ultralytics

تولي Ultralytics الأولوية لـ سهولة الاستخدام وتجربة مطور سلسة. باستخدام واجهة برمجة تطبيقات Python بسيطة، يمكن للمستخدمين الانتقال من التثبيت إلى التدريب في دقائق.

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100)

# Export to ONNX for deployment
path = model.export(format="onnx")

يشمل نظام Ultralytics البيئي أيضًا:

كفاءة التدريب

تم تصميم YOLO26 لاستهلاك ذاكرة أقل أثناء التدريب. يعمل مُحسِّن MuSGD الجديد على استقرار ديناميكيات التدريب، وغالبًا ما يتطلب عددًا أقل من الحقب للوصول إلى التقارب مقارنة بالجدول الزمني المطلوب لـ PP-YOLOE+. وينتج عن ذلك تكاليف حوسبة سحابية أقل ودورات تكرار أسرع للبحث والتطوير.

حالات الاستخدام المثالية

متى تختار PP-YOLOE+

  • سير عمل PaddlePaddle القديم: إذا كانت بنيتك التحتية الحالية مرتبطة ارتباطًا وثيقًا بإطار عمل Baidu PaddlePaddle ومحركات الاستدلال، يظل PP-YOLOE+ خيارًا متوافقًا.
  • البحث الأكاديمي: للباحثين الذين يدرسون بشكل خاص استراتيجيات التخصيص الخالية من المراسٍ ضمن عائلة ResNet backbone.

متى تختار YOLO26

  • النشر على الأجهزة الطرفية في الوقت الفعلي: للتطبيقات على Android أو iOS أو Linux المضمنة حيث كل جزء من الثانية من زمن الاستجابة له أهمية.
  • اكتشاف الأجسام الصغيرة: مزيج ProgLoss و STAL يجعل YOLO26 متفوقًا للمهام مثل تحليل صور الطائرات بدون طيار أو detect العيوب في التصنيع.
  • متطلبات المهام المتعددة: إذا كان مشروعك يتطلب التبديل بين detect، وsegment، وتقدير الوضعية دون تعلم واجهة برمجة تطبيقات (API) أو قاعدة تعليمات برمجية جديدة.
  • النماذج الأولية السريعة: الطبيعة الشاملة لحزمة Ultralytics تسمح للشركات الناشئة وفرق المؤسسات بالانتقال من البيانات إلى النشر بشكل أسرع.

الخلاصة

بينما كان PP-YOLOE+ بمثابة كاشف قوي خالٍ من المراسي في أوائل عام 2020، يمثل YOLO26 مستقبل الرؤية الحاسوبية. من خلال التخلص من عنق الزجاجة NMS، وتحسين سرعة CPU، وتوفير واجهة موحدة لمهام الرؤية المتعددة، يقدم YOLO26 حلاً أكثر قوة وكفاءة وسهولة في الاستخدام لتحديات الذكاء الاصطناعي اليوم.

للمطورين الذين يتطلعون إلى دمج قدرات الرؤية المتطورة بأقل قدر من التعقيد، يعد Ultralytics YOLO26 الخيار الموصى به.

اكتشف المزيد

هل أنت مهتم ببنى أخرى؟ استكشف YOLO11، نموذجنا من الجيل السابق الذي لا يزال مدعومًا بالكامل، أو اطلع على RT-DETR لحلول detect القائمة على المحولات.


تعليقات