تخطي إلى المحتوى

YOLO26 مقابل PP-YOLOE+: دراسة تقنية متعمقة حول الكشف عن الكائنات في الوقت الفعلي

شهد مجال الرؤية الحاسوبية تطوراً سريعاً في نماذج الكشف عن الأجسام في الوقت الفعلي. بالنسبة لمهندسي وباحثي التعلم الآلي الذين يسعون إلى نشر نماذج الذكاء الاصطناعي الأكثر كفاءة في مجال الرؤية، فإن مقارنة البنى مثل Ultralytics و PP-YOLOE+ أمر بالغ الأهمية. يقدم هذا الدليل الشامل تحليلاً متعمقاً للبنى ومنهجيات التدريب ومقاييس الأداء وسيناريوهات النشر المثالية في العالم الواقعي.

أصول النموذج والبيانات الوصفية

فهم خلفية هياكل الرؤية الحاسوبية هذه يساعد على وضع فلسفات تصميمها وبيئاتها المستهدفة في سياقها الصحيح.

نظرة عامة على YOLO26
صدر في يناير 2026، ويمثل YOLO26 قمة نظام Ultralytics البيئي. لقد تم تصميمه ليكون حل الذكاء الاصطناعي الطرفي الأمثل، ويتميز ببصمة أصغر، ومعالجة شاملة أصلية، وسرعة لا مثيل لها.

تعرف على المزيد حول YOLO26

نظرة عامة على PP-YOLOE+
تم تطوير PP-YOLOE+ كتطور لسلسلة PP-YOLO، وهو كاشف بدون مرساة مُحسّن بشكل كبير لبيئة PaddlePaddle. يعتمد على بنية CSPRepResNet أساسية ورأس ET لتحسين مقاييس detect القياسية.

تعرف على المزيد حول PP-YOLOE+

الابتكارات المعمارية

تؤثر الاختلافات في كيفية معالجة هذه النماذج للبيانات المرئية بشكل كبير على متطلبات الذاكرة، واستقرار التدريب، وزمن الاستدلال.

YOLO26: الحدود NMS

يقدم YOLO26 العديد من التغييرات المعمارية الرائدة المصممة لتبسيط نشر النماذج:

  • تصميم شامل خالٍ من NMS: استنادًا إلى المفاهيم التي تم تقديمها لأول مرة في YOLOv10، يلغي YOLO26 بشكل أصيل معالجة ما بعد التثبيط غير الأقصى (NMS). وهذا يقلل من تباين زمن الانتقال ويبسط بشكل كبير مسارات النشر.
  • إزالة DFL: من خلال إزالة Distribution Focal Loss (DFL)، يصبح النموذج أخف بشكل استثنائي، مما يتيح التصدير السلس إلى تنسيقات مثل TensorRT و CoreML.
  • مُحسِّن MuSGD: مستوحى من Kimi K2 من Moonshot AI، يجلب YOLO26 ابتكارات تدريب نماذج LLM إلى الرؤية الحاسوبية. يضمن مُحسِّن MuSGD الهجين (SGD + Muon) ديناميكيات تدريب مستقرة للغاية وتقاربًا سريعًا.
  • ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، مما يجعل البنية فعالة للغاية لـ صور الطائرات بدون طيار والتطبيقات الزراعية.

PP-YOLOE+: نهج يركز على المجداف

يستخدم PP-YOLOE+ نموذجًا بدون مرساة مع التركيز على الدقة العالية على أجهزة الخادم القياسية. ويتميز بهيكل RepResNet الذي يحسن قدرات استخراج الميزات. ومع ذلك، نظرًا لأنه يعتمد بشكل كبير على العمليات المحددة المتاحة في مكدس التعلم العميق من Baidu، فإن تعديل الشبكة أو تصديرها لأجهزة الحافة شديدة التقييد يمكن أن يكون أكثر تعقيدًا بكثير من Ultralytics .

مقارنة الأداء والمقاييس

توازن قوي في الأداء بين السرعة والدقة أمر بالغ الأهمية لسيناريوهات النشر المتنوعة في العالم الحقيقي. فبينما يقدم PP-YOLOE+ دقة تنافسية، يحقق YOLO26 باستمرار توازنًا أكثر تفضيلاً، خاصة عند تقييم سرعة الاستدلال على وحدات المعالجة المركزية (CPUs) واستخدام ذاكرة أقل.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

بفضل تحسينات الحافة المحددة وإزالة DFL، يوفر YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU مقارنة بسابقيه، متفوقًا بشكل كبير على PP-YOLOE+ عند نشره على أجهزة مثل Raspberry Pi أو وحدات الحوسبة القياسية.

كفاءة الذاكرة

عند مقارنة بنى النماذج، لاحظ أنYOLO Ultralytics YOLO تحافظ على استخدام ذاكرة أقل بكثير أثناء التدريب مقارنة بنماذج Transformer المعقدة، مما يجعلها سهلة الوصول للغاية من أجل النماذج الأولية السريعة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين.

ميزة النظام البيئي لـ Ultralytics

في حين أن PP-YOLOE+ هو نموذج قادر، فإن الفارق الحقيقي يكمن في تجربة المطور. يوفر Ultralytics المتكامل بيئة لا مثيل لها لممارسي الرؤية الاصطناعية.

  1. سهولة الاستخدام: تقدم Ultralytics تجربة مستخدم مبسطة. تجرد واجهة برمجة تطبيقات Python بسيطة تعقيد مسارات البيانات وحلقات التدريب، مدعومة بوثائق شاملة ويتم صيانتها بنشاط.
  2. تعدد الاستخدامات: على عكس PP-YOLOE+، الذي يركز بشكل أساسي على اكتشاف الكائنات، يدعم YOLO26 تصنيف الصور، تجزئة الكائنات، تقدير الوضعيات، والصناديق المحيطة الموجهة (OBB) بشكل أصلي باستخدام نفس بنية واجهة برمجة التطبيقات.
  3. كفاءة التدريب: يضمن التنزيل التلقائي للأوزان المدربة مسبقًا المتاحة بسهولة، مقترنًا بالتحسينات المتقدمة، عمليات تدريب فعالة تتطلب ذاكرة CUDA ووقتًا أقل مقارنة بالأطر التقليدية.

مثال على التعليمات البرمجية: البساطة في العمل

يوضح Python الصالح التالي مدى سهولة بدء مشروع ذكاء اصطناعي باستخدام Ultralytics :

from ultralytics import YOLO

# Load a pre-trained YOLO26 nano model for optimal edge performance
model = YOLO("yolo26n.pt")

# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device="cpu")

# Perform NMS-free inference on a target image
inference_results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")

تطبيقات مثالية في العالم الواقعي

يعتمد الاختيار بين YOLO26 و PP-YOLOE+ بشكل كبير على قيود بيئة الإنتاج الخاصة بك.

متى يتم استخدام PP-YOLOE+:

  • تكامل نظام Baidu البيئي: المشاريع المتجذرة بعمق في بنية PaddlePaddle التحتية أو بيئات التصنيع الآسيوية المحددة حيث يتم فرض مكدسات أجهزة وبرامج Baidu بصرامة.
  • معالجة الدفعات من جانب الخادم: سيناريوهات تعمل على أجهزة بمستوى المؤسسات حيث يكون تذبذب زمن الاستجابة الناتج عن NMS أقل إثارة للقلق.

متى يتم استخدام YOLO26:

  • أجهزة الحافة وإنترنت الأشياء: سرعات وحدة المعالجة المركزية (CPU) في YOLO26 الأسرع بنسبة تصل إلى 43% تجعله الخيار الأمثل لـالكاميرات الذكية والطائرات بدون طيار والروبوتات منخفضة الطاقة.
  • عمليات النشر الحساسة للوقت: تضمن البنية الخالية من NMS بطبيعتها استدلالًا مستقرًا وبزمن انتقال منخفض للغاية، وهو أمر بالغ الأهمية لـ أبحاث القيادة الذاتية ومراقبة جودة التصنيع عالية السرعة.
  • مشاريع متعددة المهام: عندما يتطلب المشروع مزيجًا من الكشف عن الكائنات، والإخفاء الدقيق عبر الـsegmentation، أو تتبع النقاط الرئيسية عبر تقدير الوضعية (pose estimation)، يصبح إطار عمل YOLO26 الموحد لا غنى عنه.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLO26 و PP-YOLOE+ على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار YOLO26

YOLO26 هو خيار قوي لـ:

  • نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
  • بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
  • اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.

متى تختار PP-YOLOE+

يوصى باستخدام PP-YOLOE+ في الحالات التالية:

  • تكامل منظومة PaddlePaddle: المنظمات ذات البنية التحتية الحالية المبنية على إطار عمل وأدوات PaddlePaddle من Baidu.
  • نشر Paddle Lite على الحوسبة الطرفية: النشر على أجهزة بنواة استدلال محسّنة للغاية خصيصًا لمحرك استدلال Paddle Lite أو Paddle.
  • الكشف عالي الدقة من جانب الخادم: السيناريوهات التي تعطي الأولوية لأقصى دقة detect على خوادم GPU القوية حيث لا يمثل الاعتماد على الإطار مشكلة.

استكشاف هياكل أخرى

بالنسبة للمستخدمين الذين يستكشفون مجموعة أوسع من النماذج، نوصي أيضًا بمراجعة YOLO11، الجيل السابق عالي الموثوقية من Ultralytics والذي لا يزال عنصرًا أساسيًا في آلاف بيئات الإنتاج. بالإضافة إلى ذلك، بالنسبة للسيناريوهات التي تتطلب آليات قائمة على المحولات، فإن RT-DETR بديلاً مثيرًا للاهتمام، على الرغم من متطلباتها العالية من الذاكرة أثناء التدريب.

في النهاية، من خلال الاستفادة من مُحسّن MuSGD وقدرات ProgLoss + STAL والتصميم NMS، يعزز YOLO26 مكانته كخيار متميز لحلول الذكاء الاصطناعي البصرية الحديثة والقابلة للتطوير والفعالة للغاية.


تعليقات