تخطي إلى المحتوى

YOLO26 مقابل PP-YOLOE+: دراسة تقنية متعمقة حول الكشف عن الكائنات في الوقت الفعلي

شهد مجال الرؤية الحاسوبية تطوراً سريعاً في نماذج الكشف عن الأجسام في الوقت الفعلي. بالنسبة لمهندسي وباحثي التعلم الآلي الذين يسعون إلى نشر نماذج الذكاء الاصطناعي الأكثر كفاءة في مجال الرؤية، فإن مقارنة البنى مثل Ultralytics و PP-YOLOE+ أمر بالغ الأهمية. يقدم هذا الدليل الشامل تحليلاً متعمقاً للبنى ومنهجيات التدريب ومقاييس الأداء وسيناريوهات النشر المثالية في العالم الواقعي.

أصول النموذج والبيانات الوصفية

فهم خلفية هياكل الرؤية الحاسوبية هذه يساعد على وضع فلسفات تصميمها وبيئاتها المستهدفة في سياقها الصحيح.

نظرة عامة على YOLO26
تم إصدار YOLO26 في يناير 2026، وهو يمثل قمة Ultralytics . وقد تم تصميمه ليكون الحل النهائي للذكاء الاصطناعي المتطور، حيث يتميز بحجم أصغر، ومعالجة أصلية من البداية إلى النهاية، وسرعة لا مثيل لها.

تعرف على المزيد حول YOLO26

نظرة عامة على PP-YOLOE+
تم تطوير PP-YOLOE+ كنسخة مطورة منYOLO وهو كاشف بدون مرساة تم تحسينه بشكل كبير ليتوافق مع PaddlePaddle . يعتمد على CSPRepResNet backbone و ET-head لتحسين مقاييس الكشف القياسية.

تعرف على المزيد حول PP-YOLOE+

الابتكارات المعمارية

تؤثر الاختلافات في كيفية معالجة هذه النماذج للبيانات المرئية بشكل كبير على متطلبات الذاكرة، واستقرار التدريب، وزمن الاستدلال.

YOLO26: الحدود NMS

يقدم YOLO26 العديد من التغييرات المعمارية الرائدة المصممة لتبسيط نشر النماذج:

  • تصميم شامل NMS: بناءً على المفاهيم التي تم تقديمها لأول مرة في YOLOv10، يلغي YOLO26 بشكل أساسي المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يقلل من تقلب زمن الاستجابة ويبسط بشكل كبير خطوط النشر.
  • إزالة DFL: من خلال إزالة Distribution Focal Loss (DFL)، أصبح النموذج أخف وزناً بشكل استثنائي، مما يتيح التصدير السلس إلى تنسيقات مثل TensorRT و CoreML.
  • محسّن MuSGD: مستوحى من Kimi K2 من Moonshot AI، يجلب YOLO26 ابتكارات تدريب LLM إلى الرؤية الحاسوبية. يضمن محسّن MuSGD الهجين (SGD Muon) ديناميكيات تدريب عالية الاستقرار وتقاربًا سريعًا.
  • ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، مما يجعل البنية فعالة للغاية في تطبيقات التصوير بالطائرات بدون طيار والتطبيقات الزراعية.

PP-YOLOE+: نهج يركز على المجداف

يستخدم PP-YOLOE+ نموذجًا بدون مرساة مع التركيز على الدقة العالية على أجهزة الخادم القياسية. ويتميز بهيكل RepResNet الذي يحسن قدرات استخراج الميزات. ومع ذلك، نظرًا لأنه يعتمد بشكل كبير على العمليات المحددة المتاحة في مكدس التعلم العميق من Baidu، فإن تعديل الشبكة أو تصديرها لأجهزة الحافة شديدة التقييد يمكن أن يكون أكثر تعقيدًا بكثير من Ultralytics .

مقارنة الأداء والمقاييس

يعد التوازن القوي بين السرعة والدقة أمرًا بالغ الأهمية في سيناريوهات النشر المتنوعة في العالم الواقعي. في حين يوفر PP-YOLOE+ دقة تنافسية، يحقق YOLO26 باستمرار توازنًا أكثر ملاءمة، خاصة عند تقييم سرعة الاستدلال على وحدات المعالجة المركزية واستخدام الذاكرة الأقل.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

بفضل تحسينات الحافة المحددة وإزالة DFL، يوفر YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU مقارنة بسابقيه، متفوقًا بشكل كبير على PP-YOLOE+ عند نشره على أجهزة مثل Raspberry Pi أو وحدات الحوسبة القياسية.

كفاءة الذاكرة

عند مقارنة بنى النماذج، لاحظ أنYOLO Ultralytics YOLO تحافظ على استخدام ذاكرة أقل بكثير أثناء التدريب مقارنة بنماذج Transformer المعقدة، مما يجعلها سهلة الوصول للغاية من أجل النماذج الأولية السريعة على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين.

ميزة النظام البيئي لـ Ultralytics

في حين أن PP-YOLOE+ هو نموذج قادر، فإن الفارق الحقيقي يكمن في تجربة المطور. يوفر Ultralytics المتكامل بيئة لا مثيل لها لممارسي الرؤية الاصطناعية.

  1. سهولة الاستخدام: Ultralytics تجربة مستخدم مبسطة. تعمل Python البسيطة على تبسيط تعقيدات خطوط أنابيب البيانات وحلقات التدريب، مدعومة بوثائق شاملة يتم تحديثها باستمرار.
  2. تعدد الاستخدامات: على عكس PP-YOLOE+، الذي يركز بشكل أساسي على اكتشاف الكائنات، يدعم YOLO26 تصنيف الصور وتجزئة المثيلات وتقدير الوضع ومربعات الحدود الموجهة (OBB) بشكل أصلي باستخدام نفس بنية واجهة برمجة التطبيقات.
  3. كفاءة التدريب: يضمن التنزيل التلقائي للأوزان المعدة مسبقًا والمتاحة بسهولة، إلى جانب التحسينات المتقدمة، عمليات تدريب فعالة تتطلب CUDA ووقتًا أقل مقارنة بالأطر التقليدية.

مثال على التعليمات البرمجية: البساطة في العمل

يوضح Python الصالح التالي مدى سهولة بدء مشروع ذكاء اصطناعي باستخدام Ultralytics :

from ultralytics import YOLO

# Load a pre-trained YOLO26 nano model for optimal edge performance
model = YOLO("yolo26n.pt")

# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device="cpu")

# Perform NMS-free inference on a target image
inference_results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")

تطبيقات مثالية في العالم الواقعي

يعتمد الاختيار بين YOLO26 و PP-YOLOE+ إلى حد كبير على قيود بيئة الإنتاج لديك.

متى يتم استخدام PP-YOLOE+:

  • تكامل نظام بايدو البيئي: مشاريع متجذرة بعمق في PaddlePaddle أو بيئات تصنيع آسيوية محددة حيث يتم تطبيق مجموعات أجهزة وبرامج بايدو بشكل صارم.
  • المعالجة الدفعية من جانب الخادم: سيناريوهات تعمل على أجهزة على مستوى المؤسسات حيث لا NMS تذبذب زمن الاستجابة الناتج عن NMS مشكلة كبيرة.

متى يتم استخدام YOLO26:

  • الأجهزة الطرفية وإنترنت الأشياء: CPU في YOLO26 التي تصل إلى 43٪ تجعلها الخيار الأمثل للكاميرات الذكية والطائرات بدون طيار والروبوتات منخفضة الطاقة.
  • عمليات النشر الحساسة من حيث الوقت: تضمن البنية الأصلية NMS استنتاجًا مستقرًا وذو زمن انتقال منخفض للغاية، وهو أمر بالغ الأهمية لأبحاث القيادة الذاتية ومراقبة جودة التصنيع عالية السرعة.
  • المشاريع متعددة المهام: عندما يتطلب مشروع ما مزيجًا من الكشف عن الكائنات، أو التغطية الدقيقة عبر التجزئة، أو تتبع النقاط الرئيسية عبر تقدير الوضع، فإن إطار عمل YOLO26 الموحد يكون ضروريًا.

حالات الاستخدام والتوصيات

يعتمد الاختيار بين YOLO26 و PP-YOLOE+ على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار YOLO26

YOLO26 هو خيار قوي لـ:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

متى تختار PP-YOLOE+

يوصى باستخدام PP-YOLOE+ في الحالات التالية:

  • تكاملPaddlePaddle : المؤسسات التي تمتلك بنية تحتية قائمة مبنية على إطار عمل وأدوات PaddlePaddle من Baidu.
  • نشر Paddle Lite Edge: النشر على الأجهزة باستخدام نوى استدلال محسّنة للغاية خصيصًا لمحرك الاستدلال Paddle Lite أو Paddle.
  • الكشف عالي الدقة من جانب الخادم: سيناريوهات تعطي الأولوية لأقصى دقة في الكشف على GPU قوية حيث لا تشكل تبعية إطار العمل مشكلة.

استكشاف هياكل أخرى

بالنسبة للمستخدمين الذين يستكشفون مجموعة أوسع من النماذج، نوصي أيضًا بمراجعة YOLO11، الجيل السابق عالي الموثوقية من Ultralytics والذي لا يزال عنصرًا أساسيًا في آلاف بيئات الإنتاج. بالإضافة إلى ذلك، بالنسبة للسيناريوهات التي تتطلب آليات قائمة على المحولات، فإن RT-DETR بديلاً مثيرًا للاهتمام، على الرغم من متطلباتها العالية من الذاكرة أثناء التدريب.

في النهاية، من خلال الاستفادة من مُحسّن MuSGD وقدرات ProgLoss + STAL والتصميم NMS، يعزز YOLO26 مكانته كخيار متميز لحلول الذكاء الاصطناعي البصرية الحديثة والقابلة للتطوير والفعالة للغاية.


تعليقات