تخطي إلى المحتوى

PP-YOLOE+ مقابل YOLO26: أحدث تقنيات الكشف عن الكائنات

في عالم الرؤية الحاسوبية سريع التطور، يعد اختيار بنية الكشف عن الأجسام المناسبة أمراً بالغ الأهمية لتحقيق التوازن بين الدقة والسرعة وسهولة النشر. تستكشف هذه المقارنة PP-YOLOE+، وهي نسخة محسنة من PP-YOLOE من PaddlePaddle و YOLO26، أحدث إنجاز مبتكر ومُحسّن من Ultralytics. يمثل كلا النموذجين علامات فارقة مهمة في مجال الكشف في الوقت الفعلي، لكنهما يلبيان احتياجات مختلفة من حيث النظم البيئية والنشر.

مقارنة الأداء البصري

يوضح الرسم البياني التالي المفاضلة بين أداء PP-YOLOE+ و YOLO26، مع تسليط الضوء على التحسينات في زمن الاستجابة والدقة التي حققتها البنية الأحدث.

نظرة عامة على النموذج

PP-YOLOE+

PP-YOLOE+ هو إصدار مطور من PP-YOLOE، تم تطويره بواسطة PaddlePaddle في Baidu. وهو يعتمد على نموذج بدون مرساة، ويقدم بنية موحدة بين السحابة والحافة تعمل بشكل جيد على مختلف منصات الأجهزة. ويركز على تحسين التوازن بين الدقة وسرعة الاستدلال، خاصة داخل PaddlePaddle .

تعرف على المزيد حول PP-YOLOE+

YOLO26

YOLO26 هو أحدث إصدار في YOLO من Ultralytics، وهو مصمم لإعادة تعريف كفاءة الحوسبة الطرفية. تم إصداره في يناير 2026، ويقدم بنية أصلية شاملة NMS ، مما يلغي الحاجة إلى المعالجة اللاحقة لـ Non-Maximum Suppression. بفضل التحسينات الرئيسية مثل إزالة Distribution Focal Loss (DFL) وإدخال مُحسّن MuSGD، تم تصميم YOLO26 خصيصًا للاستدلال عالي السرعة على وحدات المعالجة المركزية والأجهزة منخفضة الطاقة.

تعرف على المزيد حول YOLO26

الهندسة التقنية والابتكار

تحدد الاختلافات المعمارية بين هذين النموذجين مدى ملاءمتهما لمهام محددة.

بنية PP-YOLOE+

يستخدم PP-YOLOE+ شبكة CSPRepResNet الأساسية وشبكة هرمية للميزات (FPN) مع شبكة تجميع المسارات (PAN) من أجل دمج الميزات متعددة المستويات. وتشمل الابتكارات الرئيسية ما يلي:

  • تصميم بدون مرساة: يلغي ضبط المعلمات الفائقة لصندوق المرساة، مما يبسط مسار التدريب.
  • تعلم مواءمة المهام (TAL): يوائم بشكل صريح مهام التصنيف والتوطين، مما يحسن جودة اختيار العينات الإيجابية.
  • ET-Head: رأس فعال ومتوافق مع المهام يقلل من الحمل الحسابي مع الحفاظ على الدقة.

ومع ذلك، يعتمد PP-YOLOE+ على NMS التقليدية NMS ، والتي يمكن أن تؤدي إلى تباين في زمن الاستجابة اعتمادًا على عدد الكائنات المكتشفة في المشهد.

YOLO26 الابتكار

يمثل YOLO26 تحولًا جذريًا نحو الكشف الشامل.

  • تصميمNMS: من خلال إنشاء تنبؤ واحد فقط لكل كائن، يزيل YOLO26 NMS تمامًا. وهذا أمر بالغ الأهمية للنشر على الأجهزة الطرفية حيث يمكن أن تشكل منطق المعالجة اللاحقة عقبة.
  • MuSGD Optimizer: مستوحى من تدريب نموذج اللغة الكبيرة (LLM)، هذا المزيج من SGD Muon (من Moonshot AI) يعمل على استقرار التدريب وتسريع التقارب.
  • ProgLoss + STAL: يساهم دمج Progressive Loss و Soft Task Alignment Loss في تحسين الأداء بشكل كبير في مجال الكشف عن الأجسام الصغيرة، وهو تحدٍ شائع في مجال التصوير الجوي والروبوتات.
  • إزالة DFL: تعمل إزالة Distribution Focal Loss على تبسيط الرسم البياني للنموذج، مما يسهل التصدير إلى تنسيقات مثل ONNX و TFLite أكثر نظافة وتوافقًا مع مختلف مسرعات الأجهزة.

تدريب الاستقرار مع MuSGD

يوفر مُحسِّن MuSGD في YOLO26 استقرار تدريب LLM للرؤية الحاسوبية. من خلال إدارة الزخم والتدرجات بشكل تكيفي، يقلل من الحاجة إلى ضبط المعلمات الفائقة بشكل مكثف، مما يسمح للمستخدمين بالوصول إلى الدقة المثلى في عدد أقل من العصور مقارنةً بـ SGD AdamW القياسيين.

مقاييس الأداء

يقارن الجدول أدناه أداء PP-YOLOE+ و YOLO26 على COCO .

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

النقاط الرئيسية:

  1. الكفاءة: تتطلب نماذج YOLO26 باستمرار عددًا أقل من FLOPs والمعلمات للحصول على دقة أعلى. على سبيل المثال، تحقق YOLO26x 57.5 mAP ضخمة مع 55.7 مليون معلمة فقط، في حين تتطلب PP-YOLOE+x 98.42 مليون معلمة للوصول إلى 54.7 mAP.
  2. سرعة الاستدلال: يُظهر YOLO26 سرعة فائقة على وحدات معالجة الرسومات (T4 TensorRT)، حيث يبلغ زمن استدلال نموذج Nano 1.7 مللي ثانية فقط. كما أن CPU CPU CPU ملحوظ أيضًا، حيث يوفر CPU أسرع بنسبة تصل إلى 43% مقارنة بالأجيال السابقة، مما يجعله مثاليًا للأجهزة التي لا تحتوي على مسرعات مخصصة.
  3. الدقة: على جميع المقاييس، من Nano/Tiny إلى Extra Large، يتفوق YOLO26 على PP-YOLOE+ في mAP مجموعة COCO .

النظام البيئي وسهولة الاستخدام

عند اختيار نموذج، فإن النظام البيئي المحيط به لا يقل أهمية عن المقاييس الأولية.

ميزة النظام الإيكولوجي لـ Ultralytics

تستفيد Ultralytics ، بما في ذلك YOLO26، من منصة موحدة تركز على المستخدم.

  • واجهة برمجة تطبيقات مبسطة: تتيح لك Python المتسقة التبديل بين الكشف والتجزئة وتقدير الوضع والتصنيف و OBB بسلاسة.
  • Ultralytics : توفر Ultralytics حلاً بدون كود لإدارة مجموعات البيانات وتصنيفها والتدريب بنقرة واحدة في السحابة.
  • التوثيق: ترشد الوثائق الشاملة والمحدثة باستمرار المستخدمين خلال كل خطوة، بدءًا من التثبيت وحتى النشر على الأجهزة الطرفية مثل Raspberry Pi.
  • كفاءة الذاكرة: تم تصميم YOLO26 ليكون فعالاً من حيث الذاكرة أثناء التدريب، مما يسمح بأحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين مقارنة بالبدائل التي تستهلك الكثير من الذاكرة.

النظام الإيكولوجي PaddlePaddle

PP-YOLOE+ مدمج بشكل عميق في PaddlePaddle Baidu PaddlePaddle . على الرغم من قوته، إلا أنه غالبًا ما يتطلب سلسلة أدوات محددة (PaddleDetection) قد تكون صعبة التعلم بالنسبة للمستخدمين المعتادين على PyTorch. وهو يتفوق في البيئات التي تعطي الأولوية لتكامل PaddlePaddle (مثل رقائق Baidu Kunlun).

حالات الاستخدام والتطبيقات

تحليلات الحافة في الوقت الفعلي

بالنسبة للتطبيقات التي تعمل على أجهزة حديثة مثل الكاميرات الذكية أو الطائرات بدون طيار، فإن YOLO26 هو الفائز الواضح. يضمن تصميمه الشامل NMS زمن انتقال يمكن التنبؤ به، وهو أمر بالغ الأهمية لأنظمة السلامة. يتيح انخفاض عدد FLOPs تشغيله بكفاءة على الأجهزة التي تعمل بالبطارية.

الأتمتة الصناعية

في بيئات التصنيع التي تتطلب دقة عالية، مثل فحص الجودة، كلا الطرازين قادران على القيام بذلك. ومع ذلك، تعمل وظيفة ProgLoss في YOLO26 على تحسين اكتشاف العيوب الصغيرة، مما يمنحه ميزة في اكتشاف العيوب الدقيقة في خطوط الإنتاج.

مهام الرؤية المعقدة

بينما يركز PP-YOLOE+ بشكل أساسي على الكشف، يدعم YOLO26 مجموعة واسعة من المهام الجاهزة للاستخدام.

تعدد المهام وتعدد الاستخدامات

على عكس PP-YOLOE+، الذي يتطلب بنى نماذج مختلفة لمهام مختلفة، Ultralytics لك Ultralytics تغيير رأس المهمة ببساطة. على سبيل المثال، التبديل إلى yolo26n-pose.pt يتيح على الفور اكتشاف النقاط الرئيسية باستخدام نفس واجهة برمجة التطبيقات المألوفة.

مثال على الكود: البدء مع YOLO26

يعد تدريب ونشر YOLO26 أمرًا في غاية السهولة بفضلPython Ultralytics Python . يوضح مقتطف الشفرة التالي كيفية تحميل نموذج مدرب مسبقًا وتشغيل الاستدلال على صورة.

from ultralytics import YOLO

# Load the nano version of YOLO26 (NMS-free, highly efficient)
model = YOLO("yolo26n.pt")

# Perform inference on a remote image
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the results
for result in results:
    result.show()  # Display predictions on screen
    result.save("output.jpg")  # Save annotated image to disk

الخلاصة

يعد كل من PP-YOLOE+ و YOLO26 مساهمتين رائعتين في مجال الرؤية الحاسوبية. يظل PP-YOLOE+ خيارًا قويًا للفرق التي استثمرت بالفعل في PaddlePaddle .

ومع ذلك، بالنسبة للغالبية العظمى من المطورين والباحثين، يقدم Ultralytics حزمة متفوقة. تعمل بنيته الشاملة على تبسيط عمليات النشر، في حين أن دقته المتطورة وسرعته القياسية تجعله النموذج الأكثر تنوعًا لعام 2026. إلى جانب الدعم القوي من Ultralytics وميزات مثل Ultralytics ، يقلل YOLO26 بشكل كبير من الوقت المستغرق من المفهوم إلى الإنتاج.

بالنسبة للمستخدمين المهتمين بالبنى الحديثة الأخرى، تغطي الوثائق أيضًا بدائل ممتازة مثل YOLO11 والمستند إلى المحول RT-DETR.


تعليقات