تخطي إلى المحتوى

تعمق في اكتشاف الكائنات في الوقت الفعلي: PP-YOLOE+ مقابل YOLO11

يتطور مجال الرؤية الحاسوبية باستمرار، مدفوعًا بالحاجة إلى نماذج أسرع وأكثر دقة وكفاءة. بالنسبة للمطورين والباحثين الذين يتعاملون مع مهام اكتشاف الأجسام، فإن اختيار البنية المناسبة أمر بالغ الأهمية. في هذه المقارنة الشاملة، سوف نستكشف الفروق الدقيقة بين نموذجين بارزين: PP-YOLOE+ و Ultralytics YOLO11.

من خلال تحليل هياكلها ومقاييس أدائها وحالات الاستخدام المثالية، يهدف هذا الدليل إلى توفير الرؤى اللازمة لاتخاذ قرار مستنير بشأن نشر التعلم الآلي التالي.

أصول النموذج والنظرة العامة التقنية

كلا النموذجين ناتجان عن أبحاث أكاديمية دقيقة وهندسة مكثفة، لكنهما ينبعان من بيئات مختلفة تمامًا. دعونا نلقي نظرة على التفاصيل الأساسية لكل نموذج.

نظرة عامة على PP-YOLOE+

تم تطوير PP-YOLOE+ من قبل باحثي Baidu، وهو نسخة مطورة من PP-YOLOE السابق، مصمم لتوسيع حدود الكشف في الوقت الفعلي ضمن نظام PaddlePaddle .

تعرف على المزيد حول PP-YOLOE+

YOLO11

يمثل YOLO11 أنشأته Ultralytics قفزة كبيرة إلى الأمام في قابلية الاستخدام والدقة. وهو يعتمد على إرث من البنى الهندسية الناجحة للغاية، ويحسن تجربة المطورين وتعدد المهام.

تعرف على المزيد حول YOLO11

هل تعلم؟

YOLO11 Ultralytics YOLO11 أكثر من مجرد اكتشاف الكائنات. يمكنك تنفيذ تقسيم المثيلات وتقدير الوضع واكتشاف الصندوق المحيط الموجه (OBB) باستخدام نفس واجهة برمجة التطبيقات (API) مباشرةً.

مقارنة بين التصميم المعماري والأداء

عند مقارنة هذين الكاشفين، يجب أن ننظر إلى ما وراء الأرقام الأولية ونفهم كيف تؤثر خياراتهما المعمارية على نشر النماذج في العالم الحقيقي.

بنية PP-YOLOE+

يعتمد PP-YOLOE+ بشكل كبير على PaddlePaddle . وهو يقدم نموذجًا قويًا خاليًا من المراسي، باستخدام العمود الفقري RepResNet وشبكة تجميع المسارات (PAN) المعدلة. تم تحسين النسخة "+" عن سابقتها من خلال دمج تدريب مسبق لمجموعات بيانات واسعة النطاق (مثل Objects365) ومُحسّن TaskAlignedAssigner. على الرغم من تحقيقه لمتوسط دقة عالٍ (mAP)، إلا أن الاعتماد الشديد على PaddlePaddle يسبب صعوبات للفرق المعتادة على TensorFlow PyTorch TensorFlow .

معمارية YOLO11

YOLO11 تصميم Ultralytics YOLO11 بشكل أساسي على PyTorch، وهو المعيار الصناعي للتعلم العميق الحديث. تركز بنيته بشكل كبير على توازن الأداء، محققة توازنًا جيدًا بين السرعة والدقة بما يتناسب مع سيناريوهات النشر المتنوعة في العالم الواقعي. YOLO11 بوحدة C2f محسّنة لتحسين تدفق التدرج ورأس منفصل يعالج مهام التصنيف والانحدار بشكل منفصل بكفاءة. علاوة على ذلك، YOLO11 تصميم YOLO11 لتقليل متطلبات الذاكرة، حيث يتميز باستخدام ذاكرة أقل بكثير أثناء التدريب والاستدلال مقارنة بنماذج المحولات المعقدة مثل RT-DETR.

جدول مقاييس الأداء

يوضح الجدول التالي الاختلافات في الأداء عبر نماذج مختلفة. لاحظ كيف يحقق YOLO11 mAP مماثلًا أو أفضل mAP تقليل عدد المعلمات و FLOPs بشكل كبير.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

حالات الاستخدام والتوصيات

YOLO11 الاختيار بين PP-YOLOE+ و YOLO11 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار PP-YOLOE+

PP-YOLOE+ هو خيار قوي لـ:

  • تكاملPaddlePaddle : المؤسسات التي تمتلك بنية تحتية قائمة مبنية على إطار عمل وأدوات PaddlePaddle من Baidu.
  • نشر Paddle Lite Edge: النشر على الأجهزة باستخدام نوى استدلال محسّنة للغاية خصيصًا لمحرك الاستدلال Paddle Lite أو Paddle.
  • الكشف عالي الدقة من جانب الخادم: سيناريوهات تعطي الأولوية لأقصى دقة في الكشف على GPU قوية حيث لا تشكل تبعية إطار العمل مشكلة.

متى تختار YOLO11

YOLO11 في الحالات التالية:

  • نشر حافة الإنتاج: التطبيقات التجارية على أجهزة مثل Raspberry Pi أو NVIDIA حيث الموثوقية والصيانة النشطة أمران بالغا الأهمية.
  • تطبيقات الرؤية متعددة المهام: المشاريع التي تتطلب الكشف والتجزئة وتقدير الوضع و OBB ضمن إطار موحد واحد.
  • النماذج الأولية السريعة والنشر: الفرق التي تحتاج إلى الانتقال بسرعة من جمع البيانات إلى الإنتاج باستخدام Python Ultralytics Python المبسطة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

ميزة Ultralytics

على الرغم من أهمية المعايير الأكاديمية، فإن النجاح طويل الأمد لمشروع الذكاء الاصطناعي يعتمد بشكل كبير على النظام البيئي المحيط بالنموذج. توفر Ultralytics مزايا مميزة للمطورين والشركات على حد سواء.

  1. سهولة الاستخدام: Ultralytics تعقيدات التعلم العميق. تتيح تجربة المستخدم المبسطة Python البسيطة للمطورين تدريب نماذج مخصصة باستخدام بضع أسطر من التعليمات البرمجية. وهذا يتناقض مع ملفات التكوين المعقدة التي غالبًا ما تتطلبها PP-YOLOE+.
  2. نظام بيئي جيد الصيانة: على عكس العديد من مستودعات الأبحاث فقط، يتم تطوير Ultralytics بشكل نشط. ويتميز بدعم قوي من المجتمع، وتحديثات متكررة، وتكامل واسع النطاق مع أدوات مثل Weights & Biases و Comet .
  3. تعدد الاستخدامات: YOLO11 إطارًا واحدًا موحدًا لعدة مهام للرؤية الحاسوبية، مما يلغي الحاجة إلى تعلم مكتبات مختلفة للتصنيف أو التجزئة أو الكشف عن المربعات المحددة.
  4. كفاءة التدريب: توفر عمليات التدريب الفعالة YOLO الوقت وتكاليف الحوسبة. من خلال الاستفادة من الأوزان المُدرّبة مسبقًا على COCO ، تتقارب النماذج بسرعة حتى على الأجهزة الاستهلاكية.

مقارنة رموز التدريب

لتوضيح سهولة الاستخدام، إليك كيفية تدريب YOLO11 المتطور. فهو يتعامل مع جميع عمليات زيادة البيانات والتسجيل وتنسيق الأجهزة تلقائيًا:

from ultralytics import YOLO

# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on your custom dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run a quick inference test on a public image
inference_results = model("https://ultralytics.com/images/bus.jpg")
inference_results[0].show()

يتطلب إعداد خط الأنابيب المكافئ في PaddleDetection التنقل يدويًا بين تكوينات XML المعقدة وتنفيذ سلاسل أسطر أوامر طويلة، مما قد يؤدي إلى إبطاء دورات التطوير السريعة.

التطلع إلى المستقبل: وصول YOLO26

في حين أن YOLO11 أداة قوية للغاية، فإن مجال الذكاء الاصطناعي يتطور بسرعة. تم إصداره في يناير 2026، يمثل يمثل أحدث ما توصلت إليه Ultralytics وهو النموذج الموصى به لجميع المشاريع الجديدة.

يقدم YOLO26 العديد من الابتكارات الثورية:

  • تصميم شامل NMS: بناءً على المفاهيم التي تم طرحها لأول مرة في YOLOv10، فإن YOLO26 هو تصميم شامل أصلاً. فهو يلغي تماماً المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، مما يجعل النشر أبسط بكثير ويقلل بشكل كبير من تقلب زمن الاستجابة.
  • CPU أسرع بنسبة تصل إلى 43٪ CPU : من خلال إزالة Distribution Focal Loss (DFL) بشكل استراتيجي، يصبح النموذج أخف بكثير. هذا التحسين يجعله الخيار الأول لأجهزة الحوسبة المتطورة وأجهزة إنترنت الأشياء منخفضة الطاقة.
  • مُحسّن MuSGD: يجلب YOLO26 ابتكارات تدريب LLM إلى الرؤية الحاسوبية. باستخدام مُحسّن MuSGD (مزيج من SGD Muon)، يحقق ديناميكيات تدريب عالية الاستقرار وتقارب أسرع.
  • ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهي ميزة مهمة للصور الملتقطة بواسطة الطائرات بدون طيار والمراقبة الجوية.

الخلاصة والتطبيقات في العالم الواقعي

عند الاختيار بين PP-YOLOE+ و YOLO11 أو YOLO26 الأحدث)، يعتمد الاختيار على نظام النشر الخاص بك.

يتميز PP-YOLOE+ في بيئات صناعية محددة، لا سيما في مراكز التصنيع الآسيوية حيث يتم دمج الأجهزة بشكل عميق مع مجموعة تقنيات Baidu PaddlePaddle . وهو ممتاز لتحليل الصور الثابتة حيث mAP الحد الأقصى mAP الأولوية الوحيدة.

YOLO11 و YOLO26، ومع ذلك، يقدمان نهجًا أكثر تنوعًا وسهولة للمطورين. إن عدد معلماتهما الأقل وسرعاتهما العالية تجعلهما مثاليين لـ:

  • التجزئة الذكية: معالجة موجات الفيديو في الوقت الفعلي من أجل الدفع الآلي وإدارة المخزون.
  • الروبوتات المستقلة: تمكين تجنب العوائق بسرعة عالية على الأجهزة المدمجة ذات الموارد المحدودة.
  • الأمن والمراقبة: توفير تحليل قوي ومتعدد المهام (مثل التتبع وتقدير الوضع) في عمليات استنتاج فردية عالية الكفاءة.

للمهندسين المعاصرين في مجال الذكاء الاصطناعي الذين يبحثون عن الموثوقية والدعم المجتمعي الواسع النطاق وخطوط إنتاج بسيطة لتنفيذ تنسيقات مثل ONNX و TensorRT، يظل Ultralytics هو الخيار الأمثل بلا منازع.


تعليقات