تخطي إلى المحتوى

PP-YOLOE+ ضد YOLO11: مقارنة فنية شاملة

يتطلب اختيار نموذج الكشف عن الكائنات الأمثل تحليلًا دقيقًا للهندسة المعمارية وسرعة الاستدلال وقدرات التكامل. يقدم هذا الدليل مقارنة فنية مفصلة بين PP-YOLOE+، وهو نموذج عالي الدقة من نظام Baidu PaddlePaddle البيئي، و Ultralytics YOLO11، وهو أحدث تطور متطور في سلسلة YOLO. في حين أن كلا الإطارين يوفران إمكانات كشف قوية، إلا أن YOLO11 يميز نفسه من خلال الكفاءة الحسابية الفائقة وإطار عمل موحد متعدد المهام وسهولة استخدام لا مثيل لها للمطورين.

PP-YOLOE+: دقة عالية في نظام PaddlePaddle البيئي

PP-YOLOE+ هو إصدار متطور من PP-YOLOE، تم تطويره بواسطة باحثين في Baidu. وهو كاشف للأجسام من مرحلة واحدة وخالي من المرساة، ومصمم لتحسين سرعة تقارب التدريب وأداء المهام النهائية. تم بناؤه بدقة داخل إطار عمل PaddlePaddle، ويستخدم العمود الفقري CSPRepResNet واستراتيجية تعيين تسميات ديناميكية لتحقيق دقة تنافسية على المعايير مثل COCO.

المؤلفون: مؤلفو PaddlePaddle
المنظمة:Baidu
التاريخ: 2022-04-02
Arxiv:https://arxiv.org/abs/2203.16250
GitHub:https://github.com/PaddlePaddle/PaddleDetection/
المستندات:https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md

الميزات المعمارية الرئيسية

تركز بنية PP-YOLOE+ على تحسين الموازنة بين السرعة والدقة. وهي تتضمن Efficient Task-aligned Head (ET-Head) لتحقيق توازن أفضل بين مهام التصنيف والتوطين. يستخدم النموذج آلية لتعيين التسميات تُعرف باسم Task Alignment Learning (TAL)، والتي تساعد في اختيار الإيجابيات عالية الجودة أثناء التدريب. ومع ذلك، نظرًا لأنه يعتمد بشكل كبير على نظام PaddlePaddle البيئي، فإن دمجه في سير العمل القائم على PyTorch غالبًا ما يتطلب عمليات معقدة لتحويل النموذج.

تعرف على المزيد حول PP-YOLOE+

Ultralytics YOLO11: المعيار الجديد للرؤية الذكاء الاصطناعي

يمثل Ultralytics YOLO11 أحدث ما توصلت إليه رؤية الكمبيوتر في الوقت الفعلي. تم تصميمه بواسطة Glenn Jocher و Jing Qiu، وهو يعتمد على نجاح YOLOv8 لتقديم نموذج أسرع وأكثر دقة وأكثر كفاءة بشكل ملحوظ. YOLO11 ليس مجرد كاشف للأجسام؛ بل هو نموذج أساسي متعدد الاستخدامات قادر على التعامل مع تجزئة المثيلات، و تقدير الوضع، و تصنيف الصور، و اكتشاف الصناديق المحيطة الموجهة (OBB) ضمن قاعدة بيانات موحدة واحدة.

المؤلفون: جلين جوتشر، جينغ تشيو
المنظمة:Ultralytics
التاريخ: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
المستندات:https://docs.ultralytics.com/models/yolo11/

الهندسة المعمارية والمزايا

يقدم YOLO11 بنية محسنة تزيد من كفاءة استخلاص الميزات إلى أقصى حد مع تقليل النفقات الحسابية. وهو يستخدم تصميمًا محسنًا للعمود الفقري والرأس يقلل من العدد الإجمالي للمعلمات مقارنة بالأجيال السابقة والمنافسين مثل PP-YOLOE+. يتيح هذا التخفيض في التعقيد سرعات استدلال أسرع على كل من الأجهزة الطرفية ووحدات معالجة الرسومات السحابية دون التضحية بالدقة. علاوة على ذلك، تم تصميم YOLO11 مع وضع كفاءة الذاكرة في الاعتبار، مما يتطلب ذاكرة GPU أقل أثناء التدريب مقارنة بالنماذج القائمة على المحولات أو البنى الثقيلة القديمة.

تعرف على المزيد حول YOLO11

تحليل الأداء: المقاييس والمعايير

تكشف مقارنة مقاييس الأداء عن اختلافات واضحة في الكفاءة وقابلية التوسع بين النموذجين. يُظهر YOLO11 باستمرار توازنًا فائقًا بين السرعة والدقة، خاصة عند النظر في الموارد الحسابية المطلوبة.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

تفسير الكفاءة والسرعة

تُظهر البيانات ميزة كبيرة لـ YOLO11 من حيث كفاءة النموذج. على سبيل المثال، يطابق YOLO11x قيمة 54.7 mAP الخاصة بـ PP-YOLOE+x ولكنه يحقق ذلك بـ 56.9 مليون معامل فقط مقارنةً بـ 98.42 مليون معامل الضخمة لنموذج PaddlePaddle. يمثل هذا انخفاضًا يزيد عن 40% في حجم النموذج، وهو ما يرتبط ارتباطًا مباشرًا بانخفاض متطلبات التخزين وأوقات التحميل الأسرع.

من حيث الاستدلال في الوقت الفعلي، تتفوق YOLO11 على PP-YOLOE+ عبر جميع أحجام النماذج على معايير T4 GPU. الفرق حيوي للتطبيقات الحساسة لوقت الاستجابة مثل القيادة الذاتية أو الفرز الصناعي عالي السرعة. بالإضافة إلى ذلك، فإن توفر معايير وحدة المعالجة المركزية (CPU) لـ YOLO11 يؤكد على تحسينها لبيئات الأجهزة المتنوعة، بما في ذلك تلك التي لا تحتوي على مسرّعات مخصصة.

منهجية التدريب وسهولة الاستخدام

تختلف تجربة المستخدم بين هذين النموذجين اختلافًا كبيرًا، ويرجع ذلك إلى حد كبير إلى النظم البيئية الأساسية الخاصة بهما.

ميزة النظام البيئي لـ Ultralytics

يستفيد Ultralytics YOLO11 من نظام بيئي ناضج وجيد الصيانة يعطي الأولوية لإنتاجية المطورين.

  • سهولة الاستخدام: مع واجهة Python API بسيطة، يمكن للمطورين تحميل النماذج وتدريبها ونشرها في بضعة أسطر فقط من التعليمات البرمجية. حاجز الدخول منخفض بشكل استثنائي، مما يجعل الذكاء الاصطناعي المتقدم في متناول المبتدئين والخبراء على حد سواء.
  • كفاءة التدريب: يدعم YOLO11 التدريب الفعال مع الأوزان المدربة مسبقًا المتاحة بسهولة. يتعامل الإطار مع المهام المعقدة مثل زيادة البيانات و ضبط المعلمات الفائقة تلقائيًا.
  • متطلبات الذاكرة: تم تحسين نماذج YOLO لاستهلاك ذاكرة CUDA أقل أثناء التدريب مقارنة بالهياكل الأخرى، مما يسمح للمستخدمين بتدريب دفعات أكبر أو دقة أعلى على الأجهزة الاستهلاكية.

واجهة Python بسيطة

إن تدريب نموذج YOLO11 على مجموعة بيانات مخصصة هو أمر بسيط مثل الإشارة إلى ملف YAML:

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")

# Train the model
model.train(data="coco8.yaml", epochs=100, imgsz=640)

سير عمل PP-YOLOE+

يتطلب العمل مع PP-YOLOE+ بشكل عام تبني إطار عمل PaddlePaddle. على الرغم من قوة هذا النظام البيئي، إلا أنه أقل انتشارًا من PyTorch، مما قد يؤدي إلى منحنى تعليمي أكثر حدة للفرق العاملة بالفعل في بيئات PyTorch أو TensorFlow. غالبًا ما يتضمن التدريب المخصص تعديل ملفات تكوين معقدة بدلاً من استخدام واجهة برمجية مبسطة، وموارد المجتمع - على الرغم من نموها - أقل شمولاً من مجتمع YOLO العالمي.

تعدد الاستخدامات والتطبيقات الواقعية

يكمن أحد الفروق الرئيسية بين الاثنين في تنوعهما. يركز PP-YOLOE+ بشكل أساسي على اكتشاف الكائنات. في المقابل، YOLO11 هي قوة متعددة المهام.

YOLO11: ما وراء الاكتشاف

تدعم بنية YOLO11 مجموعة واسعة من مهام رؤية الكمبيوتر:

حالات الاستخدام المثالية

  • التصنيع ومراقبة الجودة: تتيح السرعة العالية لـ YOLO11 مواكبة خطوط التجميع السريعة، واكتشاف العيوب في الوقت الفعلي. يمكن لقدرات segmentation الخاصة به تحديد الشكل الدقيق للعيوب.
  • الحوسبة الطرفية: نظرًا إلى توازن الأداء وانخفاض عدد المعلمات، فإن YOLO11 هو الخيار الأفضل للنشر على الأجهزة الطرفية مثل NVIDIA Jetson أو Raspberry Pi.
  • المدن الذكية: بالنسبة لتطبيقات مثل مراقبة حركة المرور، توفر قدرة YOLO11 على تتبع الكائنات وتقدير السرعة حلاً شاملاً في نموذج واحد.

في حين أن PP-YOLOE+ لا يزال كاشفًا قادرًا داخل نطاق PaddlePaddle، فإن Ultralytics YOLO11 يبرز كخيار أفضل للغالبية العظمى من المطورين والباحثين.

يوفر YOLO11 توازنًا أفضل بين السرعة والدقة، ويستهلك موارد حسابية أقل، ويوفر تعدد استخدامات لا مثيل له عبر مهام رؤية متعددة. بالإضافة إلى مجتمع نشط و وثائق شاملة وتكامل سلس مع أدوات مثل Ultralytics HUB، يمكّن YOLO11 المستخدمين من بناء ونشر حلول ذكاء اصطناعي قوية بكفاءة وسهولة أكبر.

بالنسبة لأولئك الذين يسعون إلى الاستفادة من الإمكانات الكاملة لرؤية الكمبيوتر الحديثة دون الاحتكاك الناتج عن تأمين الإطار، فإن YOLO11 هو المسار الأمثل للمضي قدمًا.

استكشف مقارنات أخرى

لفهم أفضل لكيفية مقارنة YOLO11 بالمنافسة، استكشف مقارناتنا التفصيلية الأخرى:


تعليقات