PP-YOLOE+ مقابل YOLO11: مقارنة تقنية شاملة
يتطلب اختيار النموذج الأمثل لاكتشاف الأجسام تحليلًا دقيقًا للبنية وسرعة الاستدلال وقدرات التكامل. يقدم هذا الدليل مقارنة تقنية مفصّلة بين PP-YOLOE+، وهو نموذج عالي الدقة من نظام Baidu PaddlePaddle و Ultralytics YOLO11وهو أحدث تطور متطور في سلسلة YOLO . بينما يقدم كلا الإطارين قدرات كشف قوية، فإن YOLO11 يتميز YOLO11 من خلال الكفاءة الحسابية الفائقة، وإطار عمل موحد متعدد المهام، وسهولة استخدام لا مثيل لها للمطورين.
PP-YOLOE+: دقة عالية في نظام PaddlePaddle البيئي
PP-YOLOE+ هو نسخة مطورة من PP-YOLOE، طورها باحثون في Baidu. وهو عبارة عن كاشف كائن أحادي المرحلة وخالٍ من الارتكاز مصمم لتحسين سرعة تقارب التدريب وأداء المهام النهائية. تم تصميمه بدقة داخل إطار عملPaddlePaddle وهو يستخدم العمود الفقري CSPRepResNet واستراتيجية تعيين التسمية الديناميكية لتحقيق دقة تنافسية على معايير مثل COCO.
المؤلفون: PaddlePaddle المؤلفون
المنظمة:بايدو
التاريخ: 2022-04-02
Arxiv:https://arxiv.org/abs/2203.16250
GitHub:PaddlePaddle
المستندات:PaddlePaddle
الميزات المعمارية الرئيسية
تركز بنية PP-YOLOE+ على تحسين المفاضلة بين السرعة والدقة. وهو يشتمل على رأس محاذاة المهام الفعال (ET-Head) لتحقيق توازن أفضل بين مهام التصنيف والتوطين. يستخدم النموذج آلية تعيين التسمية المعروفة باسم تعلُّم محاذاة المهام (TAL)، والتي تساعد في اختيار النتائج الإيجابية عالية الجودة أثناء التدريب. ومع ذلك، نظرًا لأنه يعتمد بشكل كبير على النظام البيئي PaddlePaddle فإن دمجه في مهام سير العملPyTorch غالبًا ما يتطلب عمليات تحويل معقدة للنموذج.
Ultralytics YOLO11: المعيار الجديد للذكاء الاصطناعي البصري
يمثّل Ultralytics YOLO11 أحدث ما توصلت إليه الرؤية الحاسوبية في الوقت الحقيقي. صممه جلين جوتشر وجينغ تشيو، وهو يعتمد على نجاح YOLOv8 لتقديم نموذج أسرع وأكثر دقة وكفاءة بشكل ملحوظ. إن YOLO11 ليس مجرد كاشف للأشياء؛ فهو نموذج أساسي متعدد الاستخدامات قادر على التعامل مع تجزئة النماذج وتقدير الوضع وتصنيف الصور واكتشاف الصندوق المحيط الموجه (OBB) ضمن قاعدة برمجية واحدة موحدة.
المؤلفون: جلين جوتشر، جينغ تشيو
المنظمة:Ultralytics
التاريخ: 2024-09-27 2024
GitHubultralytics
المستنداتyolo11
الهندسة المعمارية والمزايا
YOLO11 بنية محسّنة تزيد من كفاءة استخراج الميزات إلى أقصى حد مع تقليل النفقات الحسابية. يستخدم تصميمًا محسّنًا للعمود الفقري والرأس يقلل من إجمالي عدد المعلمات مقارنةً بالأجيال السابقة والمنافسين مثل PP-YOLOE+. يتيح هذا التخفيض في التعقيد سرعات استنتاج أسرع على كل من الأجهزة المتطورة ووحدات معالجة الرسومات السحابية دون التضحية بالدقة. علاوةً على ذلك، تم تصميم YOLO11 مع وضع كفاءة الذاكرة في الاعتبار، مما يتطلب ذاكرة أقل GPU أثناء التدريب مقارنةً بالنماذج القائمة على المحولات أو البنى الثقيلة القديمة.
تحليل الأداء: المقاييس والمعايير المرجعية
تكشف مقارنة مقاييس الأداء عن اختلافات واضحة في الكفاءة وقابلية التوسع بين النموذجين. يُظهر YOLO11 باستمرار توازنًا متفوقًا بين السرعة والدقة، لا سيما عند النظر في الموارد الحسابية المطلوبة.
| النموذج | الحجم (بالبكسل) | mAPفال 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
تفسير الكفاءة والسرعة
تبرز البيانات ميزة كبيرة لـ YOLO11 من حيث كفاءة النموذج. على سبيل المثال، يضاهي YOLO11x حجم 54.7 mAP لنموذج PP-YOLOE+x، لكنه يحقق ذلك باستخدام 56.9 مليون معلمة فقط مقارنةً بالمعلمات الضخمة لنموذج PaddlePaddle البالغة 98.42 مليون معلمة. يمثل هذا انخفاضًا بنسبة تزيد عن 40% في حجم النموذج، وهو ما يرتبط مباشرةً بمتطلبات تخزين أقل وأوقات تحميل أسرع.
فيما يتعلق بالاستدلال في الوقت الحقيقي، يتفوق YOLO11 على PP-YOLOE+ في جميع أحجام النماذج على معايير T4 GPU . ويُعد هذا الفارق حيويًا للتطبيقات الحساسة لوقت الاستجابة مثل القيادة الذاتية أو الفرز الصناعي عالي السرعة. بالإضافة إلى ذلك، يؤكد توفر معايير CPU لـ YOLO11 على تحسينها لبيئات الأجهزة المتنوعة، بما في ذلك تلك التي لا تحتوي على مسرعات مخصصة.
منهجية التدريب وسهولة الاستخدام
تختلف تجربة المستخدم بين هذين النموذجين اختلافًا كبيرًا، ويرجع ذلك إلى حد كبير إلى النظم البيئية الأساسية.
ميزة نظام Ultralytics البيئي
تستفيد Ultralytics YOLO11 من نظام بيئي ناضج وجيد الصيانة يعطي الأولوية لإنتاجية المطورين.
- سهولة الاستخدام: من خلال واجهة برمجة تطبيقات Python البسيطة، يمكن للمطورين تحميل النماذج وتدريبها ونشرها في بضعة أسطر من التعليمات البرمجية. حاجز الدخول منخفض للغاية، مما يجعل الذكاء الاصطناعي المتقدم في متناول المبتدئين والخبراء على حد سواء.
- كفاءة التدريب: يدعم YOLO11 التدريب الفعال باستخدام أوزان متاحة مسبقًا ومتاحة بسهولة. يتعامل إطار العمل مع المهام المعقدة مثل زيادة البيانات وضبط المعلمات المفرطة تلقائيًا.
- متطلبات الذاكرة: تم تحسين نماذج YOLO بحيث تستهلك ذاكرة CUDA أقل أثناء التدريب مقارنةً بالبنى الأخرى، مما يسمح للمستخدمين بتدريب مجموعات أكبر أو دقة أعلى على أجهزة من فئة المستهلك.
واجهة Python بسيطة
يعد تدريب نموذج YOLO11 على مجموعة بيانات مخصصة أمرًا بسيطًا ومباشرًا مثل الإشارة إلى ملف YAML:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt")
# Train the model
model.train(data="coco8.yaml", epochs=100, imgsz=640)
سير عمل PP-YOLOE+
يتطلب العمل مع PP-YOLOE+ بشكل عام اعتماد إطار عمل PaddlePaddle . على الرغم من قوة هذا النظام البيئي، إلا أنه أقل انتشارًا من PyTorch مما قد يؤدي إلى منحنى تعليمي أكثر حدة للفرق التي تم تأسيسها بالفعل في بيئات PyTorch أو TensorFlow . وغالباً ما يتضمن التدريب المخصص تعديل ملفات التكوين المعقدة بدلاً من استخدام واجهة برمجية مبسطة، كما أن موارد المجتمع - رغم نموها - أقل انتشاراً من مجتمع YOLO العالمي.
تعدد الاستخدامات والتطبيقات الواقعية
يكمن الفرق الرئيسي بين الاثنين في تعدد استخداماتهما. يركز PP-YOLOE+ بشكل أساسي على اكتشاف الأجسام. وعلى النقيض من ذلك، فإن YOLO11 هو جهاز متعدد المهام.
YOLO11: ما وراء الاكتشاف
تدعم بنية YOLO11 مجموعة واسعة من مهام الرؤية الحاسوبية:
- تجزئة المثيل: تحديد الكائنات بدقة لتطبيقات مثل تحليل الصور الطبية أو إدراك المركبات ذاتية القيادة.
- تقدير الوضعية: تتبع النقاط الرئيسية للتحليلات الرياضية أو مراقبة العلاج الطبيعي.
- الصناديق المحدودة الموجهة (OBB): الكشف عن الأجسام المدورة، وهو أمر بالغ الأهمية للصور الجوية وتحليل الأقمار الصناعية.
حالات الاستخدام المثالية
- التصنيع ومراقبة الجودة: تسمح سرعة YOLO11 العالية لها بمواكبة خطوط التجميع السريعة، واكتشاف العيوب في الوقت الفعلي. كما يمكن لقدرات التجزئة الخاصة به تحديد الشكل الدقيق للعيوب.
- حوسبة الحافة: نظرًا لتوازن أدائه وانخفاض عدد المعلمات فيه، فإن YOLO11 هو الخيار الأفضل للنشر على الأجهزة المتطورة مثل NVIDIA Jetson أو Raspberry Pi.
- المدن الذكية: بالنسبة لتطبيقات مثل مراقبة حركة المرور، توفر قدرة YOLO11 على track الأجسام وتقدير السرعة حلاً شاملاً في نموذج واحد.
الخاتمة: الخيار الموصى به
في حين يظل PP-YOLOE+ كاشفًا قادرًا في مجال PaddlePaddle , Ultralytics YOLO11 يبرز باعتباره الخيار الأفضل للغالبية العظمى من المطورين والباحثين.
يوفر YOLO11 مفاضلة أكثر ملاءمة بين السرعة والدقة، ويستهلك موارد حاسوبية أقل، ويوفر تنوعًا لا مثيل له عبر مهام الرؤية المتعددة. إلى جانب المجتمع النشط، والتوثيق الشامل، والتكامل السلس مع أدوات مثل Ultralytics HUB، يمكّن YOLO11 المستخدمين من بناء ونشر حلول ذكاء اصطناعي قوية بكفاءة وسهولة أكبر.
بالنسبة لأولئك الذين يسعون إلى الاستفادة من الإمكانات الكاملة للرؤية الحاسوبية الحديثة دون الاحتكاك بإطار العمل المقفل، فإن YOLO11 هو المسار النهائي للمضي قدمًا.
استكشف مقارنات أخرى
لفهم المزيد من المعلومات عن مدى تفوق YOLO11 على منافسيه، استكشف مقارناتنا التفصيلية الأخرى: