تخطي إلى المحتوى

YOLO11 مقابل PP-YOLOE+: مقارنة فنية تفصيلية

يُعد اختيار بنية الكشف عن العناصر المثالية قرارًا محوريًا يؤثر على السرعة والدقة وجدوى النشر لمشاريع الرؤية الحاسوبية. يقدم هذا الدليل مقارنة فنية متعمقة بين Ultralytics YOLO11، أحدث نموذج حديث من Ultralytics، و PP-YOLOE+، وهو كاشف قوي من نظام PaddlePaddle البيئي الخاص بـ Baidu. في حين أن كلا النموذجين يقدمان أداءً عاليًا، إلا أن YOLO11 يتميز بكفاءته الحسابية الاستثنائية وتكامله السلس مع PyTorch ونظام بيئي شامل مصمم لتسريع التطوير للباحثين والمهندسين.

Ultralytics YOLO11: الكفاءة تلتقي بالتنوع

يمثل YOLO11 أحدث تطور في سلسلة YOLO (أنت تنظر مرة واحدة فقط) الشهيرة، التي أصدرتها Ultralytics لدفع حدود الـ detect للأجسام في الوقت الفعلي. تم تصميم هذا النموذج بواسطة Glenn Jocher و Jing Qiu، ويقوم بتحسين البنية الخالية من المرساة لتقديم دقة فائقة مع تقليل النفقات الحسابية بشكل كبير.

المؤلفون: جلين جوتشر، جينغ تشيو
المنظمة:Ultralytics
التاريخ: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
المستندات:https://docs.ultralytics.com/models/yolo11/

الهندسة المعمارية ونقاط القوة الأساسية

يستخدم YOLO11 تصميم شبكة مبسط يعمل على تحسين استخراج الميزات ودمجها. على عكس الكاشفات القائمة على المرساة التقليدية التي تعتمد على مربعات محددة مسبقًا، يتنبأ YOLO11 مباشرةً بمراكز الكائنات ومقاييسها. يبسط هذا النهج رأس النموذج ويقلل من عدد المعلمات الفائقة المطلوبة للضبط.

تتميز بنية النموذج بأنها متعددة الاستخدامات للغاية، وتدعم مجموعة واسعة من مهام رؤية الكمبيوتر بخلاف الاكتشاف البسيط. يتعامل في الأصل مع تجزئة المثيل، و تقدير الوضع، و تصنيف الصور، و مربعات الإحاطة الموجهة (OBB)، كل ذلك ضمن إطار عمل موحد واحد.

تجربة المطور

تتمثل إحدى أهم مزايا YOLO11 في دمجها في ultralytics حزمة Python. يوفر هذا واجهة برمجة تطبيقات (API) متسقة للتدريب والتحقق من الصحة والنشر، مما يسمح للمطورين بالتبديل بين المهام أو تصدير النماذج إلى تنسيقات مثل ONNX و TensorRT مع سطر واحد من التعليمات البرمجية.

المزايا الرئيسية

  • توازن أداء فائق: يحقق YOLO11 توازنًا رائدًا في الصناعة بين mAP وزمن انتقال الاستدلال، مما يجعله مناسبًا للتطبيقات في الوقت الفعلي على الأجهزة الطرفية.
  • الكفاءة الحسابية: يتطلب النموذج عددًا أقل من المعلمات وعمليات الفاصلة العائمة (FLOPs) مقارنة بالمنافسين مثل PP-YOLOE+، مما يؤدي إلى تنفيذ أسرع واستهلاك أقل للطاقة.
  • بصمة ذاكرة منخفضة: تم تحسين YOLO11 للاستخدام الفعال للذاكرة، ويتدرب بشكل أسرع ويمكن تشغيله على أجهزة ذات VRAM محدودة، وهو ما يميزه عن نماذج المحولات التي تستهلك الكثير من الموارد.
  • نظام بيئي قوي: يستفيد المستخدمون من الصيانة النشطة و الوثائق الشاملة ودعم المجتمع، مما يضمن صلاحية طويلة الأجل لمشاريع المؤسسات.

تعرف على المزيد حول YOLO11

PP-YOLOE+: دقة عالية في نظام PaddlePaddle البيئي

PP-YOLOE+ هو تطور لسلسلة PP-YOLO التي طورها باحثو Baidu. تم إصداره في عام 2022، وهو جزء من مجموعة أدوات PaddleDetection ومصمم ليعمل بكفاءة داخل إطار عمل التعلم العميق PaddlePaddle.

المؤلفون: مؤلفو PaddlePaddle
المنظمة:Baidu
التاريخ: 2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHub:https://github.com/PaddlePaddle/PaddleDetection
المستندات:توثيق PaddleDetection

البنية والميزات

يستخدم PP-YOLOE+ العمود الفقري CSPRepResNet ورأسًا فعالًا ومتوافقًا مع المهام (ET-Head). وهو يشتمل على تعيين تسميات ديناميكي عبر Task Alignment Learning (TAL) ويستخدم Varifocal Loss لتحسين جودة تصنيف الكائنات. تم تحسين النموذج خصيصًا لمحرك استدلال PaddlePaddle، مع الاستفادة من تكامل TensorRT للنشر.

نقاط القوة والقيود

بينما يقدم PP-YOLOE+ دقة تنافسية في المعايير مثل COCO، إلا أنه يواجه عقبات في التبني بسبب اعتماده على الإطار. يعتمد معظم مجتمع البحث العالمي على PyTorch، مما يجعل التبديل إلى PaddlePaddle مصدر احتكاك. بالإضافة إلى ذلك، تتطلب نماذج PP-YOLOE+ عمومًا عددًا أكبر من المعلمات لمطابقة دقة البنى الأحدث مثل YOLO11، مما يؤدي إلى زيادة التكاليف الحسابية أثناء التدريب والاستدلال.

تعرف على المزيد حول PP-YOLOE+

تحليل الأداء: الكفاءة والسرعة

تكشف المقارنة المباشرة لمقاييس الأداء أن YOLO11 يتفوق باستمرار على PP-YOLOE+ من حيث الكفاءة والسرعة مع الحفاظ على دقة حديثة.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

ملاحظات نقدية

  1. هيمنة الكفاءة: كفاءة المعلمات في YOLO11 واضحة. على سبيل المثال، تحقق YOLO11x تطابق 54.7 mAP مقارنة بـ PP-YOLOE+x ولكنها تفعل ذلك مع 56.9 مليون معلمة فقط مقابل 98.42 مليون. وهذا يعني أن YOLO11x أصغر بنسبة 42% تقريبًا، مما يسهل النشر على الأجهزة ذات مساحة التخزين المحدودة.
  2. سرعة الاستدلال: في سيناريوهات النشر في العالم الحقيقي، السرعة أمر بالغ الأهمية. يوفر YOLO11n وقت استدلال مذهل يبلغ 1.5 مللي ثانية على T4 GPU، وهو أسرع بكثير من 2.84 مللي ثانية لـ PP-YOLOE+t المماثل. تتيح ميزة السرعة هذه معالجة أعلى لمعدل الإطارات في تطبيقات مثل المركبات ذاتية القيادة والروبوتات.
  3. أداء وحدة المعالجة المركزية (CPU Performance): إن توفر معايير وحدة المعالجة المركزية (CPU) المحسّنة لـ YOLO11 يسلط الضوء على مرونته. إن تحقيق 56.1 مللي ثانية على وحدة المعالجة المركزية (CPU) باستخدام YOLO11n يمكّن تطبيقات الوقت الفعلي القابلة للتطبيق حتى بدون تسريع مخصص لوحدة معالجة الرسومات (GPU)، وهو مقياس غالبًا ما يكون مفقودًا أو أقل تحسينًا في أطر المنافسين.

حالات الاستخدام في العالم الحقيقي

تترجم المزايا المعمارية لـ YOLO11 بشكل مباشر إلى فوائد للصناعات المتنوعة.

  • البنية التحتية للمدن الذكية: إن الإنتاجية العالية لـ YOLO11 تدعم مراقبة حركة المرور في الوقت الفعلي وتحليل الازدحام عبر تدفقات كاميرات متعددة باستخدام عدد أقل من الخوادم.
  • التصنيع الصناعي: بفضل الدقة الفائقة في زمن وصول أقل، يتفوق YOLO11 في مراقبة الجودة واكتشاف العيوب على خطوط التجميع عالية السرعة.
  • تحليلات البيع بالتجزئة: تساعد قدرة النموذج على التعامل مع عد الكائنات وإنشاء الخرائط الحرارية بكفاءة تجار التجزئة على تحسين تصميمات المتاجر وإدارة المخزون.
  • تصوير الرعاية الصحية: تساعد القدرة على إجراء التجزئة في تحليل الصور الطبية الدقيق، مثل تحديد الأورام أو تحليل هياكل الخلايا.

التدريب وتكامل النظام البيئي

أحد الفروق الرئيسية هو السهولة التي يمكن للمطورين من خلالها تدريب النماذج ونشرها. تم تصميم نظام Ultralytics البيئي حول تبسيط رحلة المستخدم.

سير عمل مبسط

يتطلب تدريب نموذج YOLO11 على مجموعة بيانات مخصصة الحد الأدنى من التعليمات البرمجية. يعالج الإطار مهام معقدة مثل زيادة البيانات وتطوير المعلمات الفائقة والتدريب متعدد وحدات معالجة الرسومات GPU تلقائيًا.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

على النقيض من ذلك، غالبًا ما يتضمن استخدام PP-YOLOE+ التنقل في تعقيدات نظام PaddlePaddle البيئي وملفات التهيئة ونصوص التحويل المحتملة إذا كانت خط أنابيب البيانات الأصلي يعتمد على PyTorch.

مرونة النشر

توفر Ultralytics أوضاع تصدير مدمجة لمجموعة واسعة من التنسيقات، بما في ذلك ONNX و OpenVINO و CoreML و TFLite. وهذا يضمن إمكانية نشر نموذج تم تدريبه مرة واحدة في أي مكان، بدءًا من جهاز NVIDIA Jetson المتطور وحتى هاتف iOS الذكي أو واجهة برمجة تطبيقات (API) سحابية.

الخلاصة

في حين أن PP-YOLOE+ لا يزال نموذجًا قادرًا في سياق النظام البيئي لـ Baidu، فإن Ultralytics YOLO11 يبرز كخيار أفضل لمجتمع رؤية الكمبيوتر الأوسع. إن جمعه بين عدد أقل بكثير من المعلمات وسرعات استدلال أسرع وسهولة استخدام PyTorch الأصلية يزيل الحواجز التي تحول دون الدخول ويسرع الوقت اللازم لطرح المنتج في السوق.

بالنسبة للمطورين الباحثين عن حل مضمون للمستقبل يوازن بين الأداء المتطور وسهولة الاستخدام، يوفر YOLO11 منصة قوية ومتعددة الاستخدامات وعالية الكفاءة لبناء الجيل التالي من تطبيقات الذكاء الاصطناعي.

استكشف نماذج أخرى

إذا كنت مهتمًا باستكشاف بنى أخرى داخل نظام Ultralytics البيئي، فضع في اعتبارك هذه المقارنات:


تعليقات