تخطي إلى المحتوى

PP-YOLOE+ مقابل YOLOv7: تعمق تقني في بنية الكشف عن الكائنات

يتضمن اختيار النموذج الأمثل لاكتشاف الأجسام الموازنة بين الدقة وسرعة الاستدلال وتعقيد النشر. هناك متنافسان مهمان في هذا المجال هما PP-YOLOE+ و YOLOv7اللذان تم إصدارهما في عام 2022 بهدف الارتقاء بالأداء إلى أعلى المستويات. يستكشف هذا التحليل الشامل بنيتيهما الفريدتين ومعاييرهما وملاءمتهما للتطبيقات الواقعية، مما يساعد المطورين على اتخاذ قرارات قائمة على البيانات.

مقارنة مقاييس الأداء

يعرض الجدول التالي مقارنة مباشرةً لمقاييس الأداء الرئيسية، بما في ذلك متوسط متوسط الدقة (mAP) وسرعات الاستدلال على الأجهزة المدعومة. تساعد هذه البيانات في تصور المفاضلة بين النهج الخالي من الارتكاز في PP-YOLOE+ والبنية المحسّنة لـ YOLOv7.

النموذجالحجم
(بالبكسل)
mAPفال
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

PP-YOLOE+: الكشف المنقح الخالي من المرساة

PP-YOLOE+ هو تطوير لسلسلة YOLO التي طورها باحثون في Baidu. وهو يعتمد على نقاط قوة سلفه، PP-YOLOE، من خلال إدخال تحسينات على عملية التدريب والبنية لزيادة تحسين سرعة التقارب وأداء المهام النهائية. وباعتباره كاشفًا خاليًا من الارتكاز، فإنه يلغي الحاجة إلى مربعات الارتكاز المحددة مسبقًا، مما يبسّط التصميم ويقلل من ضبط المعلمات الفائقة.

تعرف على المزيد حول PP-YOLOE+

الملامح المعمارية البارزة

تتميز بنية PP-YOLOE+ بالعمود الفقري لشبكة CSPResNet المجهزة بمجالات استقبال مختلفة لالتقاط الميزات على مستويات متعددة بفعالية. ويتمثل أحد الابتكارات الرئيسية في الرأس الفعال المتوافق مع المهام (ET-head)، والذي يفصل بين مهمتي التصنيف والانحدار مع ضمان مواءمتهما من خلال دالة خسارة محددة.

يستخدم PP-YOLOE+ تعلم محاذاة المهام (TAL)، وهي استراتيجية تعيين التسمية التي تختار ديناميكيًا العينات الإيجابية بناءً على محاذاة جودة التصنيف والتوطين. وهذا يضمن تركيز النموذج على تنبؤات عالية الجودة أثناء التدريب. علاوةً على ذلك، يستخدم النموذج استراتيجية تدريب موزعة ويتجنب استخدام مشغلات غير قياسية، مما يسهل النشر عبر مختلف منصات الأجهزة التي يدعمها نظام PaddlePaddle البيئي.

الميزة الرئيسية: تصميم خالٍ من المرساة

من خلال إزالة مربعات الارتكاز، يقلل PP-YOLOE+ من التعقيد المرتبط بخطوات تجميع الارتكاز والمطابقة. يؤدي هذا غالبًا إلى تعميم أفضل على مجموعات البيانات المتنوعة حيث قد يكون للكائنات نسب أبعاد متطرفة.

YOLOv7: مُحسَّن للسرعة في الوقت الفعلي

YOLOv7 معيارًا جديدًا للكشف عن الأجسام في الوقت الحقيقي عند إصداره، مع التركيز بشكل كبير على الكفاءة المعمارية وأساليب "حقيبة الأجسام المجانية" - وهي تقنيات تزيد من الدقة دون زيادة تكلفة الاستدلال. تم تصميمه ليتفوق على أحدث النماذج السابقة مثل YOLOOR و YOLOv5 من حيث السرعة والدقة.

اعرف المزيد عن YOLOv7

الابتكارات المعمارية

قدم YOLOv7 شبكة تجميع الطبقات الموسعة الفعالة الموسعة (E-ELAN). يسمح هذا التصميم الأساسي للشبكة بتعلم المزيد من الميزات المتنوعة من خلال التحكم في أقصر وأطول مسارات التدرج، مما يعزز القدرة على التعلم دون تدمير مسار التدرج الأصلي.

ومن المساهمات المهمة الأخرى استخدام إعادة تحديد النموذج. أثناء التدريب، يستخدم النموذج بنية متعددة الفروع يتم دمجها في بنية أبسط أحادية الفرع للاستدلال. يسمح ذلك لـ YOLOv7 بالاستفادة من تمثيلات الميزات الغنية أثناء التعلم مع الحفاظ على سرعة عالية أثناء النشر. كما يستخدم النموذج أيضًا رؤوسًا مساعدة لتدريب الشبكات العميقة باستخدام استراتيجية تعيين التسمية الموجهة من "الخشنة إلى الدقيقة".

التحليل المقارن: نقاط القوة والضعف

عند الاختيار بين هذين النموذجين القويين، من الضروري مراعاة المتطلبات المحددة لمشروع الرؤية الحاسوبية الخاص بك.

الدقة مقابل السرعة

تقدم PP-YOLOE+ مجموعة من النماذج المحببة. إن PP-YOLOE+s عالية الكفاءة لأجهزة الحافة، بينما PP-YOLOE+x يحقق أعلى مستوى من mAP وإن كان ذلك بمعدلات إطارات أقل. تتفوق YOLOv7 في "البقعة الحلوة" للكشف في الوقت الحقيقي، وغالبًا ما تقدم معدل إطارات في الثانية أعلى على أجهزة GPU لمستوى دقة معين مقارنةً بالعديد من المنافسين. بالنسبة للتطبيقات عالية الإنتاجية مثل مراقبة حركة المرور، فإن تحسين الاستدلال في YOLOv7 مفيد.

النظام البيئي وسهولة الاستخدام

يكمن أحد الفروق الأساسية في نظمها البيئية. PP-YOLOE+ متجذر بعمق في إطار عمل PaddlePaddle . على الرغم من قوته، إلا أن هذا يمكن أن يمثل منحنى تعليمي أكثر حدة للفرق التي اعتادت بشكل أساسي على PyTorch. أما YOLOv7 فهو أصلي في PyTorch مما يجعله أكثر سهولة بشكل عام لمجتمع البحث الأوسع.

ومع ذلك، يمكن أن يكون كلا النموذجين معقدين في التدريب والضبط الدقيق مقارنةً بالمعايير الحديثة. ينطوي YOLOv7 على حسابات مرساة معقدة وحساسية المعلمة الفائقة، بينما يتطلب PP-YOLOE+ التنقل في تكوينات الكشف عن المجذاف.

ميزة Ultralytics : لماذا الترقية؟

في حين أن نموذجي PP-YOLOE+ و YOLOv7 نموذجين ممتازين، إلا أن مجال الذكاء الاصطناعي يتحرك بسرعة. نماذج Ultralytics مثل YOLOv8 وأحدث نماذج YOLO11، تمثل الجيل التالي من الذكاء الاصطناعي البصري، حيث تعالج العديد من تحديات سهولة الاستخدام والكفاءة الموجودة في البنى السابقة.

تجربة مستخدم ونظام بيئي متفوق

تعطي Ultralytics الأولوية لسهولة الاستخدام. على عكس ملفات التكوين المعقدة التي غالبًا ما تتطلبها أطر العمل الأخرى، يمكن تدريب نماذج Ultralytics والتحقق من صحتها ونشرها ببضعة أسطر من كود Python أو أوامر CLI البسيطة.

  • واجهة برمجة تطبيقات موحدة: قم بالتبديل بين مهام مثل اكتشاف الأجسام، وتجزئة المثيلات، والتصنيف، وتقدير الوضع، و OBB بسلاسة.
  • نظام بيئي جيد الصيانة: الاستفادة من التحديثات المتكررة، والمجتمع المزدهر، والتوثيق الشامل الذي يساعد على حل المشكلات بسرعة.
  • التكامل: دعم أصلي لتتبع التجارب (MLflow، Comet)، وإدارة مجموعة البيانات، وتصدير النماذج المبسطة إلى تنسيقات مثل ONNX و TensorRT و CoreML.

الأداء والكفاءة

تم تصميم نماذج Ultralytics لتحقيق التوازن الأمثل في الأداء. فهي غالبًا ما تحقق دقة أعلى من YOLOv7 مع نفقات حسابية أقل. علاوةً على ذلك، فهي مصممة لتكون فعالة من حيث الذاكرة، وتتطلب قدراً أقل من CUDA أثناء التدريب مقارنةً بالعديد من البدائل القائمة على المحولات أو إصدارات YOLO الأقدم. تسمح كفاءة التدريب هذه بتكرارات أسرع وتكاليف حوسبة سحابية أقل.

مثال على الكود: البساطة في العمل

تعرّف على مدى سهولة تدريب نموذج Ultralytics الحديث مقارنةً بسير العمل القديم:

from ultralytics import YOLO

# Load a pre-trained YOLO11 model (recommended for best performance)
model = YOLO("yolo11n.pt")

# Train the model on a dataset (e.g., COCO8)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")

حماية مشاريعك في المستقبل

يضمن لك اعتماد إطار عمل Ultralytics أنك لا تستخدم نموذجًا فحسب، بل منصة تتطور. مع دعم أحدث Python ومسرعات الأجهزة، يمكنك تقليل الديون التقنية وضمان إمكانية صيانة حلول الذكاء الاصطناعي الخاصة بك على المدى الطويل.

الخلاصة

لا يزال PP-YOLOE+ خيارًا قويًا لأولئك الذين يستثمرون في نظام PaddlePaddle البيئي، حيث يوفر بنية قوية خالية من الارتكاز. يستمر YOLOv7 في كونه خيارًا هائلًا للمشاريع التي تتطلب إنتاجية خام GPU . ومع ذلك، بالنسبة للمطورين الذين يبحثون عن حل متعدد الاستخدامات وسهل الاستخدام وعالي الأداء يغطي مجموعة كاملة من مهام الرؤية الحاسوبية, Ultralytics YOLO11 هو المسار الموصى به للمضي قدمًا.

استكشف نماذج أخرى

وسّع فهمك لمشهد اكتشاف الكائنات من خلال هذه المقارنات:


تعليقات