PP-YOLOE+ مقابل YOLOv7: استكشاف بنى الكشف عن الأجسام في الوقت الفعلي

تطورت الرؤية الحاسوبية بسرعة، مما زود المطورين بأدوات أكثر قوة للكشف عن الأشياء في الوقت الفعلي. ومن المعالم الهامة في هذا التطور PP-YOLOE+ من Baidu و YOLOv7 من قبل مؤلفي YOLOv4. يهدف كلا النموذجين إلى تحقيق التوازن بين السرعة والدقة، لكنهما يحققان ذلك من خلال فلسفات معمارية ومنهجيات تدريب مختلفة جذريًا.

يحلل هذا الدليل الشامل هاتين البنيتين، ويقارن بين مقاييس أدائهما وسهولة استخدامهما ومدى ملاءمتهما لتطبيقات الذكاء الاصطناعي الحديثة. كما نستكشف كيف تضع الابتكارات الحديثة مثل YOLO26 معايير جديدة للكفاءة والنشر.

ملخص تنفيذي: الاختلافات الرئيسية

ميزة	PP-YOLOE+	YOLOv7
البنية	بدون مرساة، CSPRepResStage	مستند إلى المرساة، E-ELAN
الابتكار الأساسي	التعلم المتوافق مع المهام (TAL)	حقيبة هدايا قابلة للتدريب
الإطار الأساسي	PaddlePaddle	PyTorch
أفضل حالة استخدام	البيئات الصناعية التي تستخدم Paddle Inference	البحث والنشر للأغراض العامة

PP-YOLOE+: كشف مُحسَّن بدون نقاط ارتكاز

PP-YOLOE+ هو تطورYOLO تم تطويره بواسطة فريق Baidu لتحسين الدقة وسرعة الاستدلال على أجهزة متنوعة. تم إصداره في عام 2022، ويستخدم بشكل كبير آليات بدون مرساة لتبسيط رأس الكشف.

تفاصيل فنية:

المؤلفون: مؤلفو PaddlePaddle
المؤسسة:بايدو
التاريخ: 2022-04-02
Arxiv:ورقة PP-YOLOE
GitHub:مستودع PaddleDetection

الهيكلة ونقاط القوة

يقدم PP-YOLOE+ هيكل CSPRepResStage، الذي يجمع بين الاتصالات المتبقية وشبكات CSP (Cross Stage Partial). ومن الميزات الرئيسية آلية تعلم محاذاة المهام (TAL) ، التي تعمل على محاذاة مهام التصنيف والتحديد المكاني بشكل ديناميكي أثناء التدريب. وهذا يساعد في حل المشكلة الشائعة المتمثلة في أن عمليات الكشف عالية الثقة لا تتمتع بالضرورة بأفضل تداخل للمربعات المحيطة.

يتم دعم النموذج بشكل أساسي من قبل PaddlePaddle مما يجعله عالي الكفاءة عند نشره على محركات الاستدلال الخاصة بـ Baidu أو الأجهزة مثل أجهزة FPGA و NPU التي غالبًا ما تستخدم في الأسواق الصناعية الآسيوية.

YOLOv7: مجموعة التحسينات القابلة للتدريب

تم إصداره بعد فترة وجيزة من إصدار PP-YOLOE+، YOLOv7 على تحسين عملية التدريب نفسها دون زيادة تكلفة الاستدلال، وهو مفهوم أطلق عليه المؤلفون اسم "bag-of-freebies".

تفاصيل فنية:

المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
الجهة المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2022-07-06
Arxiv:ورقةYOLOv7
GitHub:مستودع YOLOv7

الهيكلة ونقاط القوة

YOLOv7 شبكة تجميع الطبقات الفعالة الموسعة (E-ELAN). على عكس ELAN التقليدية، تسمح E-ELAN للشبكة بتعلم ميزات أكثر تنوعًا من خلال التحكم في أطوال مسارات التدرج. كما أنها تستخدم مقياس النموذج المركب، الذي يضبط العمق والعرض في وقت واحد للحفاظ على الكفاءة المثلى.

على الرغم من أدائه العالي، YOLOv7 على مربعات الربط، والتي قد تتطلب ضبطًا دقيقًا للمعلمات الفائقة لمجموعات البيانات المخصصة ذات الأشكال غير العادية.

تعرف على المزيد حول YOLOv7

معايير الأداء

يقارن الجدول التالي النماذج على COCO وهي معيار قياسي لاكتشاف الكائنات. لاحظ أنه في حين أن PP-YOLOE+ يُظهر mAP قويًا، فإن YOLOv7 يوفر YOLOv7 سرعات استدلال تنافسية على GPU القياسية.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

التدريب ومقارنة النظم البيئية

عند اختيار نموذج لمشروع رؤية حاسوبية، غالبًا ما تكون سهولة التدريب والنظام البيئي المحيط بهما بنفس أهمية المقاييس الأولية.

الإطار العام وقابلية الاستخدام

PP-YOLOE+ يتطلب PaddlePaddle . على الرغم من قوته، إلا أنه قد يمثل منحنى تعليمي حاد للمطورين المعتادين على PyTorch . غالبًا ما يتطلب إعداده استنساخ مستودعات محددة مثل PaddleDetection وإدارة التبعيات التي تختلف عن حزم pip العالمية القياسية.

YOLOv7، كونه PyTorch، يتكامل بشكل أكثر طبيعية مع سير العمل البحثي الغربي القياسي. ومع ذلك، يفتقر المستودع الأصلي إلى تجربة "من الصفر إلى القمة" السلسة الموجودة في Ultralytics الحديثة.

ميزة Ultralytics

Ultralytics ، مثل YOLOv8 و YOLO26 الجديدة، توفر Python موحدة تعمل على تبسيط عملية التدريب المعقدة. وهذا يسمح للمطورين بالتركيز على البيانات بدلاً من التركيز على الكود النمطي.

تدريب مبسط مع Ultralytics

Ultralytics تدريب نموذج متطور باستخدام Ultralytics بضع أسطر فقط من التعليمات البرمجية، حيث يتم التعامل مع زيادة البيانات وتسجيلها تلقائيًا.

from ultralytics import YOLO

# Load a pretrained model (YOLO26 recommended for best performance)
model = YOLO("yolo26s.pt")

# Train on your custom data
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

تتعدى هذه البساطة إلى خيارات النشر، مما يسمح بالتصدير المبسط إلى تنسيقات مثل ONNX و TensorRT للحصول على أقصى أداء.

مستقبل الكشف: YOLO26

في حين أن PP-YOLOE+ و YOLOv7 أحدث التقنيات عند إصدارهما، إلا أن هذا المجال قد تطور بشكل كبير. تم إصدار YOLO26 في يناير 2026، وهو يمثل قمة الكفاءة والدقة.

أهم ابتكارات YOLO26:

NMS من البداية إلى النهاية: على عكس YOLOv7 تتطلب معالجة لاحقة لـ Non-Maximum Suppression (NMS)، فإن YOLO26 هي خالية من NMS من البداية إلى النهاية. وهذا يزيل تقلب زمن الاستجابة الناتج عن NMS المشاهد المزدحمة، مما يجعلها مثالية لتطبيقات المدن الذكية ومراقبة حركة المرور.
MuSGD Optimizer: مستوحى من تقنيات تدريب LLM، يجمع هذا المحسن SGD Muon لضمان ديناميكيات تدريب مستقرة، وهي ميزة غير متوفرة في البنى القديمة.
تحسين الحافة: من خلال إزالة Distribution Focal Loss (DFL)، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعله أفضل بكثير للأجهزة الطرفية مقارنة بمتطلبات الحوسبة الأثقل لـ PP-YOLOE+.
ProgLoss + STAL: تعمل وظائف الخسارة المتقدمة على تحسين اكتشاف الأجسام الصغيرة، وهو أمر بالغ الأهمية في مجالات مثل الزراعة والصور الجوية.

تعرف على المزيد حول YOLO26

تطبيقات عملية في أرض الواقع

غالبًا ما يحدد اختيار النموذج نجاح تطبيقات معينة.

حالات استخدام PP-YOLOE+

الفحص الصناعي في آسيا: نظرًا PaddlePaddle القوي الذي يقدمه PaddlePaddle في مراكز التصنيع الآسيوية، غالبًا ما يستخدم PP-YOLOE+ للكشف عن العيوب في خطوط التجميع حيث يتم تهيئة الأجهزة مسبقًا لمكدس Baidu.
تحليل الصور الثابتة: إن mAP المرتفع mAP مناسبًا للمعالجة دون اتصال بالإنترنت حيث يكون زمن الاستجابة في الوقت الفعلي أقل أهمية من الدقة المطلقة.

حالات YOLOv7

البحث العام: يستخدم على نطاق واسع كأساس في الأوراق الأكاديمية بسبب PyTorch .
أنظمةGPU: تعمل بشكل جيد على وحدات معالجة الرسومات (GPU) من فئة الخوادم في مهام مثل تحليلات الفيديو.

حالات استخدام Ultralytics (YOLO26)

Edge AI & IoT: إن الاستهلاك المنخفض للذاكرة CPU العالية Ultralytics تجعلها مثالية لاستخدامات Raspberry Pi والأجهزة المحمولة.
المهام متعددة الوسائط: بالإضافة إلى الصناديق البسيطة، Ultralytics تقدير الوضع والصناديق المحددة الاتجاه (OBB)، مما يسمح بتطبيقات معقدة مثل الإمساك الآلي أو تحليل المستندات.
النماذج الأولية السريعة: تتيح Ultralytics للفرق الانتقال من تعليق مجموعة البيانات إلى النموذج المطبق في غضون دقائق، مما يقلل بشكل كبير من وقت طرح المنتج في السوق.

الخلاصة

YOLOv7 كل من PP-YOLOE+ و YOLOv7 بشكل كبير في مجال الرؤية الحاسوبية. YOLOv7 وسّع PP-YOLOE+ حدود الكشف بدون مرساة، بينما YOLOv7 كفاءة البنى القائمة على المرساة.

ومع ذلك، بالنسبة للمطورين الذين يبحثون عن حل مستقبلي يجمع بين أفضل ما في العالمين - السرعة والدقة وسهولة الاستخدام - فإنYOLO26 هو الخيار الموصى به. بفضل تصميمه NMS وقدراته القوية في التصدير وتكامله السلس مع Ultralytics فإنه يوفر مجموعة أدوات متعددة الاستخدامات لمواجهة تحديات الذكاء الاصطناعي الحديثة.

لاستكشاف خيارات أخرى عالية الأداء، راجع الوثائق الخاصة بـ YOLOv9 أو YOLOv10.

PP-YOLOE+ مقابل YOLOv7: استكشاف بنى الكشف عن الأجسام في الوقت الفعلي

ملخص تنفيذي: الاختلافات الرئيسية

PP-YOLOE+: كشف مُحسَّن بدون نقاط ارتكاز

الهيكلة ونقاط القوة

YOLOv7: مجموعة التحسينات القابلة للتدريب

الهيكلة ونقاط القوة

معايير الأداء

التدريب ومقارنة النظم البيئية

الإطار العام وقابلية الاستخدام

ميزة Ultralytics

مستقبل الكشف: YOLO26

تطبيقات عملية في أرض الواقع

حالات استخدام PP-YOLOE+

حالات YOLOv7

حالات استخدام Ultralytics (YOLO26)

الخلاصة

تعليقات