YOLOv7 PP-YOLOE+: مواجهة معمارية في الكشف عن الكائنات في الوقت الفعلي
يتميز مجال الرؤية الحاسوبية بالابتكار المستمر، وكان عام 2022 عامًا محوريًا شهد إطلاق بنية هندسية ذات تأثير كبير: YOLOv7 و PP-YOLOE+. بينما YOLOv7 إرث YOLO مع التركيز على تحسين "bag-of-freebies"، مثلت PP-YOLOE+ دفع Baidu نحو الكشف عالي الأداء والخالي من المراسي داخل نظام PaddlePaddle .
بالنسبة للباحثين والمهندسين، غالبًا ما يعتمد الاختيار بين هذه النماذج على متطلبات الإطار المحددة (PyTorch PaddlePaddle) وأجهزة النشر. يقدم هذا الدليل مقارنة تقنية متعمقة بين هياكلها ومقاييس أدائها وسهولة استخدامها، مع تقديم بدائل حديثة مثل YOLO26، الذي يوحد أفضل ميزات سابقاتها في إطار عمل سلس وشامل NMS.
مقارنة مقاييس الأداء
يُقارن الجدول التالي أداء YOLOv7 PP-YOLOE+ عبر نماذج مختلفة الحجم. في حين YOLOv7 قدرات كشف قوية، يقدم PP-YOLOE+ توازنًا تنافسيًا للغاية بين عدد المعلمات وسرعة الاستدلال.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
YOLOv7: قوة "حقيبة التحسينات المجانية"
صدر YOLOv7 في منتصف عام 2022، YOLOv7 حدود اكتشاف الأجسام من خلال التركيز على الكفاءة المعمارية واستراتيجيات تحسين التدريب التي لا تزيد من تكلفة الاستدلال.
- المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
- الجهة المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
- التاريخ: 2022-07-06
- روابط:ورقة بحثية على ArXiv | مستودع GitHub
الميزات المعمارية الرئيسية
YOLOv7 شبكة E-ELAN (شبكة تجميع الطبقات الفعالة الموسعة)، وهي بنية جديدة مصممة للتحكم في أقصر وأطول مسارات التدرج، مما يسمح للشبكة بتعلم ميزات أكثر تنوعًا. كما استخدمت بشكل مكثف "حقيبة الهدايا القابلة للتدريب"، بما في ذلك إعادة تحديد معلمات النموذج وتعيين التسميات الديناميكية.
ومع ذلك، YOLOv7 كاشفًا قائمًا على المراسي. ورغم أن هذه المنهجية أثبتت فعاليتها، إلا أنها تتطلب في كثير من الأحيان ضبطًا دقيقًا لمربعات المراسي لمجموعات البيانات المخصصة، مما قد يعقد عملية التدريب مقارنةً بالتطبيقات الأحدث الخالية من المراسي الموجودة في YOLOv8 أو YOLO26.
PP-YOLOE+: المنافس الخالي من نقاط الارتكاز
PP-YOLOE+ هو تطور لـ PP-YOLOE، تم تطويره بواسطة Baidu كجزء من مجموعة PaddleDetection الخاصة بهم. تم تصميمه لمعالجة قيود الأساليب القائمة على المراسي مع تعظيم سرعة الاستدلال على أجهزة متنوعة.
- المؤلفون: مؤلفو PaddlePaddle
- المؤسسة:بايدو
- التاريخ: 2022-04-02
- روابط:ورقة بحثية على ArXiv | مستودع GitHub
الميزات المعمارية الرئيسية
يستخدم PP-YOLOE+ بدون مرساة النموذج، مما يقلل بشكل كبير من عدد المعلمات الفائقة. يعتمد جوهره على RepResBlock (مستوحى من RepVGG) و التعلم المتوافق مع المهام (TAL) استراتيجية، والتي توائم مهام التصنيف والتوطين بشكل ديناميكي. وينتج عن ذلك دقة عالية، لا سيما في x (كبير جدًا) حيث يحقق أداءً مذهلاً 54.7٪ mAP.
اعتبارات النظام الإيكولوجي
بينما يقدم PP-YOLOE+ أداءً ممتازًا، إلا أنه يرتبط ارتباطًا وثيقًا بـ PaddlePaddle . PyTorch يواجه المطورون المعتادون على PyTorch صعوبة في التعلم وتوترًا عند محاولة دمج هذه النماذج في خطوط أنابيب MLOps PyTorch أو عند استخدام أدوات النشر القياسية مثل TorchScript.
مقارنة: الهندسة المعمارية وسهولة الاستخدام
مستند إلى نقاط الارتكاز مقابل خالٍ من نقاط الارتكاز
يكمن الاختلاف الأكثر وضوحًا في نهجهم تجاه الصناديق المحددة. YOLOv7 صناديق ربط محددة مسبقًا، والتي تعمل كقوالب مرجعية للكشف عن الكائنات. يعمل هذا بشكل جيد مع مجموعات البيانات القياسية مثل COCO ولكنه قد يواجه صعوبة في التعامل مع الأشكال غير المنتظمة للأجسام الموجودة في مجموعات البيانات مثل DOTA-v2 ما لم يتم إرجاعها يدويًا.
PP-YOLOE+ لا يحتاج إلى مرساة، حيث يتنبأ بمركز الأجسام ومسافاتها إلى الحدود بشكل مباشر. وهذا يبسط بشكل عام عملية التدريب. Ultralytics الحديثة، مثل YOLO11 و YOLO26، قد اعتمدت أيضًا بشكل كامل على بنى خالية من المراسي وحتى NMS لتعظيم المرونة والسرعة.
الذاكرة والكفاءة
تشتهر Ultralytics بكفاءتها في التدريب. في حين أن YOLOv7 GPU كبيرة لنماذجها الأكبر حجمًا بسبب مسارات التسلسل المعقدة في E-ELAN، فإن PP-YOLOE+ تعمل على تحسين ذلك من خلال إعادة المعلمات. ومع ذلك، فإن الإصدارات الأحدث مثل YOLO26 تتفوق على كليهما من خلال إزالة المكونات الثقيلة مثل Distribution Focal Loss (DFL)، مما يؤدي إلى انخفاض متطلبات الذاكرة بشكل كبير أثناء التدريب والاستدلال.
المستقبل: لماذا الانتقال إلى YOLO26؟
في حين أن YOLOv7 PP-YOLOE+ كانتا من أحدث التقنيات في عام 2022، إلا أن هذا المجال قد تطور بسرعة. يمثل YOLO26، الذي أطلقته Ultralytics يناير 2026، ذروة هذه التطورات، حيث يعالج نقاط الضعف المحددة في النماذج السابقة.
تصميم شامل خالٍ من NMS
أحد أكبر العوائق في كل YOLOv7 PP-YOLOE+ هو Non-Maximum Suppression (NMS)، وهي خطوة ما بعد المعالجة المطلوبة لتصفية عمليات الكشف المكررة. YOLO26 NMS بشكل أساسي. وهذا يزيل تقلب زمن الاستجابة الناتج عن NMS المشاهد المزدحمة، مما يجعله مثاليًا للتطبيقات في الوقت الفعلي مثل المركبات ذاتية القيادة ومراقبة حركة المرور.
مُحسّن للحوسبة الطرفية
يتميز YOLO26 بإزالة Distribution Focal Loss (DFL). هذا التبسيط في البنية الهندسية يبسط عملية التصدير إلى تنسيقات مثل CoreML و TFLite، مما يضمن توافقًا أفضل مع الأجهزة منخفضة الطاقة. إلى جانب التحسينات التي أدخلت على CPU ، توفر YOLO26 CPU أسرع بنسبة تصل إلى 43٪ مقارنة بالأجيال السابقة، وهي ميزة مهمة لنشر إنترنت الأشياء (IoT).
تدريب متقدم على الاستقرار
مستوحاة من الابتكارات في تدريب نموذج اللغة الكبيرة (LLM)، تدمج YOLO26 محسن MuSGD، وهو مزيج من SGD Muon (مستوحى من Kimi K2 من Moonshot AI). وينتج عن ذلك تقارب أسرع وتدريبات أكثر استقرارًا، مما يقلل من "التجربة والخطأ" التي غالبًا ما ترتبط بتدريب نماذج التعلم العميق. علاوة على ذلك، فإن تضمين ProgLoss و STAL (Soft-Task Alignment Learning) يعزز بشكل كبير الأداء في اكتشاف الأجسام الصغيرة، وهو مجال غالبًا ما كانت النماذج القديمة تعاني فيه.
سهولة الاستخدام مع Ultralytics
إحدى السمات المميزة Ultralytics هي سهولة الاستخدام. سواء كنت تستخدم YOLOv8أو YOLOv9أو YOLO26 المتطور، تظل واجهة برمجة التطبيقات (API) متسقة وبسيطة.
على عكس إعداد PaddlePaddle لـ PP-YOLOE+، والتي قد تتطلب مطابقة CUDA محدد وتثبيت مكتبات منفصلة، تعمل Ultralytics على الفور باستخدام معيار pip install ultralytics.
from ultralytics import YOLO
# Load a pre-trained YOLO model (YOLO26n for maximum speed)
model = YOLO("yolo26n.pt")
# Train the model on a custom dataset with a single command
# The system handles data augmentation, logging, and plots automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model.predict("path/to/image.jpg")
# Export to ONNX for deployment
model.export(format="onnx")
الخلاصة
كلاهما YOLOv7 و PP-YOLOE+ هياكل قادرة. YOLOv7 خيارًا قويًا لأولئك الذين استثمروا بشكل كبير في YOLO الكلاسيكية و PyTorch حيث يوفر دقة عالية. PP-YOLOE+ هو منافس ممتاز للمستخدمين داخل نظام Baidu البيئي، حيث يوفر كفاءة قوية في المعلمات.
ومع ذلك، بالنسبة للمطورين الذين يبحثون عن نظام بيئي جيد الصيانة، وتعدد استخدامات لا مثيل له (يشمل الكشف، والتجزئة، وتقدير الوضع، و OBB)، وأحدث الإنجازات في الأداء، فإن Ultralytics هو الخيار الأفضل. إن تصميمه الشامل، واستهلاكه المنخفض للذاكرة، والتحسينات الخاصة بالمهام (مثل RLE لخسائر الوضع والتجزئة الدلالية) تجعله الحل الأكثر ملاءمة للمستقبل لمواجهة تحديات الذكاء الاصطناعي في العالم الحقيقي.
لبدء رحلتك مع أحدث تقنيات الذكاء الاصطناعي في مجال الرؤية، استكشف Ultralytics للحصول على تدريب ونشر سلس.
استكشف نماذج أخرى
هل تريد معرفة كيف تقارن النماذج الأخرى؟ اطلع على مقارناتنا بين YOLOv6 YOLOv7 و RT-DETR YOLOv8 لتجد النموذج المثالي الذي يتناسب مع متطلبات مشروعك.