PP-YOLOE+ مقابلYOLO: نظرة متعمقة على اكتشاف الأجسام الصناعية
في مجال الرؤية الحاسوبية في الوقت الفعلي الذي يتسم بالتنافسية، يعد اختيار البنية المثلى قرارًا بالغ الأهمية للمهندسين والباحثين. يقدم اثنان من العمالقة في النظام البيئي التكنولوجي الصيني، وهما PP-YOLOE+ من Baidu و YOLO من Alibaba، نهجين متميزين لحل مشكلة التوازن بين السرعة والدقة. في حين أن كلا النموذجين يستخدمان تقنيات متقدمة مثل البحث عن البنية العصبية (NAS) وإعادة تحديد المعلمات، إلا أنهما يلبيان احتياجات بيئات نشر مختلفة وتفضيلات مختلفة للنظام البيئي.
يقدم هذا الدليل مقارنة تقنية شاملة، حيث يحلل الابتكارات المعمارية لهذه النماذج، وأدائها المعياري، ومدى ملاءمتها للتطبيقات الواقعية. كما نستكشف كيف تعالج بنية Ultralytics الحديثة قيود هذه النماذج السابقة لتوفير حل موحد لنشر الحافة والسحابة.
PP-YOLOE+: كشف مُحسَّن بدون نقاط ارتكاز
تم إصدار PP-YOLOE+ في أبريل 2022 من قبل PaddlePaddle في Baidu، وهو تطور لهيكل PP-YOLOE، مصمم لتحسين تقارب التدريب وسرعة الاستدلال. وهو يمثل تحولًا نحو الكشف عالي الأداء والخالي من المراسي داخل PaddlePaddle .
المؤلفون: PaddlePaddle
المنظمة:Baidu
التاريخ: 2 أبريل 2022
Arxiv:PP-YOLOE ورقة بحثية
GitHub:PaddlePaddle
الابتكارات المعمارية
يعتمد PP-YOLOE+ على نجاح سابقيه من خلال دمج العديد من الخيارات التصميمية الرئيسية التي تهدف إلى تقليل زمن الاستجابة مع الحفاظ على الدقة العالية:
- CSPRepResStage: يستخدم العمود الفقري بنية CSP (Cross-Stage Partial) مقترنة بكتل متبقية معاد تحديد معلماتها. وهذا يسمح للنموذج بالاستفادة من استخراج الميزات المعقدة أثناء التدريب مع الانهيار إلى بنية أبسط وأسرع أثناء الاستدلال.
- نموذج بدون مرساة: من خلال إزالة مربعات المرساة، يبسط PP-YOLOE+ مساحة البحث عن المعلمات الفائقة، مما يقلل من العبء الهندسي الذي غالبًا ما يرتبط بأجهزة الكشف القائمة على المرساة.
- تعلم مواءمة المهام (TAL): لمعالجة عدم التوافق بين التصنيف وثقة التوطين، يستخدم PP-YOLOE+ TAL، وهي استراتيجية ديناميكية لتعيين التسميات تختار الإيجابيات عالية الجودة بناءً على مقياس مركب من درجة التصنيف و IoU.
- ET-Head: يعمل الرأس المتوافق مع المهام الفعال (ET-Head) على فصل فروع التصنيف والانحدار، مما يضمن تحسين تمثيل الميزات بشكل خاص لكل مهمة دون تدخل.
DAMO-YOLO: كفاءة مدفوعة بـ NAS
تم طرحYOLO نموذج معزز بالتقطير) في وقت لاحق من شهر نوفمبر 2022 من قبل مجموعة Alibaba Group، وهو يستفيد من البحث في البنية العصبية (NAS) والتقطير المكثف لتعزيز أداء زمن الاستجابة المنخفض. وقد تم تصميمه خصيصًا لزيادة الإنتاجية على الأجهزة الصناعية.
المؤلفون: Xianzhe Xu، Yiqi Jiang، Weihua Chen، Yilun Huang، Yuan Zhang، و Xiuyu Sun
المنظمة:مجموعة Alibaba
التاريخ: 23 نوفمبر 2022
Arxiv:YOLO
GitHub:YOLO
الابتكارات المعمارية
YOLO بتركيزه على تصميم الهندسة المعمارية الآلية ودمج الميزات المدمجة:
- الهيكل الأساسي MAE-NAS: على عكس الهياكل الأساسية المصممة يدويًا،YOLO هيكلًا تم اكتشافه عبر البحث عن البنية العصبية، ويُطلق عليه MAE-NAS. وهذا يضمن تحسين عمق الشبكة وعرضها رياضيًا وفقًا لقيود الأجهزة المحددة.
- RepGFPN: تعمل شبكة هرم الميزات العامة الفعالة (RepGFPN) على تحسين شبكات FPN القياسية من خلال تحسين مسارات دمج الميزات وعمق القنوات، مما يتيح اكتشافًا أفضل متعدد المستويات للأجسام التي تتراوح من المشاة إلى المركبات.
- ZeroHead: تصميم رأس كشف خفيف الوزن يقلل بشكل كبير من التكلفة الحسابية (FLOPs) لطبقات التنبؤ النهائية، وهو أمر بالغ الأهمية للتطبيقات في الوقت الفعلي.
- AlignedOTA: نسخة محسّنة من Optimal Transport Assignment (OTA) تعمل على مواءمة أهداف التصنيف والانحدار بشكل أفضل أثناء التدريب، مما يؤدي إلى تقارب أسرع.
مقارنة الأداء
عند مقارنة هذه النماذج، غالبًا ما يعتمد الاختيار على الهدف المحدد للأجهزة والتوازن المقبول بين عدد المعلمات والدقة. يقدم PP-YOLOE+ عمومًا أداءً قويًا على وحدات معالجة الرسومات (GPU) من فئة الخوادم، بينماYOLO في السيناريوهات التي تتطلب تحسينًا كبيرًا في زمن الاستجابة من خلال شبكته الأساسية المشتقة من NAS.
يوضح الجدول أدناه المقاييس الرئيسية. لاحظ أنYOLO يحقق زمن انتقال أقل لمستويات دقة مماثلة بفضل تحسينات ZeroHead و RepGFPN.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
ميزة Ultralytics: تقديم YOLO26
في حين أن PP-YOLOE+ وYOLO ميزات تنافسية، إلا أنهما غالبًا ما يتطلبان بيئات معقدة ومحددة الإطار (PaddlePaddle مكدسات Alibaba الداخلية). بالنسبة للمطورين الذين يبحثون عن حل عالمي جاهز للإنتاج، يوفر Ultralytics ميزة حاسمة.
تم إطلاق YOLO26 في عام 2026، وهو يعالج نقاط الاحتكاك التاريخية في نشر الكشف عن الأشياء. إنه ليس مجرد نموذج، بل نظام بيئي كامل مصمم لسهولة الاستخدام والتكرار السريع.
الميزات الرئيسية لـ YOLO26
- تصميم شامل NMS: على عكس PP-YOLOE+ وYOLO اللذين قد يتطلبان ضبطًا دقيقًا NMS فإن YOLO26 شامل بطبيعته. وهذا يلغي تمامًا تقنية Non-Maximum Suppression (NMS) ، مما يضمن زمن استدلال حتميًا ويبسط خطوط الإنتاج.
- محسّن MuSGD: مستوحى من الابتكارات في تدريب نماذج اللغة الكبيرة (مثل Kimi K2 من Moonshot AI)، يستخدم YOLO26 محسّن MuSGD. تعمل هذه الطريقة الهجينة على استقرار ديناميكيات التدريب، مما يسمح للنموذج بالتقارب بشكل أسرع مع عدد أقل من العصور مقارنةً بـ SGD القياسي SGD في البنى القديمة.
- ProgLoss + STAL: تم تحسين اكتشاف الأجسام الصغيرة بشكل كبير من خلال ProgLoss و Soft Task Alignment Learning (STAL). وهذا يجعل YOLO26 فعالاً بشكل خاص في الصور الجوية والتفتيش الصناعي حيث الدقة في اكتشاف العيوب الصغيرة أمر بالغ الأهمية.
- تحسين الحواف: من خلال إزالة Distribution Focal Loss (DFL)، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعله الخيار الأفضل لأجهزة Raspberry Pi والأجهزة المحمولة وتطبيقات إنترنت الأشياء (IoT).
- تنوع لا مثيل له: بينما يركز المنافسون بشكل أساسي على الكشف، يدعم Ultralytics تقسيم الحالات وتقدير الوضعيات و OBB والتصنيف ضمن واجهة برمجة تطبيقات واحدة وموحدة.
سير عمل مبسط
يتيح لك Ultralytics الانتقال من تعليق البيانات إلى النشر في غضون دقائق. باستخدام Ultralytics يمكنك إدارة مجموعات البيانات والتدريب في السحابة والتصدير إلى أي تنسيق (ONNX TensorRT CoreML) دون كتابة رمز نمطي.
مثال على التعليمات البرمجية: البساطة في العمل
تدريب نموذج متطور باستخدام Ultralytics بديهي. تعمل Python على إزالة تعقيد تعريف البنية وضبط المعلمات الفائقة.
from ultralytics import YOLO
# Load the latest YOLO26 model (nano version for edge devices)
model = YOLO("yolo26n.pt")
# Train the model on your custom dataset
# YOLO26 automatically handles anchor-free assignment and efficient dataloading
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference on an image
# NMS-free output is returned directly, ready for downstream logic
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the results
predictions[0].show()
حالات الاستخدام والتوصيات
يعتمد اختيار النموذج المناسب على القيود المحددة الخاصة بك فيما يتعلق بتكامل النظام البيئي وتوافر الأجهزة وموارد التطوير.
- اختر PP-YOLOE+ إذا كانت البنية التحتية الخاصة بك متكاملة بالفعل مع نظام Baidu PaddlePaddle البيئي. إنه خيار قوي لمعالجة الصور الثابتة حيث يعمل على تعظيم mAP على الخوادم، ولديك القدرة الهندسية على إدارة التبعيات الخاصة بـ Paddle.
- اخترYOLO إذا كنت تجري أبحاثًا في مجال البحث عن البنية العصبية أو تحتاج إلى تحسينات محددة في زمن الاستجابة على الأجهزة المدعومة. إن رأسه خفيف الوزن يجعله فعالًا في تحليلات الفيديو عالية الإنتاجية، شريطة أن تتمكن من التنقل في مسار التدريب المكثف للتقطير.
- اختر Ultralytics للحصول على أفضل توازن بين السرعة والدقة وتجربة المطور. يعمل تصميمه NMS على تبسيط منطق النشر، بينما تجعل إزالة DFL منه سريعًا بشكل استثنائي على وحدات المعالجة المركزية والأجهزة الطرفية. سواء كنت تبني أنظمة بيع بالتجزئة ذكية أو روبوتات زراعية مستقلة، فإن الوثائق القوية والدعم النشط من المجتمع يضمنان أن مشروعك سيظل صالحًا في المستقبل.
بالنسبة للمستخدمين المهتمين ببنى أخرى فعالة، تغطي الوثائق أيضًا نماذج مثل YOLO11 و RT-DETR، مما يوفر مجموعة واسعة من الأدوات لمواجهة كل تحديات الرؤية الحاسوبية.
الخلاصة
YOLO كل من PP-YOLOE+ وYOLO بشكل كبير في تطوير اكتشاف الكائنات بدون مرساة.YOLO PP-YOLOE+ بتحسين عملية التدريب من خلال مواءمة المهام، بينماYOLO قوة NAS والتقطير. ومع ذلك، فإن تعقيد خطوط التدريب الخاصة بكل منهما وتقييد النظام البيئي يمكن أن يشكل عائقًا للعديد من الفرق.
يتميز Ultralytics بتمكين الجميع من الاستفادة من هذه الميزات المتقدمة. من خلال الجمع بين بنيةNMS وتحسين MuSGD وأداء متفوق، يقدم حلاً شاملاً يمكن توسيعه من النموذج الأولي إلى الإنتاج بأقل قدر من الاحتكاك. بالنسبة للمطورين الذين يسعون إلى تعظيم الإنتاجية والأداء، Ultralytics المعيار الصناعي.