YOLOv6.0 مقابل PP-YOLOE+: تقييم أجهزة الكشف عن الأجسام الصناعية
عند اختيار إطار عمل للكشف عن الكائنات في الوقت الفعلي، غالبًا ما يقوم مهندسو التعلم الآلي بتقييم مجموعة متنوعة من البنى عالية الأداء. هناك نموذجان بارزان في مجال التطبيقات الصناعية هما YOLOv6.YOLOv6 و PP-YOLOE+. وقد دفع كلا النموذجين حدود الدقة والسرعة إلى آفاق جديدة، إلا أنهما مصممان خصيصًا لنظم بيئية وأجهزة نشر مختلفة قليلاً.
تقدم هذه المقارنة الفنية نظرة متعمقة على هياكلها ومقاييس أدائها ومنهجيات التدريب الخاصة بها، مع تقديم بدائل حديثة مثل Ultralytics التي توفر تنوعًا فائقًا وسهولة في الاستخدام.
YOLOv6.0: محرك صناعي عالي الإنتاجية
تم تطوير YOLOv6. YOLOv6 بواسطة قسم Vision AI في Meituan، وهو مُحسّن بشكل كبير للبيئات الصناعية، لا سيما تلك التي تستخدم وحدات معالجة رسومات قوية على مستوى الخوادم.
- المؤلفون: تشوي لي، لولو لي، ييفي جينغ، هونغليانغ جيانغ، منغ تشنغ، بو تشانغ، زيدان كي، شياومينغ شو، وشيانغشيانغ تشو
- المنظمة: Meituan
- التاريخ: 2023-01-13
- Arxiv: 2301.05586
- GitHub: YOLOv6
الابتكارات المعمارية
يستخدم YOLOv6.YOLOv6 هيكل EfficientRep، المصمم خصيصًا لتعظيم الاستفادة من مسرعات الأجهزة مثل NVIDIA تقدم البنية وحدة تسلسل ثنائية الاتجاه (BiC) داخل العنق، مما يحسن بشكل كبير من دمج الميزات متعددة النطاقات. علاوة على ذلك، فإنها تدمج استراتيجية التدريب بمساعدة المراسي (AAT). يتمتع هذا النهج الهجين بخصائص التقارب القوية للشبكات القائمة على المراسي خلال مرحلة التدريب، مع التخلص من المراسي أثناء الاستدلال للحفاظ على السرعة العالية التي تتميز بها النماذج الخالية من المراسي.
PP-YOLOE+: بطل الكشف PaddlePaddle
PP-YOLOE+ هو تطور لسلسلة PP-YOLO، تم تطويره بالكامل ضمن إطار عمل PaddlePaddle بواسطة باحثي Baidu. يتفوق في البيئات التي يكون فيها نظام Paddle البيئي راسخًا بالفعل.
- المؤلفون: PaddlePaddle Authors
- المنظمة: Baidu
- التاريخ: 2022-04-02
- Arxiv: 2203.16250
- GitHub: PaddlePaddle
الابتكارات المعمارية
PP-YOLOE+ هو كاشف بدون مرساة يقدم استراتيجية تخصيص علامات ديناميكية تُعرف باسم TAL (Task Alignment Learning). ويستخدم هذا الكاشف شبكة CSPRepResNet الأساسية، التي تلتقط الميزات الدلالية بكفاءة مع الحفاظ على الكفاءة الحسابية. تم تحسين النموذج بشكل كبير للنشر عبر TensorRT OpenVINO مما يجعله منافسًا قويًا لنشرات الحافة والخادم، بشرط أن يكون المستخدم متمرسًا في استخدام PaddlePaddle .
اعتبارات الإطار العام
على الرغم من أن PP-YOLOE+ يحقق نتائج ممتازة، إلا أن اعتماده على PaddlePaddle يمثل منحنى تعليمي للمهندسين المعتادين على PyTorch. باستخدام إطار عمل موحد مثل Ultralytics يمكن أن يقلل بشكل كبير من وقت الإعداد.
مقارنة الأداء
يتطلب تقييم هذه النماذج النظر إلى التوازن بين متوسط الدقة (mAP) وسرعة الاستدلال. يوضح الجدول أدناه أداءها على مجموعة بيانات COCO .
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
بينما يُظهر كلا النموذجين أداءً قويًا، يحافظ YOLOv6. YOLOv6 عمومًا على تفوق طفيف في TensorRT الخام في أحجام النماذج الأصغر، مما يجعله فعالًا للغاية في عمليات الدفع الآلي عالية السرعة أو اكتشاف عيوب التصنيع. على العكس من ذلك، يتكيف PP-YOLOE+ جيدًا مع عدد أكبر من المعلمات لتحقيق أقصى دقة.
Ultralytics : تقديم YOLO26
على الرغم من أن YOLOv6. YOLOv6 و PP-YOLOE+ يتمتعان بقدرات عالية، إلا أن التطور السريع في مجال الرؤية الحاسوبية يتطلب بنى لا توفر السرعة فحسب، بل توفر أيضًا سهولة استثنائية في الاستخدام ومتطلبات ذاكرة أقل ونظامًا بيئيًا موحدًا. وهنا يأتي دور Ultralytics YOLO ، ولا سيما YOLO11 و YOLO26، تعيد تعريف أحدث ما توصلت إليه التكنولوجيا.
تم إصدار YOLO26 في يناير 2026، وهو يضع معيارًا جديدًا للذكاء الاصطناعي للرؤية الذي يركز على الحافة والجاهزية للسحابة، ويقدم مزايا كبيرة مقارنة بالنماذج القديمة:
- تصميم خالٍ من NMS وشامل: استنادًا إلى الأسس التي وضعها YOLOv10، يلغي YOLO26 قمع غير الحد الأقصى (NMS) بشكل طبيعي أثناء المعالجة اللاحقة. هذا يبسط منطق النشر بشكل كبير ويقلل من تباين زمن الانتقال في المشاهد المزدحمة.
- سرعة استدلال أسرع بنسبة تصل إلى 43% على الـ CPU: من خلال الإزالة الاستراتيجية لـ Distribution Focal Loss (DFL)، يسرّع YOLO26 أداء CPU بشكل كبير، مما يجعله متفوقًا جدًا على YOLOv6 أو PP-YOLOE+ لأجهزة إنترنت الأشياء وتطبيقات الهاتف المحمول.
- مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغات الكبيرة (LLM) المتقدمة (مثل Kimi K2 من Moonshot AI)، يقدم مُحسِّن MuSGD الهجين تدريبًا مستقرًا وفعالًا بشكل لا يصدق، ويتقارب بشكل أسرع من SGD التقليدي أو AdamW.
- ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو عامل حاسم لـ صور الطائرات بدون طيار والمراقبة الجوية.
- تعدد الاستخدامات عبر المهام: على عكس YOLOv6-3.0 الذي يركز بشكل كبير على الكشف، يدعم YOLO26 تجزئة الكائنات، وتقدير الوضعيات، والتصنيف، والكشف عن الصناديق المحيطة الموجهة (OBB) جاهزًا للاستخدام.
نظام تدريب مبسط
يتطلب نشر PP-YOLOE+ إدارة بيئة PaddlePaddle، بينما يتطلب YOLOv6-3.0 التنقل في سكريبتات موجهة للبحث. على النقيض من ذلك، توفر منصة Ultralytics تجربة سلسة من الصفر إلى الاحتراف.
يتطلب تدريب نموذج YOLO26 المتطور بضع أسطر فقط من Python:
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on your custom dataset with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model's accuracy
metrics = model.val()
# Export seamlessly to OpenVINO or TensorRT
path = model.export(format="engine")
هذه الواجهة البسيطة، إلى جانب استخدامها لذاكرة أقل أثناء التدريب مقارنة بالنماذج التي تعتمد على المحولات بشكل كبير مثل RT-DETR، تجعل الذكاء الاصطناعي عالي الأداء متاحًا للجميع.
حالات الاستخدام المثالية واستراتيجيات النشر
يحدد اختيار النموذج الصحيح نجاح خط أنابيب النشر الخاص بك.
متى تستخدم YOLOv6.0
- التصنيع عالي السرعة: البيئات التي تغذي فيها الكاميرات الصناعية مباشرة وحدات GPU مخصصة من NVIDIA T4 أو A100، وتتطلب استدلالًا ثابتًا في أقل من 5 مللي ثانية.
- تحليلات الفيديو من جانب الخادم: معالجة تدفقات فيديو متعددة وكثيفة حيث تمثل إنتاجية GPU الصافية عنق الزجاجة الرئيسي.
متى تستخدم PP-YOLOE+
- أنظمة Baidu/Paddle البيئية: بيئات الشركات التي تستثمر بكثافة في مكدس تقنيات PaddlePaddle أو تنشر خصيصًا على أجهزة مُحسّنة لسلسلة أدوات Baidu.
- الصور الثابتة عالية الدقة: السيناريوهات التي يكون فيها mAP العالي لنموذج (PP-YOLOE+x) ذي الحجم الكبير جدًا أكثر أهمية من سرعة النشر على الأجهزة الطرفية.
متى تختار Ultralytics
- أجهزة الحافة وإنترنت الأشياء: بتصميمه الخالي من NMS وإزالة DFL، يُعد YOLO26 الخيار بلا منازع لعمليات النشر على Raspberry Pi أو NXP أو CPUs المحمولة.
- تطبيقات المهام المتعددة: المشاريع التي تتطلب تتبع الكائنات، تقدير الوضعية، أو التجزئة المتزامنة باستخدام واجهة برمجة تطبيقات موحدة.
- من النماذج الأولية السريعة إلى الإنتاج: الفرق التي تستفيد من منصة Ultralytics لـ تسمية مجموعات البيانات المبسطة، وضبط المعلمات الفائقة، ونشر النموذج بنقرة واحدة.
بالنسبة للمطورين الذين يرغبون في استكشاف نطاق أوسع من نماذج الكشف، توفر أطر عمل مثل YOLOX و YOLO أيضًا مناهج معمارية فريدة تستحق المراجعة في Ultralytics .