YOLOv6.0 مقابل PP-YOLOE+: تقييم أجهزة الكشف عن الأجسام الصناعية
عند اختيار إطار عمل للكشف عن الكائنات في الوقت الفعلي، غالبًا ما يقوم مهندسو التعلم الآلي بتقييم مجموعة متنوعة من البنى عالية الأداء. هناك نموذجان بارزان في مجال التطبيقات الصناعية هما YOLOv6.YOLOv6 و PP-YOLOE+. وقد دفع كلا النموذجين حدود الدقة والسرعة إلى آفاق جديدة، إلا أنهما مصممان خصيصًا لنظم بيئية وأجهزة نشر مختلفة قليلاً.
تقدم هذه المقارنة الفنية نظرة متعمقة على هياكلها ومقاييس أدائها ومنهجيات التدريب الخاصة بها، مع تقديم بدائل حديثة مثل Ultralytics التي توفر تنوعًا فائقًا وسهولة في الاستخدام.
YOLOv6.0: محرك صناعي عالي الإنتاجية
تم تطوير YOLOv6. YOLOv6 بواسطة قسم Vision AI في Meituan، وهو مُحسّن بشكل كبير للبيئات الصناعية، لا سيما تلك التي تستخدم وحدات معالجة رسومات قوية على مستوى الخوادم.
- المؤلفون: تشوي لي، لولو لي، ييفي جينغ، هونغليانغ جيانغ، مينغ تشينغ، بو تشانغ، زيدان كي، شياومينغ شو، وشيانغشيانغ تشو
- المنظمة: Meituan
- التاريخ: 2023-01-13
- Arxiv: 2301.05586
- GitHub: YOLOv6
الابتكارات المعمارية
يستخدم YOLOv6.YOLOv6 هيكل EfficientRep، المصمم خصيصًا لتعظيم الاستفادة من مسرعات الأجهزة مثل NVIDIA تقدم البنية وحدة تسلسل ثنائية الاتجاه (BiC) داخل العنق، مما يحسن بشكل كبير من دمج الميزات متعددة النطاقات. علاوة على ذلك، فإنها تدمج استراتيجية التدريب بمساعدة المراسي (AAT). يتمتع هذا النهج الهجين بخصائص التقارب القوية للشبكات القائمة على المراسي خلال مرحلة التدريب، مع التخلص من المراسي أثناء الاستدلال للحفاظ على السرعة العالية التي تتميز بها النماذج الخالية من المراسي.
PP-YOLOE+: بطل الكشف PaddlePaddle
PP-YOLOE+ هو تطورYOLO تم تطويره بالكامل ضمن PaddlePaddle من قبل باحثي Baidu. وهو يتفوق في البيئات التي تم فيها بالفعل إنشاء نظام Paddle البيئي.
- المؤلفون: PaddlePaddle Authors
- المنظمة: Baidu
- التاريخ: 2022-04-02
- Arxiv: 2203.16250
- GitHub: PaddlePaddle
الابتكارات المعمارية
PP-YOLOE+ هو كاشف بدون مرساة يقدم استراتيجية تخصيص علامات ديناميكية تُعرف باسم TAL (Task Alignment Learning). ويستخدم هذا الكاشف شبكة CSPRepResNet الأساسية، التي تلتقط الميزات الدلالية بكفاءة مع الحفاظ على الكفاءة الحسابية. تم تحسين النموذج بشكل كبير للنشر عبر TensorRT OpenVINO مما يجعله منافسًا قويًا لنشرات الحافة والخادم، بشرط أن يكون المستخدم متمرسًا في استخدام PaddlePaddle .
اعتبارات الإطار العام
على الرغم من أن PP-YOLOE+ يحقق نتائج ممتازة، إلا أن اعتماده على PaddlePaddle يمثل منحنى تعليمي للمهندسين المعتادين على PyTorch. باستخدام إطار عمل موحد مثل Ultralytics يمكن أن يقلل بشكل كبير من وقت الإعداد.
مقارنة الأداء
يتطلب تقييم هذه النماذج النظر إلى التوازن بين متوسط الدقة (mAP) وسرعة الاستدلال. يوضح الجدول أدناه أداءها على مجموعة بيانات COCO .
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
بينما يُظهر كلا النموذجين أداءً قويًا، يحافظ YOLOv6. YOLOv6 عمومًا على تفوق طفيف في TensorRT الخام في أحجام النماذج الأصغر، مما يجعله فعالًا للغاية في عمليات الدفع الآلي عالية السرعة أو اكتشاف عيوب التصنيع. على العكس من ذلك، يتكيف PP-YOLOE+ جيدًا مع عدد أكبر من المعلمات لتحقيق أقصى دقة.
Ultralytics : تقديم YOLO26
على الرغم من أن YOLOv6. YOLOv6 و PP-YOLOE+ يتمتعان بقدرات عالية، إلا أن التطور السريع في مجال الرؤية الحاسوبية يتطلب بنى لا توفر السرعة فحسب، بل توفر أيضًا سهولة استثنائية في الاستخدام ومتطلبات ذاكرة أقل ونظامًا بيئيًا موحدًا. وهنا يأتي دور Ultralytics YOLO ، ولا سيما YOLO11 و YOLO26، تعيد تعريف أحدث ما توصلت إليه التكنولوجيا.
تم إصدار YOLO26 في يناير 2026، وهو يضع معيارًا جديدًا للذكاء الاصطناعي للرؤية الذي يركز على الحافة والجاهزية للسحابة، ويقدم مزايا كبيرة مقارنة بالنماذج القديمة:
- تصميم شامل NMS: بناءً على الأسس التي أرساها YOLOv10، يزيل YOLO26 بشكل أساسي تقنية Non-Maximum Suppression (NMS) أثناء المعالجة اللاحقة. وهذا يبسط بشكل كبير منطق النشر ويقلل من تقلب زمن الاستجابة في المشاهد المزدحمة.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : من خلال إزالة Distribution Focal Loss (DFL) بشكل استراتيجي، يعمل YOLO26 على تسريع CPU بشكل كبير، مما يجعله متفوقًا بشكل كبير على YOLOv6 PP-YOLOE+ لأجهزة إنترنت الأشياء والتطبيقات المحمولة.
- محسّن MuSGD: مستوحى من تقنيات التدريب المتقدمة LLM (مثل Kimi K2 من Moonshot AI)، يوفر محسّن MuSGD الهجين تدريبًا مستقرًا وفعالًا بشكل لا يصدق، ويتقارب بشكل أسرع من SGD AdamW التقليديين.
- ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو عامل حاسم في صور الطائرات بدون طيار والمراقبة الجوية.
- تعدد الاستخدامات عبر المهام: على عكس YOLOv6. YOLOv6 الذي يركز بشكل كبير على الكشف، يدعم YOLO26 تقسيم الحالات وتقدير الوضع والتصنيف والكشف عن الصندوق المحيط الموجه (OBB) بشكل فوري.
نظام تدريب مبسط
يتطلب نشر PP-YOLOE+ إدارة PaddlePaddle بينما يتطلب YOLOv6. YOLOv6 التنقل بين البرامج النصية التي تركز على الأبحاث. في المقابل، توفر Ultralytics تجربة سلسة من الصفر إلى القمة.
يتطلب تدريب نموذج YOLO26 المتطور بضع أسطر فقط من Python:
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on your custom dataset with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model's accuracy
metrics = model.val()
# Export seamlessly to OpenVINO or TensorRT
path = model.export(format="engine")
هذه الواجهة البسيطة، إلى جانب استخدامها لذاكرة أقل أثناء التدريب مقارنة بالنماذج التي تعتمد على المحولات بشكل كبير مثل RT-DETR، تجعل الذكاء الاصطناعي عالي الأداء متاحًا للجميع.
حالات الاستخدام المثالية واستراتيجيات النشر
اختيار النموذج المناسب يحدد نجاح مسار النشر الخاص بك.
متى تستخدم YOLOv6.0
- التصنيع عالي السرعة: البيئات التي تغذي فيها الكاميرات الصناعية مباشرة وحدات معالجة الرسومات NVIDIA أو A100 المخصصة، مما يتطلب استنتاجًا متسقًا في أقل من 5 مللي ثانية.
- تحليلات الفيديو من جانب الخادم: معالجة تدفقات فيديو متعددة وكثيفة حيث يمثل GPU العائق الرئيسي.
متى تستخدم PP-YOLOE+
- أنظمة Baidu/Paddle: بيئات مؤسسية تستثمر بكثافة في حزمة PaddlePaddle أو تنشر بشكل خاص على أجهزة مُحسّنة لسلسلة أدوات Baidu.
- صور ثابتة عالية الدقة: السيناريوهات التي mAP المعدل المركب العالي mAP للنموذج الكبير جدًا (PP-YOLOE+x) أكثر أهمية من سرعة النشر على الحافة.
متى تختار Ultralytics
- أجهزة الحافة وإنترنت الأشياء: بفضل تصميمها NMS وإزالة DFL، تعد YOLO26 الخيار الأمثل للتنفيذ على Raspberry Pi أو NXP أو وحدات المعالجة المركزية المحمولة.
- تطبيقات متعددة المهام: المشاريع التي تتطلب تتبع الكائنات أو تقدير الوضع أو التجزئة في وقت واحد باستخدام واجهة برمجة تطبيقات موحدة.
- النماذج الأولية السريعة للإنتاج: تستفيد الفرق من Ultralytics لتبسيط تعليقات مجموعات البيانات، وضبط المعلمات الفائقة، ونشر النماذج بنقرة واحدة.
بالنسبة للمطورين الذين يرغبون في استكشاف نطاق أوسع من نماذج الكشف، توفر أطر عمل مثل YOLOX و YOLO أيضًا مناهج معمارية فريدة تستحق المراجعة في Ultralytics .