YOLOv6-3.0 في مقابل PP-YOLOE+: تقييم كواشف الكائنات الصناعية
عند اختيار إطار عمل لـ اكتشاف الكائنات في الوقت الفعلي، يقوم مهندسو تعلم الآلة بتقييم مجموعة متنوعة من البنيات عالية الأداء بشكل متكرر. اثنان من النماذج البارزة في مشهد التطبيقات الصناعية هما YOLOv6-3.0 و PP-YOLOE+. لقد دفع كلا النموذجين حدود الدقة والسرعة، ومع ذلك فقد تم تصميمهما ليناسبا أنظمة بيئية وأجهزة نشر مختلفة قليلاً.
توفر هذه المقارنة التقنية نظرة متعمقة على بنياتها، ومقاييس الأداء، ومنهجيات التدريب، بينما تقدم أيضًا بدائل حديثة مثل Ultralytics YOLO26 التي توفر تنوعًا فائقًا وسهولة في الاستخدام.
YOLOv6-3.0: محرك صناعي عالي الإنتاجية
تم تطوير YOLOv6-3.0 بواسطة قسم الذكاء الاصطناعي البصري في Meituan، وهو مُحسَّن بشكل كبير للبيئات الصناعية، وخاصة تلك التي تستفيد من وحدات معالجة الرسومات القوية من فئة الخوادم.
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
- المنظمة: Meituan
- التاريخ: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
الابتكارات المعمارية
يستخدم YOLOv6-3.0 هيكل EfficientRep، المصمم خصيصًا لزيادة استخدام مسرعات الأجهزة مثل وحدات معالجة الرسومات من NVIDIA. تقدم البنية وحدة تسلسل ثنائية الاتجاه (BiC) داخل العنق، مما يحسن بشكل كبير دمج الميزات متعددة النطاقات. علاوة على ذلك، فهي تتضمن استراتيجية التدريب المدعوم بالمرساة (AAT). يتمتع هذا النهج الهجين بخصائص التقارب القوية لـ الشبكات القائمة على المرساة خلال مرحلة التدريب، بينما يتجاهل المراسي أثناء الاستدلال للحفاظ على السرعة العالية النموذجية للنماذج الخالية من المراسي.
PP-YOLOE+: بطل الاكتشاف في PaddlePaddle
PP-YOLOE+ هو تطور لسلسلة PP-YOLO، تم تطويره بالكامل داخل إطار عمل PaddlePaddle بواسطة باحثين من Baidu. يتفوق هذا النموذج في البيئات التي يكون فيها نظام Paddle البيئي مستقرًا بالفعل.
- المؤلفون: مؤلفو PaddlePaddle
- المنظمة: Baidu
- التاريخ: 2022-04-02
- Arxiv: 2203.16250
- GitHub: PaddlePaddle/PaddleDetection
الابتكارات المعمارية
PP-YOLOE+ هو كاشف خالٍ من المراسي يقدم استراتيجية تعيين تسميات ديناميكية تُعرف بـ TAL (تعلم محاذاة المهام). يستخدم هيكل CSPRepResNet، الذي يلتقط الميزات الدلالية بكفاءة مع الحفاظ على الكفاءة الحسابية. تم تحسين النموذج بشكل كبير للنشر عبر TensorRT و OpenVINO، مما يجعله منافسًا قويًا لنشر الحافة والخادم، بشرط أن يكون المستخدم مرتاحًا في التعامل مع PaddlePaddle API.
على الرغم من أن PP-YOLOE+ يقدم نتائج ممتازة، إلا أن اعتماده على PaddlePaddle قد يمثل منحنى تعليميًا للمهندسين المعتادين على PyTorch. يمكن أن يؤدي استخدام إطار عمل موحد مثل Ultralytics إلى تقليل وقت الإعداد بشكل كبير.
مقارنة الأداء
يتطلب تقييم هذه النماذج النظر في توازنها بين متوسط دقة الدقة (mAP) وسرعة الاستدلال. يسلط الجدول أدناه الضوء على أدائها في مجموعة بيانات التحقق من الصحة COCO.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ملي ثانية) | السرعة T4 TensorRT10 (ملي ثانية) | المعلمات (مليون) | FLOPs (مليار) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
بينما يُظهر كلا النموذجين أداءً قويًا، يحافظ YOLOv6-3.0 عمومًا على تفوق طفيف في سرعة TensorRT الخام عند أحجام النماذج الأصغر، مما يجعله فعالًا للغاية لعمليات الدفع الآلي عالية السرعة أو اكتشاف عيوب التصنيع. على العكس من ذلك، يتوسع PP-YOLOE+ بشكل جيد مع أعداد أكبر من المعلمات للحصول على أقصى قدر من الدقة.
ميزة Ultralytics: تقديم YOLO26
بينما يتمتع كل من YOLOv6-3.0 و PP-YOLOE+ بقدرات عالية، فإن التطور السريع لـ الرؤية الحاسوبية يتطلب بنيات لا توفر السرعة الخام فحسب، بل توفر أيضًا سهولة استثنائية في الاستخدام، ومتطلبات ذاكرة أقل، ونظامًا بيئيًا موحدًا. هنا تعيد نماذج Ultralytics YOLO، وخاصة YOLO11 و YOLO26 المتطور، تعريف حالة الفن.
تم إطلاق YOLO26 في يناير 2026، ويضع معيارًا جديدًا للذكاء الاصطناعي البصري الموجه للحافة والجاهز للسحابة، مما يوفر مزايا كبيرة مقارنة بالنماذج القديمة:
- تصميم من طرف إلى طرف خالٍ من NMS: بناءً على الأسس التي وضعها YOLOv10، يلغي YOLO26 محليًا كبت النطاق غير الأقصى (NMS) أثناء المعالجة اللاحقة. هذا يبسط بشكل كبير منطق النشر ويقلل من تباين زمن الوصول في المشاهد المزدحمة.
- استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية: من خلال إزالة خسارة التوزيع البؤري (DFL) بشكل استراتيجي، يسرع YOLO26 أداء وحدة المعالجة المركزية بشكل كبير، مما يجعله متفوقًا بشكل كبير على YOLOv6 أو PP-YOLOE+ لأجهزة إنترنت الأشياء وتطبيقات الهاتف المحمول.
- محسن MuSGD: مستوحى من تقنيات تدريب النماذج اللغوية الكبيرة المتقدمة (مثل Kimi K2 من Moonshot AI)، يوفر المحسن الهجين MuSGD تدريبًا مستقرًا وفعالًا للغاية، ويتقارب بشكل أسرع من SGD أو AdamW التقليدي.
- ProgLoss + STAL: تحقق هذه الدوال الخسارة المتقدمة تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو عامل حاسم لـ صور الطائرات بدون طيار والمراقبة الجوية.
- تنوع المهام: على عكس YOLOv6-3.0 الذي يركز بشدة على الكشف، يدعم YOLO26 تجزئة الكائنات، تقدير الوضعية، التصنيف، واكتشاف صندوق الإحاطة الموجه (OBB) خارج الصندوق.
نظام تدريب انسيابي
يتطلب نشر PP-YOLOE+ إدارة بيئة PaddlePaddle، بينما يتطلب YOLOv6-3.0 التنقل في نصوص برمجية تركز على البحث. في المقابل، توفر منصة Ultralytics تجربة سلسة ومن البداية إلى الاحتراف.
يتطلب تدريب نموذج YOLO26 متطور بضعة أسطر فقط من Python:
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on your custom dataset with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model's accuracy
metrics = model.val()
# Export seamlessly to OpenVINO or TensorRT
path = model.export(format="engine")هذا الواجهة البرمجية البسيطة، جنبًا إلى جنب مع انخفاض استخدام الذاكرة أثناء التدريب مقارنة بالنماذج الثقيلة مثل RT-DETR، تجعل الذكاء الاصطناعي عالي الأداء متاحًا للجميع.
حالات الاستخدام المثالية واستراتيجيات النشر
اختيار النموذج الصحيح يحدد نجاح خط أنابيب النشر الخاص بك.
متى تستخدم YOLOv6-3.0
- التصنيع عالي السرعة: البيئات التي تغذي فيها الكاميرات الصناعية وحدات معالجة الرسومات المخصصة NVIDIA T4 أو A100 مباشرة، مما يتطلب استدلالًا ثابتًا أقل من 5 مللي ثانية.
- تحليلات الفيديو من جانب الخادم: معالجة تدفقات فيديو متعددة كثيفة حيث يكون إنتاجية GPU هي العائق الرئيسي.
متى تستخدم PP-YOLOE+
- أنظمة Baidu/Paddle البيئية: بيئات المؤسسات المستثمرة بكثافة في حزمة تقنية PaddlePaddle أو التي تنشر خصيصًا على أجهزة محسنة لسلسلة أدوات Baidu.
- الصور الثابتة عالية الدقة: السيناريوهات التي يكون فيها mAP المرتفع للنموذج الأكبر حجمًا (PP-YOLOE+x) أكثر أهمية من سرعة نشر الحافة.
متى تختار Ultralytics YOLO26
- أجهزة الحافة و IoT: بفضل تصميمه الخالي من NMS وإزالة DFL، يعد YOLO26 الخيار بلا منازع للنشر على Raspberry Pi أو NXP أو وحدات المعالجة المركزية للهواتف المحمولة.
- تطبيقات المهام المتعددة: المشاريع التي تتطلب تتبع الكائنات المتزامن، أو تقدير الوضعية، أو التجزئة باستخدام واجهة برمجة تطبيقات موحدة.
- النماذج الأولية السريعة إلى الإنتاج: الفرق التي تستفيد من منصة Ultralytics لتبسيط تعليق مجموعة البيانات، وضبط المعلمات الفائقة، ونشر النموذج بنقرة واحدة.
للمطورين الذين يتطلعون إلى استكشاف المشهد الأوسع لنماذج الكشف، توفر إطارات عمل مثل YOLOX و DAMO-YOLO أيضًا نهجًا بنيوية فريدة تستحق المراجعة في وثائق Ultralytics.