YOLOv6.0 مقابل PP-YOLOE+: تحسين الكشف عن الأجسام الصناعية
تطورت تقنية الكشف عن الأجسام في الوقت الفعلي بسرعة كبيرة، مدفوعة بالحاجة إلى نماذج قادرة على تحقيق التوازن بين الدقة العالية والكمون المنخفض على أجهزة متنوعة. ومن بين البنى البارزة التي حددت معالم هذا المجال، نجد YOLOv6.YOLOv6، التي طورتها Meituan للتطبيقات الصناعية، وPP-YOLOE+، وهو نموذج متطور خالٍ من المراسي من PaddlePaddle التابع لـ Baidu.
تستكشف هذه المقارنة ابتكاراتها المعمارية ومعايير الأداء ومدى ملاءمتها للنشر لمساعدتك في اختيار الأداة المناسبة لمشاريع الرؤية الحاسوبية الخاصة بك.
نظرة عامة على النموذج
YOLOv6-3.0
المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, and Xiangxiang Chu
المنظمة:Meituan
التاريخ: 13 يناير 2023
الروابط:Arxiv | GitHub
YOLOv6.YOLOv6، الذي يشار إليه غالبًا باسم "إعادة تحميل كاملة النطاق"، هو كاشف كائنات أحادي المرحلة مصمم خصيصًا للتطبيقات الصناعية. ويتمثل هدفه التصميمي الأساسي في تعظيم الإنتاجية على الأجهزة مثل وحدات معالجة الرسومات NVIDIA T4. ويقدم استراتيجيات شبكة تجميع المسارات ثنائية الاتجاه (Bi-PAN) والتدريب بمساعدة المراسي (AAT) لتجاوز حدود السرعة والدقة.
PP-YOLOE+
المؤلفون: PaddlePaddle
المنظمة:Baidu
التاريخ: 2 أبريل 2022
الروابط:Arxiv | GitHub
PP-YOLOE+ هو تطورYOLO يستفيد من العمود الفقري القابل للتطوير لـ CSPRepResNet ورأس متوافق مع المهام. وهو جزء من مجموعة PaddleDetection الأوسع نطاقًا ويركز على كونه كاشفًا عالي الدقة ومنخفض التأخير وخاليًا من المراسي. وهو قوي بشكل خاص عند نشره داخل PaddlePaddle باستخدام PaddleLite لدعم الخلفية المتنوعة بما في ذلك تحسين FPGA و NPU.
مقارنة الأداء
عند اختيار نموذج للإنتاج، من الضروري فهم التوازن بين متوسط الدقة (mAP) وسرعة الاستدلال. يوضح الجدول أدناه مقارنة بين هذه النماذج بمختلف أحجامها.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
تحليل نقدي
- كفاءة النموذج الصغير: في نظام النانو/الصغير، يوفر PP-YOLOE+t دقة أعلى بكثير (39.9٪ mAP 37.5٪ mAP) لعدد معلمات مماثل. ومع ذلك، تم تحسين YOLOv6.YOLOv6 بشكل كبير من حيث زمن الاستجابة على وحدات معالجة الرسومات، حيث سجل زمن استجابة مذهل بلغ 1.17 مللي ثانية على T4.
- التوازن في النطاق المتوسط: في النطاق المتوسط، تزداد المنافسة حدة. يتفوق YOLOv6. YOLOv6 على PP-YOLOE+m قليلاً في الدقة (50.0٪ مقابل 49.8٪) والسرعة (5.28 مللي ثانية مقابل 5.56 مللي ثانية)، مما يجعله خيارًا رائعًا لمهام الفحص الصناعي للأغراض العامة.
- دقة واسعة النطاق: بالنسبة للتطبيقات التي تتطلب أقصى قدر من التفاصيل، مثل تحليل الصور الساتلية، يقدم PP-YOLOE+ نسخة كبيرة الحجم تصل إلى 54.7% mAP وهو مستوى حجم لا يضاهيه YOLOv6. YOLOv6 بشكل صريح في مقارنة المعايير المحددة هذه.
الهيكلة والابتكار
YOLOv6.0: المتخصص الصناعي
YOLOv6 عدة تقنيات تحسين قوية مصممة لبيئات الإنتاجية العالية.
- RepBi-PAN: شبكة تجميع مسارات ثنائية الاتجاه مزودة بكتل من نوع RepVGG. وهذا يسمح للنموذج بأن يكون له تفرعات معقدة أثناء التدريب، ولكنه يندمج في تلافيف بسيطة 3x3 أثناء الاستدلال، مما يقلل من تكاليف الوصول إلى الذاكرة.
- التدريب بمساعدة المرجع (AAT): على الرغم من أن استنتاج النموذج لا يعتمد على المرجع، فإن YOLOv6 فرعًا قائمًا على المرجع أثناء التدريب لتثبيت التقارب، مما يجمع بين أفضل ما في كلا العالمين.
- رأس منفصل: يفصل بين مهام الانحدار والتصنيف، وهو أمر قياسي في أجهزة الكشف الحديثة لتحسين سرعة ودقة التقارب.
PP-YOLOE+: التحسين بدون مرساة
يحسن PP-YOLOE+ النموذج الخالي من المراسي مع التركيز على تمثيل الميزات.
- CSPRepResNet Backbone: يستخدم هيكل أساسي قابل للتطوير يجمع بين شبكات Cross Stage Partial ووصلات متبقية، مما يوفر تدفقًا قويًا للتدرج.
- TAL (تحسين التعلم من خلال مواءمة المهام): تضمن استراتيجية التعيين الديناميكي للعلامات هذه اختيار أفضل المراجع من حيث الجودة بناءً على مجموع درجات التصنيف وجودة الترجمة.
- ET-Head: رأس فعال ومتوافق مع المهام يعمل على تبسيط طبقات التنبؤ من أجل السرعة دون التضحية بمزايا توافق المهام.
اعتبارات متعلقة بالأجهزة
YOLOv6 تحسين YOLOv6 بشكل كبير لمعالجات NVIDIA (TensorRT)، وغالبًا ما تظهر أفضلmAP على رقائق T4 و A100. يتألق PP-YOLOE+ عندما تحتاج إلى دعم أجهزة أوسع عبر PaddleLite، بما في ذلك معالجات ARM CPU و NPU الموجودة في الأجهزة الطرفية.
ميزة Ultralytics
على الرغم من أن YOLOv6 PP-YOLOE+ يمثلان إنجازين بحثيين ممتازين، إلا أن المطورين غالبًا ما يواجهون تحديات في التكامل والنشر والصيانة عند الانتقال من الورق إلى المنتج. يعالج Ultralytics هذه النقاط الحساسة بشكل مباشر.
سهولة الاستخدام والنظام البيئي
تتيح لكPython Ultralytics Python تدريب النماذج والتحقق من صحتها ونشرها باستخدام الحد الأدنى من التعليمات البرمجية. على عكس ملفات التكوين المعقدة التي غالبًا ما تتطلبها PaddleDetection أو مستودعات الأبحاث، Ultralytics سير العمل.
from ultralytics import YOLO
# Load a model (YOLOv8, YOLO11, or YOLO26)
model = YOLO("yolo26s.pt")
# Train on a custom dataset with a single command
model.train(data="coco8.yaml", epochs=100)
علاوة على ذلك، فإن Ultralytics (المعروفة سابقًا باسم HUB) حلاً لا يتطلب كتابة أي أكواد برمجية لإدارة مجموعات البيانات، والتعليق التلقائي، والتدريب السحابي بنقرة واحدة، مما يؤدي إلى تبسيط دورة حياة MLOps للفرق.
التنوع ودعم المهام
تركز YOLOv6 PP-YOLOE+ بشكل أساسي على اكتشاف الكائنات. في المقابل، تركز Ultralytics مثل YOLO11 و YOLO26 تدعم بشكل أساسي مجموعة كاملة من مهام الرؤية الحاسوبية ضمن مكتبة واحدة:
- تجزئة المثيل: إخفاء دقيق للأشياء.
- تقدير الوضع: اكتشاف النقاط الرئيسية لتتبع البشر أو الحيوانات.
- مربع الحدود الموجه (OBB): الكشف عن الأجسام المدورة، وهو أمر بالغ الأهمية بالنسبة للصور الجوية.
- Classification: تصنيف الصورة بالكامل.
كفاءة التدريب والذاكرة
تشتهر Ultralytics بكفاءتها في استخدام الذاكرة. من خلال تحسين البنية ومحملات البيانات، تسمح نماذج مثل YOLO26 بأحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين مقارنة بالبنى القديمة أو النماذج الثقيلة مثل RT-DETR. وهذا يجعل الذكاء الاصطناعي عالي الأداء متاحًا حتى بدون مركز بيانات.
التوصية: لماذا تختار YOLO26؟
بالنسبة للمطورين الذين يبدأون مشاريع جديدة في عام 2026، يمثل Ultralytics قمة الكفاءة والدقة. فهو يعالج القيود المحددة الموجودة في الأجيال السابقة والنماذج المنافسة:
- NMS من البداية إلى النهاية: على عكس YOLOv6 PP-YOLOE+ التي قد تتطلب معالجة لاحقة NMS Non-Maximum Suppression)، فإن YOLO26 هي خالية من NMS من البداية إلى النهاية. وهذا يبسط منطق النشر ويقلل من تقلب زمن الاستجابة في المشاهد المزدحمة.
- MuSGD Optimizer: مستوحى من الابتكارات في نماذج اللغة الكبيرة (LLMs)، يضمن هذا المحسن تدريبًا مستقرًا حتى بالنسبة لمجموعات البيانات المخصصة المعقدة.
- تحسين الحافة: مع إزالة Distribution Focal Loss (DFL) والمكونات الثقيلة الأخرى، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعله الخيار الأفضل لتطبيقات الأجهزة المحمولة وإنترنت الأشياء (IoT) حيث لا تتوفر وحدات معالجة الرسومات (GPU).
- ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تعزيزات كبيرة في اكتشاف الأجسام الصغيرة، وهي نقطة ضعف تقليدية في أجهزة الكشف العامة الغرض.
الخلاصة
يلعب كل من YOLOv6.YOLOv6 و PP-YOLOE+ دورًا مهمًا في تاريخ اكتشاف الكائنات. اختر YOLOv6.YOLOv6 إذا كانت البنية التحتية الخاصة بك مرتبطة بشكل صارم NVIDIA وتحتاج إلى تعظيم الإنتاجية للفحص الصناعي. اختر PP-YOLOE+ إذا كنت متكاملًا بشكل عميق في نظام Baidu PaddlePaddle أو تحتاج إلى دعم محدد لمسرعات الأجهزة الصينية.
ومع ذلك، فإن Ultralytics هو الخيار الموصى به للحصول على حل مستقبلي يوفر تنوعًا في المهام وسهولة الاستخدام وأداءً متطورًا على كل CPU GPU. يضمن تكامله مع Ultralytics قضاء وقت أقل في تكوين البيئات ووقت أطول في حل المشكلات الواقعية.
مزيد من القراءة
- YOLOv8: النموذج الكلاسيكي المتطور المستخدم على نطاق واسع في الصناعة.
- YOLOv10: رائد استراتيجيات التدريب NMS.
- RT-DETR: محول الكشف في الوقت الحقيقي لسيناريوهات عالية الدقة.
- YOLO : اكتشاف المفردات المفتوحة للعثور على الكائنات دون تدريب مخصص.