YOLOv10 مقابل PP-YOLOE+: مقارنة فنية للكشف عن الكائنات
يُعد اختيار نموذج الكشف عن الأجسام الأمثل أمرًا بالغ الأهمية لتحقيق التوازن بين الدقة والسرعة والموارد الحسابية في مهام الرؤية الحاسوبية. تقدم هذه الصفحة مقارنة فنية بين YOLOv10، وهو أحدث تقدم من جامعة Tsinghua مدمج في نظام Ultralytics، و PP-YOLOE+، وهو نموذج عالي الدقة من Baidu. نحلل هياكلها وأدائها وتطبيقاتها لتوجيه قرارك، مع تسليط الضوء على مزايا YOLOv10.
YOLOv10: كفاءة شاملة
يعد Ultralytics YOLOv10 تكرارًا رائدًا في سلسلة YOLO، حيث يركز على الاكتشاف الحقيقي للكائنات في الوقت الفعلي ومن طرف إلى طرف. تم تطويره بواسطة باحثين في جامعة Tsinghua، ويتمثل ابتكاره الأساسي في إلغاء الحاجة إلى المعالجة اللاحقة لإخماد القيم القصوى غير القصوى (NMS)، مما يقلل بشكل كبير من زمن الوصول للاستدلال ويبسط مسارات النشر.
تفاصيل فنية:
- المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
- المنظمة: جامعة Tsinghua
- التاريخ: 2024-05-23
- رابط Arxiv: https://arxiv.org/abs/2405.14458
- رابط GitHub: https://github.com/THU-MIG/yolov10
- رابط المستندات: https://docs.ultralytics.com/models/yolov10/
الميزات الرئيسية والهندسة المعمارية
- تدريب بدون NMS: يستخدم YOLOv10 تعيينات ثنائية متسقة أثناء التدريب، مما يسمح له بإنشاء تنبؤات نظيفة دون الحاجة إلى NMS في وقت الاستدلال. هذه ميزة كبيرة للتطبيقات في الوقت الفعلي حيث يتم احتساب كل جزء من الألف من الثانية من زمن الوصول.
- تصميم مدفوع بالكفاءة والدقة الشاملة: تم تحسين بنية النموذج بشكل شامل لتقليل التكرار الحسابي. يتضمن ذلك ابتكارات مثل رأس التصنيف خفيف الوزن وتقليل الأبعاد المفصول مكانيًا وقنواتيًا، مما يعزز قدرة النموذج مع تقليل استخدام الموارد.
- الكشف بدون نقاط ارتكاز: على غرار العديد من أجهزة الكشف الحديثة، فإنه يستخدم نهجًا خاليًا من نقاط الارتكاز، مما يبسط البنية ويحسن التعميم عبر أحجام الكائنات ونسب العرض إلى الارتفاع المختلفة.
- تكامل نظام Ultralytics البيئي: كنموذج مدعوم من Ultralytics، يستفيد YOLOv10 من نظام بيئي قوي ويحظى بصيانة جيدة. يوفر هذا للمستخدمين تجربة مبسطة من خلال Python API بسيط، و وثائق شاملة، و عمليات تدريب فعالة مع أوزان مُدرَّبة مسبقًا متاحة بسهولة، وتكامل سلس مع Ultralytics HUB لإدارة المشاريع الشاملة.
حالات الاستخدام
- تحليلات الفيديو في الوقت الفعلي: مثالية لتطبيقات مثل القيادة الذاتية، والروبوتات، والمراقبة عالية السرعة حيث يكون زمن انتقال الاستدلال المنخفض أمرًا بالغ الأهمية.
- النشر الطرفي: تم تحسين المتغيرات الأصغر (YOLOv10n/s) بشكل كبير للأجهزة ذات الموارد المحدودة مثل NVIDIA Jetson و Raspberry Pi، مما يجعل الذكاء الاصطناعي المتقدم متاحًا على الحافة.
- تطبيقات عالية الدقة: توفر النماذج الأكبر دقة متطورة للمهام الصعبة مثل تحليل الصور الطبية أو فحص الجودة التفصيلي في التصنيع.
نقاط القوة والضعف
نقاط القوة:
- سرعة وكفاءة فائقة بسبب تصميمه الخالي من NMS.
- توازن ممتاز بين السرعة والدقة عبر جميع أحجام النماذج.
- قابلية عالية للتوسع، حيث يقدم متغيرات من Nano (N) إلى Extra-large (X).
- متطلبات ذاكرة أقل وتدريب فعال.
- سهولة الاستخدام والدعم القوي داخل نظام Ultralytics البيئي الذي تتم صيانته جيدًا.
نقاط الضعف:
- باعتباره نموذجًا أحدث، لا يزال المجتمع خارج نظام Ultralytics البيئي في طور النمو.
- قد يتطلب تحقيق ذروة الأداء تحسينات خاصة بالأجهزة مثل TensorRT.
PP-YOLOE+: دقة عالية في إطار عمل PaddlePaddle
PP-YOLOE+، الذي تم تطويره بواسطة Baidu، هو نسخة محسنة من PP-YOLOE تركز على تحقيق دقة عالية مع الحفاظ على الكفاءة. وهو نموذج رئيسي داخل إطار عمل التعلم العميق PaddlePaddle.
تفاصيل فنية:
- المؤلفون: PaddlePaddle Authors
- المنظمة: Baidu
- التاريخ: 2022-04-02
- رابط Arxiv: https://arxiv.org/abs/2203.16250
- رابط GitHub: https://github.com/PaddlePaddle/PaddleDetection/
- رابط المستندات: https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.8.1/configs/ppyoloe/README.md
الميزات الرئيسية والهندسة المعمارية
- تصميم بدون مربعات ارتكاز (Anchor-Free): على غرار YOLOv10، فهو كاشف بدون مربعات ارتكاز، مما يبسط رأس الكشف ويقلل عدد المعلمات الفائقة التي يجب ضبطها.
- العمود الفقري CSPRepResNet: يستخدم عمودًا فقريًا يجمع بين مبادئ CSPNet و RepResNet لاستخلاص ميزات قوية.
- فقدان ورأس متقدمان: يشتمل النموذج على فقدان Varifocal ورأس ET-Head فعال لتحسين المواءمة بين مهام التصنيف والتوطين.
حالات الاستخدام
- فحص الجودة الصناعية: دقته العالية تجعله مناسبًا للكشف عن العيوب الطفيفة في خطوط التصنيع.
- البيع بالتجزئة الذكي: يمكن استخدامه لتطبيقات مثل إدارة المخزون الآلية وتحليل سلوك العملاء.
- أتمتة إعادة التدوير: فعالة في تحديد المواد المختلفة لـ أنظمة الفرز الآلية.
نقاط القوة والضعف
نقاط القوة:
- تحقيق دقة عالية، خاصة مع متغيرات النموذج الأكبر.
- متكاملة بشكل جيد ضمن نظام PaddlePaddle البيئي.
- تصميم فعال بدون نقاط ارتكاز.
نقاط الضعف:
- الأمثلية الأساسية لإطار عمل PaddlePaddle، مما قد يخلق منحنى تعليميًا حادًا وتحديات في التكامل للمطورين الذين يستخدمون أطر عمل أخرى مثل PyTorch.
- قد يكون دعم المجتمع والموارد المتاحة أقل شمولاً مقارنة بالنظام البيئي الواسع المحيط بنماذج Ultralytics.
- تحتوي النماذج الأكبر على معلمات أكثر بكثير من مكافئات YOLOv10، مما يؤدي إلى تكاليف حسابية أعلى.
تحليل الأداء: السرعة والدقة والكفاءة
النموذج | الحجم (بالبكسل) |
mAPval 50-95 |
السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) |
السرعة T4 TensorRT10 (بالمللي ثانية) |
المعلمات (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
تكشف مقاييس الأداء عن تمييز واضح بين النموذجين. تُظهر YOLOv10 باستمرار كفاءة فائقة في المعلمات والحساب. على سبيل المثال، تحقق YOLOv10-L نسبة mAP مماثلة تبلغ 53.3% لـ mAP الخاص بـ PP-YOLOE+-l البالغ 52.9%، ولكن مع عدد معلمات أقل بنسبة 44% تقريبًا (29.5 مليون مقابل 52.2 مليون). يستمر هذا الاتجاه إلى أكبر النماذج، حيث تصل YOLOv10-X إلى 54.4% mAP مع 56.9 مليون معلمة، بينما يتطلب PP-YOLOE+-x عددًا هائلاً من المعلمات يبلغ 98.42 مليون معلمة لتحقيق نسبة mAP أعلى قليلاً تبلغ 54.7%.
من حيث السرعة، تمنح بنية YOLOv10 الخالية من NMS ميزة واضحة، خاصة بالنسبة للنشر في الوقت الفعلي. يتميز أصغر نموذج، YOLOv10-N، بزمن انتقال مثير للإعجاب يبلغ 1.56 مللي ثانية، مما يجعله الخيار الأفضل لتطبيقات edge AI. في حين أن PP-YOLOE+ يمكن أن يحقق دقة عالية، إلا أنه غالبًا ما يأتي على حساب حجم نموذج أكبر بكثير وطلب حسابي أعلى، مما يجعل YOLOv10 الخيار الأكثر كفاءة وعملية لمجموعة واسعة من سيناريوهات النشر.
الخلاصة: لماذا YOLOv10 هو الخيار الموصى به
في حين أن كلاً من YOLOv10 و PP-YOLOE+ هما كاشفا كائنات قويان، يظهر YOLOv10 كخيار أفضل للغالبية العظمى من المطورين والباحثين. توفر بنيته الرائدة الخالية من NMS ميزة كبيرة في التطبيقات الواقعية عن طريق تقليل زمن الوصول وتبسيط خط أنابيب النشر.
تشمل المزايا الرئيسية لـ YOLOv10 ما يلي:
- كفاءة لا مثيل لها: يوفر موازنة أفضل بين السرعة والدقة، ويحقق نتائج mAP تنافسية مع عدد أقل بكثير من المعلمات وعمليات الفاصلة العائمة في الثانية (FLOPs) مقارنةً بـ PP-YOLOE+. وهذا يترجم إلى تكاليف حسابية أقل والقدرة على التشغيل على أجهزة أقل قوة.
- اكتشاف حقيقي وشامل: من خلال التخلص من عنق الزجاجة NMS، يكون YOLOv10 أسرع وأسهل في النشر، خاصة في البيئات الحساسة لوقت الاستجابة مثل الروبوتات والأنظمة المستقلة.
- تجربة مستخدم فائقة: يوفر YOLOv10، المدمج في نظام Ultralytics البيئي، سهولة استخدام لا مثيل لها، ووثائق شاملة، ودعم مجتمعي نشط، وتدريب مباشر وسير عمل للتصدير. هذا يقلل بشكل كبير من وقت وجهد التطوير.
PP-YOLOE+ هو مؤدٍ قوي من حيث الدقة الأولية ولكنه يقتصر إلى حد كبير على نظام PaddlePaddle البيئي. إن أحجام النماذج الأكبر واعتماد إطار العمل عليه يجعله خيارًا أقل مرونة وأكثر استهلاكًا للموارد مقارنة بـ YOLOv10 المحسن للغاية وسهل الاستخدام. بالنسبة للمشاريع التي تتطلب توازنًا بين الأداء العالي والكفاءة وسهولة التطوير، فإن YOLOv10 هو الفائز الواضح.
استكشف نماذج أخرى
بالنسبة للمهتمين باستكشاف نماذج أخرى حديثة، توفر Ultralytics مقارنات تفصيلية لمجموعة واسعة من architectures. ضع في اعتبارك الاطلاع على YOLOv8 لتعدد استخداماتها المثبت عبر مهام رؤية متعددة، أو تحقق من مقارناتنا مع نماذج مثل RT-DETR و YOLOv9 للعثور على الملاءمة المثالية لمشروعك.