PP-YOLOE+ مقابلYOLO: مقارنة تقنية شاملة
أدى التطور المستمر للرؤية الحاسوبية إلى ظهور مجموعة من البنى الهندسية المتخصصة للغاية لاكتشاف الأجسام في الوقت الفعلي. عند تقييم النماذج للتطبيقات الصناعية والبحثية، غالبًا ما يدخل في المناقشة إطاران بارزان من عام 2022: PP-YOLOE+ من Baidu و YOLO من Alibaba Group. دفع كلا النموذجين حدود الاكتشاف بدون مرساة من خلال إدخال هياكل أساسية جديدة واستراتيجيات متقدمة لتعيين العلامات وتقنيات متخصصة لدمج الميزات.
يقدم هذا الدليل تحليلاً تقنياً مفصلاً لـ PP-YOLOE+ وYOLO حيث يستكشف هياكلهما ومنهجيات التدريب ونقاط القوة في النشر. سنقوم أيضاً بمقارنة هذه الأطر مع الحلول الحديثة مثل Ultralytics لمساعدتك في اختيار الأداة المناسبة لقيود النشر الخاصة بك.
PP-YOLOE+: الكشف المحسن عن الأجسام الصناعية
تم تطوير PP-YOLOE+ ضمن نظام Baidu البيئي، وهو تحسين متكرر على PP-YOLOE الأصلي، تم تحسينه بشكل كبير لإطار عمل التعلم PaddlePaddle . وقد تم تصميمه لزيادة الدقة وسرعة الاستدلال على أجهزة الخادم، مما يجعله خيارًا قويًا للتفتيش الصناعي وتطبيقات البيع بالتجزئة الذكية.
الابتكارات المعمارية
يقدم PP-YOLOE+ العديد من التحسينات المعمارية لتحسين أجهزة الكشف السابقة الخالية من المثبتات:
- العمود الفقري CSPRepResNet: يستخدم هذا العمود الفقري بنية معمارية على غرار RepVGG مدمجة مع اتصالات التجزئة عبر المراحل (CSP)، مما يوفر توازنًا قويًا بين قدرة استخلاص الميزات وزمن استجابة الاستدلال.
- تعلم محاذاة المهام (TAL): يستخدم PP-YOLOE+ استراتيجية متقدمة لتخصيص التسميات الديناميكية التي تحاذي مهام التصنيف والانحدار أثناء التدريب، مما يقلل الفجوة بين أداء التدريب والاستدلال.
- رأس محاذاة المهام الفعال (ET-head): رأس كشف مبسط مصمم لمعالجة الميزات بسرعة دون التضحية بالدقة المكانية، وهو مفيد للغاية للحفاظ على مقاييس mAP عالية.
تفاصيل PP-YOLOE+:
- المؤلفون: PaddlePaddle Authors
- المنظمة: Baidu
- التاريخ: 2022-04-02
- Arxiv: 2203.16250
- GitHub: PaddlePaddle
- المستندات: وثائق PP-YOLOE+
DAMO-YOLO: البحث عن البنية العصبية على الأجهزة الطرفية
يتخذ DAMO-YOLO، الذي أنشأته أكاديمية علي بابا DAMO، نهجًا مختلفًا تمامًا. فبدلاً من تصميم العمود الفقري يدويًا، استخدم فريق البحث البحث عن البنية العصبية (NAS) لاكتشاف طوبولوجيا شبكات عالية الكفاءة مصممة خصيصًا لقيود زمن الاستجابة الصارمة.
الميزات الرئيسية وخطوات التدريب
يركز DAMO-YOLO على زمن الاستجابة المنخفض والدقة العالية من خلال منهجية آلية تعتمد بشكل كبير على التقطير:
- أعمدة MAE-NAS الفقرية: من خلال استخدام طريقة أتمتة البحث الفعال عن بنية الشبكة العصبية، يقوم DAMO-YOLO ببناء أعمدة فقرية مُحسّنة خصيصًا للموازنة بين المعلمات والدقة.
- RepGFPN الفعال: شبكة هرمية للميزات المعممة (Generalized Feature Pyramid Network) مُعاد تحديد معاملاتها تتيح دمج ميزات قوي متعدد المقاييس، مما يساعد النموذج على detect الكائنات ذات الأحجام المختلفة بشكل كبير في إطار واحد.
- ZeroHead Design: رأس detect مبسط للغاية يقلل بشكل كبير من الحمل الحسابي أثناء مرحلة الاستدلال (inference).
- تحسين التقطير: لتعزيز أداء النماذج الأصغر، يعتمد DAMO-YOLO بشكل كبير على عملية تقطير معرفي معقدة حيث يوجه نموذج معلم أكبر نموذج الطالب.
تفاصيل DAMO-YOLO:
- المؤلفون: شيانزه شو، ييتشي جيانغ، ويهوا تشن، ييلون هوانغ، يوان تشانغ، وشيويو صن
- المنظمة: مجموعة علي بابا
- التاريخ: 2022-11-23
- Arxiv: 2211.15444v2
- GitHub: YOLO
- المستندات: YOLO
تقييد الإطار
على الرغم من أن كلا من PP-YOLOE+ وYOLO ابتكارات نظرية قوية، إلا أنهما مرتبطان ارتباطًا وثيقًا بأطر العمل الخاصة بهما (PaddlePaddle Alibaba المحددة). وقد يؤدي ذلك إلى حدوث احتكاك عند محاولة نقل هذه النماذج إلى عمليات نشر قياسية على السحابة أو الحافة.
تحليل الأداء
عند تقييم هذه النماذج، فإن المفاضلة بين زمن الاستجابة والتعقيد الحسابي (FLOPs) ومتوسط الدقة (mAP) تحدد بيئة النشر المثالية لها.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
يحقق DAMO-YOLO عمومًا زمن استجابة أقل لـ TensorRT على المقاييس النانوية والصغيرة، مما يجعله منافسًا قويًا لتدفقات الفيديو عالية الإنتاجية. ومع ذلك، يتوسع PP-YOLOE+ بشكل لا يصدق إلى حجمه الكبير جدًا (x) نسخة، تحقق دقة عالية المستوى للصور المعقدة حيث يكون وقت الاستدلال اعتبارًا ثانويًا.
Ultralytics : التقدم إلى ما بعد هياكل 2022
في حين أن PP-YOLOE+ وYOLO إنجازين هامين، إلا أن التطورات الحديثة تتطلب تنوعًا أكبر، وعمليات تدريب أسهل، ومتطلبات ذاكرة أقل. تلبي Ultralytics هذه الاحتياجات من خلال توفير تجربة خالية من الاحتكاك تتفوق بشكل كبير على عمليات التقطير المعقدة والإعدادات الخاصة بالإطار التي تتطلبها النماذج القديمة.
بالنسبة للمطورين الذين يسعون إلى تحقيق أفضل توازن في الأداء اليوم، يوفر Ultralytics قفزة ثورية إلى الأمام في كفاءة النشر في العالم الواقعي.
لماذا YOLO26 رائدة في هذا المجال
صدر YOLO26 في أوائل عام 2026، وهو يستند إلى إرث YOLO11 من خلال تقديم تقنيات متطورة مصممة خصيصًا للإنتاج:
- تصميم شامل خالٍ من NMS: يلغي YOLO26 المعالجة اللاحقة لقمع غير الأقصى (NMS). وهذا يترجم إلى منطق نشر أبسط وأزمنة انتقال استدلال متسقة ويمكن التنبؤ بها بدرجة عالية.
- مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة، يستخدم YOLO26 مُحسِّن MuSGD هجينًا. يضمن هذا تدريبًا مستقرًا بشكل لا يصدق وتقاربًا سريعًا، مما يوفر ساعات GPU ثمينة.
- استدلال فائق على وحدة المعالجة المركزية (CPU): عن طريق إزالة دالة الخسارة البؤرية التوزيعية (DFL) وتحسين الرسم البياني للشبكة، يحقق YOLO26 استدلالًا أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU)، مما يجعله الخيار الأول لأجهزة الذكاء الاصطناعي الطرفية.
- ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات رائعة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لـعمليات الطائرات بدون طيار والاستشعار عن بعد.
- تعدد استخدامات لا مثيل له: على عكس PP-YOLOE+ الذي يركز بشكل صارم على detection، يدعم YOLO26 بشكل أصيل تقدير الوضعيات، وتجزئة الكائنات (instance segmentation)، وتصنيف الصور، والصناديق المحيطة الموجهة (OBB) بسلاسة.
سهولة الاستخدام وكفاءة التدريب
يتطلب تدريبYOLO إدارة خط أنابيب تقطير معلم-طالب ثقيل. في المقابل، يتطلب تدريب Ultralytics بضع أسطر فقط من Python، مع استخدام CUDA ضئيل مقارنة بالبنى المنافسة.
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model with native MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run an end-to-end NMS-free inference
results = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")
حالات الاستخدام المثالية والتوصيات
يعتمد اختيار بنية الرؤية الحاسوبية المثلى بشكل كبير على أهداف تكامل ونشر النظام البيئي لفريقك.
- اختر PP-YOLOE+ إذا كان مسار عملك بالكامل مدمجًا بعمق في نظام Baidu PaddlePaddle البيئي. يظل خيارًا ممتازًا لتحليل الصور الثابتة على الخوادم القوية حيث يكون تحقيق أقصى قدر من الدقة هو الهدف الأساسي.
- اختر DAMO-YOLO إذا كنت تجري بحثًا محددًا في خوارزميات البحث عن البنية العصبية، أو إذا كانت لديك الموارد الهندسية للحفاظ على مسارات عمل التقطير المعقدة لتحقيق أهداف زمن استجابة TensorRT الصارمة.
- اختر Ultralytics YOLO26 لجميع سيناريوهات الإنتاج الحديثة تقريبًا. يوفر نظام Ultralytics البيئي وثائق لا مثيل لها، ومتطلبات ذاكرة أقل، وواجهة برمجة تطبيقات مبسطة. سواء كنت تبني أنظمة مراقبة الجودة الآلية أو تشغل track في الوقت الفعلي على Raspberry Pi، فإن معمارية YOLO26 الخالية من NMS تضمن نتائج سريعة ومستقرة وعالية الدقة فور الاستخدام.
بالنسبة للمطورين الذين يستكشفون حلولاً أخرى متطورة، توفر Ultralytics أيضًا موارد شاملة حول YOLOv8 و YOLO11، مما يضمن حصولك على النموذج المناسب لأي تحدٍ في مجال الرؤية الحاسوبية.