PP-YOLOE+ مقابلYOLO: مقارنة تقنية شاملة
أدى التطور المستمر للرؤية الحاسوبية إلى ظهور مجموعة من البنى الهندسية المتخصصة للغاية لاكتشاف الأجسام في الوقت الفعلي. عند تقييم النماذج للتطبيقات الصناعية والبحثية، غالبًا ما يدخل في المناقشة إطاران بارزان من عام 2022: PP-YOLOE+ من Baidu و YOLO من Alibaba Group. دفع كلا النموذجين حدود الاكتشاف بدون مرساة من خلال إدخال هياكل أساسية جديدة واستراتيجيات متقدمة لتعيين العلامات وتقنيات متخصصة لدمج الميزات.
يقدم هذا الدليل تحليلاً تقنياً مفصلاً لـ PP-YOLOE+ وYOLO حيث يستكشف هياكلهما ومنهجيات التدريب ونقاط القوة في النشر. سنقوم أيضاً بمقارنة هذه الأطر مع الحلول الحديثة مثل Ultralytics لمساعدتك في اختيار الأداة المناسبة لقيود النشر الخاصة بك.
PP-YOLOE+: الكشف المحسن عن الأجسام الصناعية
تم تطوير PP-YOLOE+ ضمن نظام Baidu البيئي، وهو تحسين متكرر على PP-YOLOE الأصلي، تم تحسينه بشكل كبير لإطار عمل التعلم PaddlePaddle . وقد تم تصميمه لزيادة الدقة وسرعة الاستدلال على أجهزة الخادم، مما يجعله خيارًا قويًا للتفتيش الصناعي وتطبيقات البيع بالتجزئة الذكية.
الابتكارات المعمارية
يقدم PP-YOLOE+ العديد من التحسينات المعمارية لتحسين أجهزة الكشف السابقة الخالية من المثبتات:
- الهيكل الأساسي CSPRepResNet: يستخدم هذا الهيكل الأساسي بنية على غرار RepVGG مقترنة بوصلات Cross Stage Partial (CSP)، مما يوفر توازنًا قويًا بين قدرة استخراج الميزات وزمن الاستدلال.
- تعلم مواءمة المهام (TAL): يستخدم PP-YOLOE+ استراتيجية متقدمة لتعيين العلامات الديناميكية التي تعمل على مواءمة مهام التصنيف والانحدار أثناء التدريب، مما يقلل الفجوة بين أداء التدريب والاستدلال.
- رأس فعال ومتوافق مع المهام (ET-head): رأس كشف مبسط مصمم لمعالجة الميزات بسرعة دون التضحية بالدقة المكانية، وهو أمر مفيد للغاية للحفاظ على mAP عالية.
تفاصيل PP-YOLOE+:
- المؤلفون: PaddlePaddle Authors
- المنظمة: Baidu
- التاريخ: 2022-04-02
- Arxiv: 2203.16250
- GitHub: PaddlePaddle
- المستندات: وثائق PP-YOLOE+
YOLO: البحث عن البنية العصبية في الحافة
تم إنشاءYOLO بواسطة أكاديمية Alibaba DAMO،YOLO نهجًا مختلفًا تمامًا. فبدلاً من تصميم الهيكل الأساسي يدويًا، استخدم فريق البحث تقنية البحث عن البنية العصبية (NAS) لاكتشاف توبولوجيات شبكات عالية الكفاءة مصممة خصيصًا لتلبية قيود زمن الوصول الصارمة.
الميزات الرئيسية وخطوات التدريب
YOLO انخفاض زمن الاستجابة والدقة العالية من خلال منهجية آلية تعتمد بشكل كبير على التقطير:
- البنى الأساسية MAE-NAS: من خلال استخدام طريقة البحث الآلي عن البنية العصبية الفعالة (Method of Automating Efficient Neural Architecture Search)،YOLO بنى أساسية مُحسّنة خصيصًا لتحقيق التوازن بين المعلمات والدقة.
- RepGFPN الفعال: شبكة هرمية عامة للميزات مع إعادة تحديد المعلمات تتيح دمجًا قويًا للميزات متعددة المستويات، مما يساعد النموذج detect ذات أحجام مختلفة جدًا في إطار واحد.
- تصميم ZeroHead: رأس كشف مبسط للغاية يقلل بشكل كبير من العبء الحسابي خلال مرحلة الاستدلال.
- تحسين التقطير: لتعزيز أداء المتغيرات الأصغر حجماً،YOLO بشكل كبير على عملية تقطير معرفية معقدة حيث يوجه نموذج المعلم الأكبر حجماً نموذج التلميذ.
تفاصيل DAMO-YOLO:
- المؤلفون: شيانزه شو، ييكي جيانغ، ويهوا تشين، ييلون هوانغ، يوان تشانغ، وشيويو سون
- المنظمة: مجموعة علي بابا
- التاريخ: 2022-11-23
- Arxiv: 2211.15444v2
- GitHub: YOLO
- المستندات: YOLO
تقييد الإطار
على الرغم من أن كلا من PP-YOLOE+ وYOLO ابتكارات نظرية قوية، إلا أنهما مرتبطان ارتباطًا وثيقًا بأطر العمل الخاصة بهما (PaddlePaddle Alibaba المحددة). وقد يؤدي ذلك إلى حدوث احتكاك عند محاولة نقل هذه النماذج إلى عمليات نشر قياسية على السحابة أو الحافة.
تحليل الأداء
عند تقييم هذه النماذج، فإن المفاضلة بين زمن الاستجابة والتعقيد الحسابي (FLOPs) ومتوسط الدقة (mAP) تحدد بيئة النشر المثالية لها.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
يحققYOLO TensorRT أقل TensorRT على المستويين النانوي والصغير، مما يجعله منافسًا قويًا في مجال تدفقات الفيديو عالية الإنتاجية. ومع ذلك، فإن PP-YOLOE+ يتكيف بشكل مذهل مع المستويات الكبيرة جدًا (x)، محققة دقة عالية المستوى للصور المعقدة حيث يكون وقت الاستدلال أمراً ثانوياً.
Ultralytics : التقدم إلى ما بعد هياكل 2022
في حين أن PP-YOLOE+ وYOLO إنجازين هامين، إلا أن التطورات الحديثة تتطلب تنوعًا أكبر، وعمليات تدريب أسهل، ومتطلبات ذاكرة أقل. تلبي Ultralytics هذه الاحتياجات من خلال توفير تجربة خالية من الاحتكاك تتفوق بشكل كبير على عمليات التقطير المعقدة والإعدادات الخاصة بالإطار التي تتطلبها النماذج القديمة.
بالنسبة للمطورين الذين يسعون إلى تحقيق أفضل توازن في الأداء اليوم، يوفر Ultralytics قفزة ثورية إلى الأمام في كفاءة النشر في العالم الواقعي.
لماذا YOLO26 رائدة في هذا المجال
صدر YOLO26 في أوائل عام 2026، وهو يستند إلى إرث YOLO11 من خلال تقديم تقنيات متطورة مصممة خصيصًا للإنتاج:
- تصميم NMS من البداية إلى النهاية: يزيل YOLO26 المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). وهذا يترجم إلى منطق نشر أبسط ووقت استدلال متسق ويمكن التنبؤ به بدرجة عالية.
- مُحسّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة، يستخدم YOLO26 مُحسّن MuSGD هجين. وهذا يضمن تدريبًا مستقرًا للغاية وتقاربًا سريعًا، مما يوفر GPU قيّمة.
- CPU فائق: من خلال إزالة Distribution Focal Loss (DFL) وتحسين الرسم البياني للشبكة، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪، مما يجعله الخيار الأول لأجهزة الذكاء الاصطناعي المتطورة.
- ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لعمليات الطائرات بدون طيار والاستشعار عن بعد.
- تنوع لا مثيل له: على عكس PP-YOLOE+ الذي يركز بشكل صارم على الكشف، يدعم YOLO26 بشكل أساسي تقدير الوضع، وتجزئة المثيلات، وتصنيف الصور، والمربعات المحددة الموجهة (OBB) بسلاسة.
سهولة الاستخدام وكفاءة التدريب
يتطلب تدريبYOLO إدارة خط أنابيب تقطير معلم-طالب ثقيل. في المقابل، يتطلب تدريب Ultralytics بضع أسطر فقط من Python، مع استخدام CUDA ضئيل مقارنة بالبنى المنافسة.
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model with native MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run an end-to-end NMS-free inference
results = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")
حالات الاستخدام المثالية والتوصيات
يعتمد اختيار بنية الرؤية الحاسوبية المثلى بشكل كبير على أهداف تكامل ونشر النظام البيئي لفريقك.
- اختر PP-YOLOE+ إذا كان خط الأنابيب بالكامل مدمجًا بعمق في نظام Baidu PaddlePaddle . يظل هذا الخيار ممتازًا لتحليل الصور الثابتة على خوادم قوية حيث يكون الهدف الأساسي هو تحقيق أقصى دقة ممكنة.
- اخترYOLO إذا كنت تجري بحثًا محددًا في خوارزميات البحث عن البنية العصبية، أو إذا كان لديك الموارد الهندسية اللازمة لصيانة خطوط إنتاج التقطير المعقدة لتحقيق أهداف TensorRT الطموحة.
- اختر Ultralytics لجميع سيناريوهات الإنتاج الحديثة تقريبًا. يوفر Ultralytics بيئة عمل لا مثيل لها، ومتطلبات ذاكرة أقل، وواجهة برمجة تطبيقات مبسطة. سواء كنت تقوم ببناء أنظمة مراقبة جودة آلية أو تشغيل تتبع في الوقت الفعلي على Raspberry Pi، تضمن بنية YOLO26 NMS نتائج سريعة ومستقرة وعالية الدقة فور تشغيلها.
بالنسبة للمطورين الذين يستكشفون حلولاً أخرى متطورة، توفر Ultralytics أيضًا موارد شاملة حول YOLOv8 و YOLO11، مما يضمن حصولك على النموذج المناسب لأي تحدٍ في مجال الرؤية الحاسوبية.