التنقل في اكتشاف الكائنات: PP-YOLOE+ مقابل YOLOv6.0
توسع مجال الرؤية الحاسوبية في الوقت الفعلي بسرعة، مما أدى إلى ظهور بنى متخصصة للغاية ومُحسّنة لسيناريوهات نشر متنوعة. كثيرًا ما يقارن المطورون بين PP-YOLOE+ و YOLOv6.YOLOv6 عند إنشاء تطبيقات تتطلب توازنًا بين الإنتاجية العالية والدقة الموثوقة. جلب كلا النموذجين تحسينات كبيرة في البنية عند إصدارهما، مع التركيز على تحسين سرعات الاستدلال للتطبيقات الصناعية والتطبيقات المتطورة.
قبل الخوض في التفاصيل المعمارية، استكشف الرسم البياني أدناه لتصور أداء هذه النماذج مقارنة ببعضها البعض من حيث السرعة والدقة.
PP-YOLOE+: نقاط القوة والضعف المعمارية
تم تطوير PP-YOLOE+ بواسطة PaddlePaddle وهو كاشف بارز بدون مرساة يعتمد على سابقيه لتقديم أداء قوي عبر متطلبات مختلفة الحجم.
- المؤلفون: مؤلفو PaddlePaddle
- المنظمة: بايدو
- التاريخ: 2022-04-02
- Arxiv:2203.16250
- جيت هاب:PaddlePaddle/PaddleDetection
أبرز ملامح الهيكلة
أدخل PP-YOLOE+ العديد من التحسينات الهامة على تصميم PP-YOLOE الأصلي. فهو يستفيد من شبكة CSPRepResNet القوية، التي توازن بكفاءة بين التكلفة الحسابية وقدرات استخراج الميزات. علاوة على ذلك، فإنه يدمج شبكة هرمية متقدمة للميزات (FPN) مقترنة بشبكة تجميع المسارات (PAN) لضمان دمج الميزات متعددة المستويات. ومن بين ميزاته البارزة ET-head (رأس فعال ومتوافق مع المهام)، الذي يحسن بشكل كبير التنسيق بين التصنيف والتحديد المكاني أثناء اكتشاف الكائنات.
بينما يحقق PP-YOLOE+ دقة متوسطة مذهلة (mAP)، فإن اعتماده على PaddlePaddle قد يمثل في بعض الأحيان منحنى تعلم حاد للباحثين المعتادين على سير العمل PyTorch. وقد يؤدي ذلك إلى تعقيد عملية نشر النموذج قليلاً عند استهداف أجهزة طرفية غير متجانسة تفتقر إلى دعم الاستدلال المباشر لـ Paddle.
سياق النشر
تم تحسين PP-YOLOE+ بشكل كبير للنشر ضمن مجموعة تقنيات Baidu، مما يجعله خيارًا ممتازًا إذا كانت بيئة الإنتاج الخاصة بك تعتمد بشكل كبير على أدوات الاستدلال Paddle.
YOLOv6.0: الإنتاجية الصناعية
أصدرت شركة Meituan Vision AI Department YOLOv6. YOLOv6 الذي تم تصميمه خصيصًا ليكون جهاز كشف الأجسام من الجيل التالي للاستخدامات الصناعية، مع إعطاء الأولوية للإنتاجية الضخمة على GPU .
- المؤلفون: تشوي لي، لولو لي، ييفي جينغ، وآخرون.
- المؤسسة:Meituan
- التاريخ: 2023-01-13
- أرخايف:2301.05586
- GitHub:meituan/YOLOv6
أبرز ملامح الهيكلة
يتميز YOLOv6.YOLOv6 ببنية أساسية EfficientRep مصممة خصيصًا لتعظيم الاستفادة من الأجهزة، لا سيما على NVIDIA التي تستخدم TensorRT. جلب التحديث v3.0 وحدة تسلسل ثنائية الاتجاه (BiC) إلى العنق، مما عزز الاحتفاظ بالميزات المكانية دون زيادة عدد المعلمات بشكل كبير. بالإضافة إلى ذلك، أدخل استراتيجية التدريب بمساعدة المثبت (AAT) التي تدمج مزايا الاستقرار القائم على المثبت أثناء تدريب النموذج مع الحفاظ على بنية سريعة وخالية من المثبت أثناء الاستدلال في الوقت الفعلي.
ومع ذلك، نظرًا لأن YOLOv6 مُحسّن بشكل كبير لبطاقات GPU من فئة الخوادم، فإن مكاسبه في زمن الاستجابة تتضاءل أحيانًا عند نشره على أجهزة طرفية مقيدة للغاية CPU. هذا التخصص يعني أنه يتفوق في بيئات مثل تحليلات الفيديو غير المتصلة بالإنترنت، ولكنه قد يتخلف عن النماذج المحسّنة ديناميكيًا على الأجهزة المحلية الأصغر حجمًا.
جدول مقارنة الأداء
يوضح الجدول التالي مقاييس الأداء الرئيسية، ويقارن بشكل مباشر بين مختلف متغيرات الحجم لكلتا البنيتين.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
حالات الاستخدام والتوصيات
YOLOv6 الاختيار بين PP-YOLOE+ و YOLOv6 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
متى تختار PP-YOLOE+
PP-YOLOE+ هو خيار قوي لـ:
- تكاملPaddlePaddle : المؤسسات التي تمتلك بنية تحتية قائمة مبنية على إطار عمل وأدوات PaddlePaddle من Baidu.
- نشر Paddle Lite Edge: النشر على الأجهزة باستخدام نوى استدلال محسّنة للغاية خصيصًا لمحرك الاستدلال Paddle Lite أو Paddle.
- الكشف عالي الدقة من جانب الخادم: سيناريوهات تعطي الأولوية لأقصى دقة في الكشف على GPU قوية حيث لا تشكل تبعية إطار العمل مشكلة.
متى تختار YOLOv6
YOLOv6 في الحالات التالية:
- النشر الصناعي المراعي للأجهزة: سيناريوهات يوفر فيها تصميم النموذج المراعي للأجهزة وإعادة تحديد المعلمات بكفاءة أداءً محسّنًا على أجهزة مستهدفة محددة.
- الكشف السريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الأولي على GPU الفيديو في الوقت الفعلي في البيئات الخاضعة للرقابة.
- تكامل نظام Meituan البيئي: فرق تعمل بالفعل ضمن مجموعة تقنيات Meituan وبنيتها التحتية للنشر.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
- كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.
Ultralytics : تجاوز النماذج القديمة
بينما يقدم PP-YOLOE+ و YOLOv6. YOLOv6 حلولاً محددة الأهداف، يتطلب تطوير الذكاء الاصطناعي الحديث سير عمل متعدد الاستخدامات وفعال من حيث استخدام الذاكرة. وهنا توفر Ultralytics تجربة مطورين لا مثيل لها. باستخدام Python موحدة، يمكنك تدريب النماذج المتطورة والتحقق من صحتها ونشرها بسلاسة دون الحاجة إلى التكاليف الإضافية الهائلة للتكوين التي عادة ما توجد في مستودعات الأبحاث القديمة.
تدعم Ultralytics بشكل أساسي مجموعة واسعة من مهام الرؤية التي تتجاوز الكشف القياسي، بما في ذلك تجزئة الحالات، وتقدير الوضع، وتصنيف الصور، واستخراج الصندوق المحيط الموجه (OBB). علاوة على ذلك، فهي مُحسّنة للغاية لاستخدام ذاكرة أقل أثناء التدريب — وهو ما يتناقض تمامًا مع النماذج القائمة على المحولات مثل RT-DETR التي تتطلب عمومًا تخصيص مساحات كبيرة من GPU .
اكتشف YOLO26: المعيار الجديد
بالنسبة للمؤسسات التي تسعى إلى نشر أحدث نماذج الرؤية المتطورة، يعيد Ultralytics (الذي تم إصداره في يناير 2026) تعريف حدود الأداء. وهو يتفوق بشكل كبير على الأجيال السابقة بفضل العديد من الابتكارات الهامة:
- تصميم شامل NMS: بناءً على مفاهيم من YOLOv10، يلغي YOLO26 تمامًا المعالجة اللاحقة لـ Non-Maximum Suppression (NMS). يضمن هذا النهج الشامل الأصلي استنتاجًا متوقعًا وذو زمن انتقال منخفض للغاية، وهو أمر بالغ الأهمية لأنظمة السلامة في الوقت الفعلي.
- CPU أسرع بنسبة تصل إلى 43٪ CPU : من خلال إزالة Distribution Focal Loss (DFL) من البنية، تم تحسين YOLO26 بشكل جذري للحوسبة الطرفية والبيئات التي تفتقر إلى GPU مخصص.
- MuSGD Optimizer: من خلال دمج استقرار تدريب LLM في نماذج الرؤية، يتيح هذا المحسن الهجين (المستوحى من Moonshot AI) تقاربًا سريعًا وجلسات تدريب مخصصة عالية الاستقرار.
- ProgLoss + STAL: توفر هذه الصيغ المتقدمة للخسارة تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر حيوي لتطبيقات مثل التصوير الجوي بالطائرات بدون طيار وتحليل المشاهد المزدحمة.
تأمين خطوط الأنابيب الخاصة بك لمواجهة المستقبل
إذا كنت تعمل على إنشاء مشروع جديد اليوم، فإننا نوصي بشدة بتجاوز البنى القديمة واعتماد YOLO26. ففعالية ذاكرته وسرعته NMS تجعل من السهل بشكل كبير نقله إلى مرحلة الإنتاج.
تنفيذ سلس
يعد تدريب وتصدير أحدث النماذج باستخدام Python Ultralytics Python أمرًا في غاية البساطة. يوضح المثال التالي كيفية تدريب أحدث نموذج YOLO26 وتصديره إلى ONNX النشر السريع على الحافة:
from ultralytics import YOLO
# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a test image (NMS-free speed)
predict_results = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to ONNX format for edge deployment
model.export(format="onnx")
بالنسبة للفرق التي تعمل بشكل متكامل مع سير العمل القديم ولكنها تبحث عن الاستقرار الحديث، فإن استكشاف Ultralytics YOLO11 خطوة انتقالية ممتازة، حيث يوفر تنوعًا شاملاً في المهام مدعومًا Ultralytics الكامل.