التنقل في اكتشاف الكائنات: PP-YOLOE+ مقابل YOLOv6.0
توسع مجال الرؤية الحاسوبية في الوقت الفعلي بسرعة، مما أدى إلى ظهور بنى متخصصة للغاية ومُحسّنة لسيناريوهات نشر متنوعة. كثيرًا ما يقارن المطورون بين PP-YOLOE+ و YOLOv6.YOLOv6 عند إنشاء تطبيقات تتطلب توازنًا بين الإنتاجية العالية والدقة الموثوقة. جلب كلا النموذجين تحسينات كبيرة في البنية عند إصدارهما، مع التركيز على تحسين سرعات الاستدلال للتطبيقات الصناعية والتطبيقات المتطورة.
قبل الخوض في التفاصيل المعمارية المفصلة، استكشف الرسم البياني أدناه لتصور كيف تتفوق هذه النماذج على بعضها البعض من حيث السرعة والدقة.
PP-YOLOE+: نقاط القوة والضعف المعمارية
تم تطوير PP-YOLOE+ بواسطة PaddlePaddle وهو كاشف بارز بدون مرساة يعتمد على سابقيه لتقديم أداء قوي عبر متطلبات مختلفة الحجم.
- المؤلفون: مؤلفو PaddlePaddle
- المنظمة: بايدو
- التاريخ: 2022-04-02
- Arxiv:2203.16250
- جيت هاب:PaddlePaddle/PaddleDetection
أبرز ملامح الهيكلة
أدخل PP-YOLOE+ العديد من التحسينات الهامة على تصميم PP-YOLOE الأصلي. فهو يستفيد من شبكة CSPRepResNet القوية، التي توازن بكفاءة بين التكلفة الحسابية وقدرات استخراج الميزات. علاوة على ذلك، فإنه يدمج شبكة هرمية متقدمة للميزات (FPN) مقترنة بشبكة تجميع المسارات (PAN) لضمان دمج الميزات متعددة المستويات. ومن بين ميزاته البارزة ET-head (رأس فعال ومتوافق مع المهام)، الذي يحسن بشكل كبير التنسيق بين التصنيف والتحديد المكاني أثناء اكتشاف الكائنات.
بينما يحقق PP-YOLOE+ دقة متوسطة مذهلة (mAP)، فإن اعتماده على PaddlePaddle قد يمثل في بعض الأحيان منحنى تعلم حاد للباحثين المعتادين على سير العمل PyTorch. وقد يؤدي ذلك إلى تعقيد عملية نشر النموذج قليلاً عند استهداف أجهزة طرفية غير متجانسة تفتقر إلى دعم الاستدلال المباشر لـ Paddle.
سياق النشر
تم تحسين PP-YOLOE+ بشكل كبير للنشر ضمن مجموعة تقنيات Baidu، مما يجعله خيارًا ممتازًا إذا كانت بيئة الإنتاج الخاصة بك تعتمد بشكل كبير على أدوات الاستدلال Paddle.
YOLOv6.0: الإنتاجية الصناعية
أصدرت شركة Meituan Vision AI Department YOLOv6. YOLOv6 الذي تم تصميمه خصيصًا ليكون جهاز كشف الأجسام من الجيل التالي للاستخدامات الصناعية، مع إعطاء الأولوية للإنتاجية الضخمة على GPU .
- المؤلفون: تشوي لي، لولو لي، ييفي جينغ، وآخرون.
- المؤسسة:Meituan
- التاريخ: 2023-01-13
- أرخايف:2301.05586
- GitHub:meituan/YOLOv6
أبرز ملامح الهيكلة
يتميز YOLOv6.YOLOv6 ببنية أساسية EfficientRep مصممة خصيصًا لتعظيم الاستفادة من الأجهزة، لا سيما على NVIDIA التي تستخدم TensorRT. جلب التحديث v3.0 وحدة تسلسل ثنائية الاتجاه (BiC) إلى العنق، مما عزز الاحتفاظ بالميزات المكانية دون زيادة عدد المعلمات بشكل كبير. بالإضافة إلى ذلك، أدخل استراتيجية التدريب بمساعدة المثبت (AAT) التي تدمج مزايا الاستقرار القائم على المثبت أثناء تدريب النموذج مع الحفاظ على بنية سريعة وخالية من المثبت أثناء الاستدلال في الوقت الفعلي.
ومع ذلك، نظرًا لأن YOLOv6 مُحسّن بشكل كبير لبطاقات GPU من فئة الخوادم، فإن مكاسبه في زمن الاستجابة تتضاءل أحيانًا عند نشره على أجهزة طرفية مقيدة للغاية CPU. هذا التخصص يعني أنه يتفوق في بيئات مثل تحليلات الفيديو غير المتصلة بالإنترنت، ولكنه قد يتخلف عن النماذج المحسّنة ديناميكيًا على الأجهزة المحلية الأصغر حجمًا.
جدول مقارنة الأداء
يوضح الجدول التالي مقاييس الأداء الرئيسية، ويقارن بشكل مباشر بين مختلف متغيرات الحجم لكلتا البنيتين.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
حالات الاستخدام والتوصيات
يعتمد الاختيار بين PP-YOLOE+ وYOLOv6 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
متى تختار PP-YOLOE+
PP-YOLOE+ هو خيار قوي لـ:
- تكامل منظومة PaddlePaddle: المنظمات ذات البنية التحتية الحالية المبنية على إطار عمل وأدوات PaddlePaddle من Baidu.
- نشر Paddle Lite على الحوسبة الطرفية: النشر على أجهزة بنواة استدلال محسّنة للغاية خصيصًا لمحرك استدلال Paddle Lite أو Paddle.
- الكشف عالي الدقة من جانب الخادم: السيناريوهات التي تعطي الأولوية لأقصى دقة detect على خوادم GPU القوية حيث لا يمثل الاعتماد على الإطار مشكلة.
متى تختار YOLOv6
YOLOv6 في الحالات التالية:
- النشر الصناعي المدرك للأجهزة: سيناريوهات حيث يوفر تصميم النموذج المدرك للأجهزة وإعادة التكوين الفعالة أداءً محسنًا على أجهزة مستهدفة محددة.
- detect سريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الخام على GPU لمعالجة الفيديو في الوقت الفعلي في بيئات محكومة.
- تكامل نظام Meituan البيئي: الفرق التي تعمل بالفعل ضمن مكدس تقنية Meituan والبنية التحتية للنشر.
متى تختار Ultralytics YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:
- نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
- بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
- اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.
Ultralytics : تجاوز النماذج القديمة
بينما يقدم PP-YOLOE+ و YOLOv6. YOLOv6 حلولاً محددة الأهداف، يتطلب تطوير الذكاء الاصطناعي الحديث سير عمل متعدد الاستخدامات وفعال من حيث استخدام الذاكرة. وهنا توفر Ultralytics تجربة مطورين لا مثيل لها. باستخدام Python موحدة، يمكنك تدريب النماذج المتطورة والتحقق من صحتها ونشرها بسلاسة دون الحاجة إلى التكاليف الإضافية الهائلة للتكوين التي عادة ما توجد في مستودعات الأبحاث القديمة.
تدعم Ultralytics بشكل أساسي مجموعة واسعة من مهام الرؤية التي تتجاوز الكشف القياسي، بما في ذلك تجزئة الحالات، وتقدير الوضع، وتصنيف الصور، واستخراج الصندوق المحيط الموجه (OBB). علاوة على ذلك، فهي مُحسّنة للغاية لاستخدام ذاكرة أقل أثناء التدريب — وهو ما يتناقض تمامًا مع النماذج القائمة على المحولات مثل RT-DETR التي تتطلب عمومًا تخصيص مساحات كبيرة من GPU .
اكتشف YOLO26: المعيار الجديد
بالنسبة للمؤسسات التي تسعى إلى نشر أحدث نماذج الرؤية المتطورة، يعيد Ultralytics (الذي تم إصداره في يناير 2026) تعريف حدود الأداء. وهو يتفوق بشكل كبير على الأجيال السابقة بفضل العديد من الابتكارات الهامة:
- تصميم شامل خالٍ من NMS: استنادًا إلى مفاهيم من YOLOv10، يلغي YOLO26 تمامًا معالجة ما بعد التثبيط غير الأقصى (NMS). يضمن هذا النهج الشامل الأصيل استدلالًا يمكن التنبؤ به وبزمن انتقال منخفض للغاية، وهو أمر بالغ الأهمية لأنظمة السلامة في الوقت الفعلي.
- استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية (CPU): من خلال إزالة Distribution Focal Loss (DFL) من البنية، تم تحسين YOLO26 بشكل جذري للحوسبة الطرفية والبيئات التي تفتقر إلى تسريع GPU مخصص.
- مُحسِّن MuSGD: بدمج استقرار تدريب نماذج LLM في نماذج الرؤية، يتيح هذا المُحسِّن الهجين (المستوحى من Moonshot AI) تقاربًا سريعًا وجلسات تدريب مخصصة مستقرة للغاية.
- ProgLoss + STAL: تقدم صيغ الخسارة المتقدمة هذه تحسينات رائعة في التعرف على الأجسام الصغيرة، وهو أمر حيوي لتطبيقات مثل صور الطائرات بدون طيار الجوية وتحليل المشاهد المزدحمة.
تأمين خطوط الأنابيب الخاصة بك لمواجهة المستقبل
إذا كنت تعمل على إنشاء مشروع جديد اليوم، فإننا نوصي بشدة بتجاوز البنى القديمة واعتماد YOLO26. ففعالية ذاكرته وسرعته NMS تجعل من السهل بشكل كبير نقله إلى مرحلة الإنتاج.
تنفيذ سلس
يعد تدريب وتصدير أحدث النماذج باستخدام Python Ultralytics Python أمرًا في غاية البساطة. يوضح المثال التالي كيفية تدريب أحدث نموذج YOLO26 وتصديره إلى ONNX النشر السريع على الحافة:
from ultralytics import YOLO
# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a test image (NMS-free speed)
predict_results = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to ONNX format for edge deployment
model.export(format="onnx")
بالنسبة للفرق التي تعمل بشكل متكامل مع سير العمل القديم ولكنها تبحث عن الاستقرار الحديث، فإن استكشاف Ultralytics YOLO11 خطوة انتقالية ممتازة، حيث يوفر تنوعًا شاملاً في المهام مدعومًا Ultralytics الكامل.