التنقل في كشف الأجسام: PP-YOLOE+ مقابل YOLOv6-3.0
توسع مجال الرؤية الحاسوبية في الوقت الفعلي بسرعة كبيرة، مما أدى إلى ظهور معماريات متخصصة للغاية ومحسنة لسيناريوهات نشر متنوعة. غالبًا ما يقارن المطورون بين PP-YOLOE+ و YOLOv6-3.0 عند بناء تطبيقات تتطلب توازناً بين الإنتاجية العالية والدقة الموثوقة. لقد قدم كلا النموذجين تحسينات معمارية جوهرية عند إصدارهما، مع التركيز على تعزيز سرعات الاستدلال للتطبيقات الصناعية وتطبيقات الحافة.
قبل الغوص في التفاصيل المعمارية، استكشف الرسم البياني أدناه لتصور كيفية أداء هذه النماذج بالنسبة لبعضها البعض من حيث السرعة والدقة.
PP-YOLOE+: نقاط القوة والضعف المعمارية
تم تطوير PP-YOLOE+ بواسطة مؤلفي PaddlePaddle، وهو كاشف بدون مراسٍ بارز يبني على سابقاته لتقديم أداء قوي عبر متطلبات مقياس مختلفة.
- المؤلفون: مؤلفو PaddlePaddle
- المؤسسة: Baidu
- التاريخ: 2022-04-02
- Arxiv: 2203.16250
- GitHub: PaddlePaddle/PaddleDetection
أبرز ملامح البنية
قدم PP-YOLOE+ العديد من التحسينات الحاسمة على تصميم PP-YOLOE الأصلي. فهو يستفيد من العمود الفقري CSPRepResNet القوي، الذي يوازن بكفاءة بين التكلفة الحسابية وقدرات استخراج الميزات. علاوة على ذلك، فإنه يدمج شبكة هرمية للميزات (FPN) متقدمة مقترنة بشبكة تجميع المسارات (PAN) لضمان دمج الميزات متعددة المقاييس. إحدى ميزاته البارزة هي ET-head (رأس التجميع المعتمد على المهام بكفاءة)، والذي يحسن بشكل كبير تنسيق التصنيف والتوطين أثناء كشف الأجسام.
بينما يحقق PP-YOLOE+ متوسط دقة متوسط (mAP) مثير للإعجاب، فإن اعتماده على نظام PaddlePaddle البيئي يمكن أن يمثل أحيانًا منحنى تعلم حادًا للباحثين المعتادين على سير عمل PyTorch الأصلي. يمكن أن يؤدي هذا إلى تعقيد عملية نشر النموذج قليلاً عند استهداف أجهزة الحافة غير المتجانسة التي تفتقر إلى دعم استدلال Paddle المباشر.
تم تحسين PP-YOLOE+ بشكل كبير للنشر ضمن حزمة تقنيات Baidu، مما يجعله خيارًا ممتازًا إذا كانت بيئة الإنتاج الخاصة بك تعتمد بشكل كبير على أدوات استدلال Paddle.
YOLOv6-3.0: الإنتاجية الصناعية
تم إصدار YOLOv6-3.0 بواسطة قسم رؤية الذكاء الاصطناعي في Meituan، وقد تم تصميمه صراحة ليكون كاشف أجسام من الجيل التالي للتطبيقات الصناعية، مع إعطاء الأولوية للإنتاجية الهائلة على أجهزة GPU.
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, وآخرون.
- المؤسسة: Meituan
- التاريخ: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
أبرز ملامح البنية
يتميز YOLOv6-3.0 بعمود فقري EfficientRep مصمم خصيصًا لزيادة استخدام الأجهزة إلى أقصى حد، خاصة على وحدات معالجة الرسومات NVIDIA باستخدام TensorRT. جلب تحديث v3.0 وحدة ربط ثنائية الاتجاه (BiC) إلى الرقبة، مما يعزز الاحتفاظ بالميزات المكانية دون زيادة عدد المعلمات بشكل كبير. بالإضافة إلى ذلك، قدم استراتيجية تدريب مدعومة بالمراسي (AAT) تدمج فوائد الاستقرار المعتمد على المراسي أثناء تدريب النموذج مع الحفاظ على معمارية سريعة وبدون مراسٍ أثناء الاستدلال في الوقت الفعلي.
ومع ذلك، نظرًا لأن YOLOv6-3.0 محسن للغاية لوحدات معالجة الرسومات على مستوى الخادم، فإن مكاسب زمن الاستجابة تتضاءل أحيانًا عند نشره على أجهزة الحافة المقيدة بشدة والتي تعمل بوحدة المعالجة المركزية فقط. يعني هذا التخصص أنه يتفوق في بيئات مثل تحليل الفيديو دون اتصال بالإنترنت ولكنه قد يتخلف عن النماذج المحسنة ديناميكيًا على الأجهزة الأصغر والأكثر محلية.
جدول مقارنة الأداء
يوضح الجدول التالي مقاييس الأداء الرئيسية، مع مقارنة مباشرة لمتغيرات النطاق المختلفة لكلا المعماريين.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ملي ثانية) | السرعة T4 TensorRT10 (ملي ثانية) | المعلمات (مليون) | FLOPs (مليار) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
حالات الاستخدام والتوصيات
يعتمد الاختيار بين PP-YOLOE+ و YOLOv6 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
متى تختار PP-YOLOE+
يعتبر PP-YOLOE+ خياراً قوياً لـ:
- تكامل نظام PaddlePaddle البيئي: المنظمات ذات البنية التحتية الحالية المبنية على إطار عمل Baidu's PaddlePaddle والأدوات المرتبطة به.
- نشر حافة Paddle Lite: النشر على أجهزة تحتوي على نوى استدلال مُحسَّنة للغاية خصيصًا لمحرك Paddle Lite أو محرك استدلال Paddle.
- الكشف عالي الدقة من جانب الخادم: السيناريوهات التي تعطي الأولوية لأقصى دقة للكشف على خوادم GPU قوية حيث لا يمثل الاعتماد على إطار العمل مصدر قلق.
متى تختار YOLOv6
يوصى بـ YOLOv6 لـ:
- النشر المدرك للأجهزة الصناعية: السيناريوهات التي يوفر فيها التصميم المدرك للأجهزة وإعادة المعلمات الفعالة للنموذج أداءً محسناً على أجهزة مستهدفة محددة.
- الاكتشاف السريع أحادي المرحلة: التطبيقات التي تعطي الأولوية لسرعة الاستنتاج الخام على GPU لمعالجة الفيديو في الوقت الفعلي في بيئات محكومة.
- تكامل نظام Meituan البيئي: الفرق التي تعمل بالفعل ضمن كومة تقنيات Meituan وبنية النشر التحتية الخاصة بها.
متى تختار Ultralytics (YOLO26)
بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطورين:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استدلالاً ثابتاً ومنخفض التأخير دون تعقيد المعالجة اللاحقة لـ Non-Maximum Suppression.
- بيئات تعتمد فقط على CPU: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث توفر سرعة استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
ميزة Ultralytics: التقدم إلى ما بعد النماذج القديمة
بينما يقدم PP-YOLOE+ و YOLOv6-3.0 حلولًا مستهدفة، يتطلب تطوير الذكاء الاصطناعي الحديث تدفقات عمل متنوعة وفعالة في استخدام الذاكرة. وهنا توفر منصة Ultralytics تجربة مطور لا مثيل لها. من خلال واجهة برمجة تطبيقات Python موحدة، يمكنك تدريب النماذج المتطورة والتحقق منها ونشرها بسلاسة دون عبء التكوين الهائل الموجود عادةً في مستودعات الأبحاث القديمة.
Ultralytics models natively support a wide array of vision tasks beyond standard detection, including instance segmentation, pose estimation, image classification, and Oriented Bounding Box (OBB) extraction. Furthermore, they are highly optimized for lower memory usage during training—a stark contrast to transformer-based models like RT-DETR which generally demand massive GPU VRAM allocations.
اكتشف YOLO26: المعيار الجديد
للمؤسسات التي تتطلع إلى نشر أحدث نماذج الرؤية المتطورة، يعيد Ultralytics YOLO26 (الذي تم إصداره في يناير 2026) تعريف حدود الأداء. إنه يتفوق بشكل كبير على الأجيال القديمة بعدة ابتكارات حاسمة:
- End-to-End NMS-Free Design: Building on concepts from YOLOv10, YOLO26 completely eliminates Non-Maximum Suppression (NMS) post-processing. This natively end-to-end approach guarantees predictable, ultra-low latency inference, crucial for real-time safety systems.
- استدلال أسرع بوحدة المعالجة المركزية بنسبة تصل إلى 43%: من خلال إزالة خسارة بؤرة التوزيع (DFL) من المعمارية، تم تحسين YOLO26 جذريًا لحوسبة الحافة والبيئات التي تفتقر إلى تسريع وحدة معالجة الرسومات المخصصة.
- مُحسِّن MuSGD: من خلال دمج استقرار تدريب نماذج اللغة الكبيرة في نماذج الرؤية، يتيح هذا المُحسِّن الهجين (المستوحى من Moonshot AI) تقاربًا سريعًا وجلسات تدريب مخصصة مستقرة للغاية.
- ProgLoss + STAL: تقدم صياغات الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهي حيوية لتطبيقات مثل صور الطائرات بدون طيار وتحليل المشاهد المزدحمة.
إذا كنت تبني مشروعًا جديدًا اليوم، فنحن نوصي بشدة بتجاوز المعماريات القديمة واعتماد YOLO26. إن كفاءته في الذاكرة وسرعته الخالية من NMS تجعل من السهل جدًا شحنه إلى الإنتاج.
تنفيذ سلس
يعد تدريب وتصدير أحدث النماذج باستخدام حزمة Ultralytics Python بسيطًا بشكل ملحوظ. يوضح المثال التالي كيفية تدريب أحدث نموذج YOLO26 وتصديره إلى ONNX للنشر السريع على الحافة:
from ultralytics import YOLO
# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a test image (NMS-free speed)
predict_results = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to ONNX format for edge deployment
model.export(format="onnx")بالنسبة للفرق المندمجة بعمق في سير العمل القديم ولكنها تبحث عن استقرار حديث، فإن استكشاف Ultralytics YOLO11 هو أيضًا خطوة انتقالية ممتازة، حيث يوفر تنوعًا شاملاً في المهام مدعومًا بنظام Ultralytics البيئي الكامل.