Link to this sectionمقارنة بين YOLOv6-3.0 و PP-YOLOE+#
عند اختيار إطار عمل لـ كشف الكائنات في الوقت الفعلي، يقوم مهندسو تعلم الآلة غالبًا بتقييم مجموعة متنوعة من المعماريات عالية الأداء. ومن بين النماذج البارزة في مجال التطبيقات الصناعية نجد YOLOv6-3.0 و PP-YOLOE+. لقد دفع كلا النموذجين حدود الدقة والسرعة، ومع ذلك، فقد تم تصميمهما ليناسبا بيئات عمل وأجهزة نشر مختلفة قليلاً.
تقدم هذه المقارنة التقنية نظرة متعمقة على معمارياتها، ومقاييس أدائها، ومنهجيات تدريبها، مع تقديم بدائل حديثة مثل Ultralytics YOLO26 التي توفر تنوعًا فائقًا وسهولة في الاستخدام.
Link to this sectionYOLOv6-3.0: محرك صناعي عالي الإنتاجية#
تم تطوير YOLOv6-3.0 بواسطة قسم Vision AI في Meituan، وهو مُحسَّن بشكل كبير للبيئات الصناعية، خاصة تلك التي تستفيد من وحدات معالجة الرسومات (GPUs) القوية المخصصة للخوادم.
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
- المنظمة: Meituan
- التاريخ: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
Link to this sectionالابتكارات المعمارية#
يستخدم YOLOv6-3.0 هيكل EfficientRep، المصمم خصيصًا لزيادة الاستفادة من مسرعات الأجهزة مثل وحدات معالجة الرسومات NVIDIA. تقدم المعمارية وحدة الربط ثنائي الاتجاه (BiC) داخل العنق، مما يحسن بشكل كبير دمج الميزات متعددة النطاقات. علاوة على ذلك، فهي تتضمن استراتيجية التدريب المدعوم بالمرساة (AAT). يتمتع هذا النهج الهجين بخصائص تقارب قوية لـ الشبكات القائمة على المراسي أثناء مرحلة التدريب، مع التخلص من المراسي أثناء الاستنتاج للحفاظ على السرعة العالية التي تميز النماذج الخالية من المراسي.
Link to this sectionPP-YOLOE+: بطل الكشف في PaddlePaddle#
PP-YOLOE+ هو تطور لسلسلة PP-YOLO، تم تطويره بالكامل ضمن إطار عمل PaddlePaddle بواسطة باحثين في Baidu. يتفوق هذا النموذج في البيئات التي يكون فيها نظام Paddle البيئي مُرسخًا بالفعل.
- المؤلفون: مؤلفو PaddlePaddle
- المؤسسة: Baidu
- التاريخ: 2022-04-02
- Arxiv: 2203.16250
- GitHub: PaddlePaddle/PaddleDetection
Link to this sectionالابتكارات المعمارية#
PP-YOLOE+ هو كاشف خالٍ من المراسي (anchor-free) يقدم استراتيجية تعيين تسميات ديناميكية تُعرف بـ TAL (تعلم محاذاة المهام). يستخدم هيكل CSPRepResNet، الذي يلتقط الميزات الدلالية بكفاءة مع الحفاظ على الكفاءة الحسابية. تم تحسين النموذج بدرجة عالية للنشر عبر TensorRT و OpenVINO، مما يجعله منافسًا قويًا لنشر النماذج على الحافة والخوادم، بشرط أن يكون المستخدم مرتاحًا للتعامل مع واجهة برمجة تطبيقات PaddlePaddle.
على الرغم من أن PP-YOLOE+ يقدم نتائج ممتازة، إلا أن اعتماده على PaddlePaddle قد يشكل منحنى تعلم للمهندسين المعتادين على PyTorch. استخدام إطار عمل موحد مثل Ultralytics يمكن أن يقلل بشكل كبير من وقت الإعداد.
Link to this sectionمقارنة الأداء#
يتطلب تقييم هذه النماذج النظر في توازنها بين متوسط دقة الكشف (mAP) وسرعة الاستنتاج. يسلط الجدول أدناه الضوء على أدائها في مجموعة بيانات التحقق COCO.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
بينما يظهر كلا النموذجين أداءً قويًا، يحتفظ YOLOv6-3.0 عمومًا بتفوق طفيف في سرعة TensorRT الخام عند أحجام النماذج الأصغر، مما يجعله فعالًا للغاية لعمليات الدفع الآلي عالية السرعة أو اكتشاف عيوب التصنيع. على العكس من ذلك، يتوسع PP-YOLOE+ جيدًا مع زيادة عدد المعلمات لتحقيق أقصى قدر من الدقة.
Link to this sectionميزة Ultralytics: تقديم YOLO26#
بينما يتمتع كل من YOLOv6-3.0 و PP-YOLOE+ بقدرات عالية، فإن التطور السريع لـ رؤية الحاسوب يتطلب معماريات لا توفر السرعة الخام فحسب، بل توفر أيضًا سهولة استثنائية في الاستخدام، ومتطلبات ذاكرة أقل، ونظامًا بيئيًا موحدًا. هنا تأتي نماذج Ultralytics YOLO، وخاصة YOLO11 و YOLO26 المتطور، لإعادة تعريف أحدث ما توصلت إليه التكنولوجيا.
تم إطلاق YOLO26 في يناير 2026، وهو يضع معيارًا جديدًا للذكاء الاصطناعي البصري الموجه للحافة والسحاب، موفرًا مزايا كبيرة مقارنة بالنماذج القديمة:
- تصميم من طرف إلى طرف خالٍ من NMS: بناءً على الأسس التي وضعها YOLOv10، يلغي YOLO26 محليًا خاصية كبت غير الأقصى (NMS) أثناء المعالجة اللاحقة. هذا يبسط بشكل كبير منطق النشر ويقلل من تباين زمن الاستجابة في المشاهد المزدحمة.
- سرعة استنتاج على CPU أسرع بنسبة تصل إلى 43%: من خلال إزالة توزيع فقدان التركيز (DFL) بشكل استراتيجي، يسرع YOLO26 أداء وحدة المعالجة المركزية (CPU) بشكل جذري، مما يجعله متفوقًا بشكل كبير على YOLOv6 أو PP-YOLOE+ لأجهزة إنترنت الأشياء (IoT) والتطبيقات المحمولة.
- مُحسِّن MuSGD: مستوحى من تقنيات تدريب النماذج اللغوية الكبيرة المتقدمة (مثل Kimi K2 من Moonshot AI)، يقدم مُحسِّن MuSGD الهجين تدريبًا مستقرًا وفعالًا للغاية، مما يجعله يتقارب أسرع من خوارزميات SGD أو AdamW التقليدية.
- ProgLoss + STAL: تؤدي دوال الفقد المتقدمة هذه إلى تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو عامل حاسم لـ صور الطائرات بدون طيار والمراقبة الجوية.
- تنوع في المهام: على عكس YOLOv6-3.0 الذي يركز بشكل كبير على الكشف، يدعم YOLO26 تجزئة الكائنات، تقدير الوضعية، التصنيف، و صندوق التحديد الموجه (OBB) بشكل جاهز للاستخدام.
Link to this sectionنظام تدريب مبسط#
يتطلب نشر PP-YOLOE+ إدارة بيئة PaddlePaddle، بينما يتطلب YOLOv6-3.0 التنقل عبر نصوص برمجية تركز على الأبحاث. في المقابل، توفر منصة Ultralytics تجربة سلسة وشاملة.
يتطلب تدريب نموذج YOLO26 المتطور بضعة أسطر فقط من Python:
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on your custom dataset with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model's accuracy
metrics = model.val()
# Export seamlessly to OpenVINO or TensorRT
path = model.export(format="engine")هذه الواجهة البرمجية البسيطة، جنبًا إلى جنب مع انخفاض استخدام الذاكرة أثناء التدريب مقارنة بالنماذج كثيفة المحولات (Transformers) مثل RT-DETR، تساهم في إتاحة الذكاء الاصطناعي عالي الأداء للجميع.
Link to this sectionحالات الاستخدام المثالية واستراتيجيات النشر#
اختيار النموذج المناسب يحدد نجاح خط أنابيب النشر الخاص بك.
Link to this sectionمتى تستخدم YOLOv6-3.0#
- التصنيع عالي السرعة: البيئات التي يتم فيها تغذية الكاميرات الصناعية مباشرة إلى وحدات معالجة رسومات NVIDIA T4 أو A100 مخصصة، مما يتطلب استنتاجًا ثابتًا في أقل من 5 مللي ثانية.
- تحليلات الفيديو على جانب الخادم: معالجة تدفقات فيديو متعددة وكثيفة حيث تكون إنتاجية GPU هي عنق الزجاجة الأساسي.
Link to this sectionمتى تستخدم PP-YOLOE+#
- أنظمة Baidu/Paddle البيئية: بيئات المؤسسات المستثمرة بكثافة في حزمة تقنيات PaddlePaddle أو التي يتم النشر فيها خصيصًا على أجهزة مُحسَّنة لسلسلة أدوات Baidu.
- الصور الثابتة عالية الدقة: السيناريوهات التي يكون فيها متوسط دقة الكشف (mAP) للنموذج الضخم (PP-YOLOE+x) أكثر أهمية من سرعة النشر على الحافة.
Link to this sectionمتى تختار Ultralytics YOLO26#
- أجهزة الحافة و IoT: بفضل تصميمه الخالي من NMS وإزالة DFL، يعد YOLO26 الخيار بلا منازع للنشر على Raspberry Pi أو NXP أو وحدات المعالجة المركزية المحمولة.
- تطبيقات المهام المتعددة: المشاريع التي تتطلب تتبع الكائنات وتقدير الوضعية أو التجزئة في وقت واحد باستخدام واجهة برمجة تطبيقات موحدة.
- النماذج الأولية السريعة للإنتاج: الفرق التي تستفيد من منصة Ultralytics لتبسيط تعليق البيانات، وضبط المعلمات الفائقة، و نشر النموذج بنقرة واحدة.
للمطورين الذين يتطلعون إلى استكشاف المشهد الأوسع لنماذج الكشف، توفر إطارات عمل مثل YOLOX و DAMO-YOLO أيضًا مناهج معمارية فريدة تستحق المراجعة في وثائق Ultralytics.