Ultralytics YOLO26 مقابل PP-YOLOE+: مقارنة فنية
يتطور مشهد الكشف عن الكائنات في الوقت الفعلي باستمرار، حيث يسعى الباحثون والمهندسون لتحقيق التوازن الأمثل بين الدقة والسرعة وسهولة النشر. نموذجان بارزان في هذا المجال هما Ultralytics YOLO26 وPP-YOLOE+. وبينما يمثل كلا النموذجين تقدمًا كبيرًا في الرؤية الحاسوبية، فإنهما يلبيان احتياجات نظام بيئي وفلسفات معمارية مختلفة.
يقدم هذا الدليل مقارنة فنية شاملة، تحلل بنياتهما ومقاييس أدائهما ومدى ملاءمتهما لتطبيقات العالم الحقيقي. سنستكشف كيف تختلف ابتكارات YOLO26 الحديثة عن الإطار الراسخ لـ PP-YOLOE+.
نظرة عامة على النموذج والأصول
يساعد فهم سلالة هذه النماذج في توضيح أهداف تصميمها وقاعدة المستخدمين المستهدفة.
Ultralytics YOLO26
تم إصداره في يناير 2026 بواسطة جلين جوشر وجينغ كيو في Ultralytics، ويمثل YOLO26 أحدث تطور في سلسلة YOLO الشهيرة. لقد تم تصميمه خصيصًا لـ الأجهزة الطرفية ومنخفضة الطاقة، مع التركيز على الكفاءة الشاملة الأصلية.
تشمل الابتكارات الرئيسية إزالة قمع غير الحد الأقصى (NMS) لتبسيط الاستدلال، وتقديم مُحسّن MuSGD (المستوحى من Kimi K2 من Moonshot AI)، وتبسيطات معمارية كبيرة مثل إزالة خسارة التركيز التوزيعي (DFL). هذه التغييرات تجعله خيارًا قويًا للمطورين الذين يحتاجون إلى السرعة والبساطة دون التضحية بالدقة.
PP-YOLOE+
PP-YOLOE+ هو نسخة مطورة من PP-YOLOE، تم تطويره بواسطة فريق PaddlePaddle في بايدو. تم إصداره حوالي أبريل 2022، وهو مبني على إطار عمل التعلم العميق PaddlePaddle. يركز على تحسين العمود الفقري CSPRepResStage واستخدام استراتيجية تعيين التسميات الديناميكية المعروفة باسم TAL (Task Alignment Learning). بينما هو قادر للغاية، فإنه مرتبط ارتباطًا وثيقًا بنظام PaddlePaddle البيئي، مما قد يؤثر على خيارات النشر للمستخدمين المعتادين على PyTorch أو أطر عمل أخرى.
الهندسة المعمارية وفلسفة التصميم
تكمن الاختلافات الجوهرية بين هذين النموذجين في كيفية تعاملهما مع تعيين التسميات، والمعالجة اللاحقة، وتحسين التدريب.
YOLO26: الثورة الشاملة
يتميز YOLO26 بكونه شاملًا (من البداية إلى النهاية)، مما يعني أنه يولد التنبؤات النهائية مباشرة من الشبكة دون الحاجة إلى خطوة معالجة لاحقة منفصلة لـ NMS. هذا الخيار التصميمي، الذي كان رائدًا في YOLOv10، يزيل زمن الوصول والتعقيد المرتبطين بضبط عتبات NMS.
- إزالة DFL: بإزالة خسارة التركيز التوزيعي، يبسط YOLO26 الرسم البياني للنموذج، مما يجعل تنسيقات التصدير مثل ONNX وTensorRT أنظف بكثير وأكثر توافقًا مع أجهزة الحافة.
- مُحسّن MuSGD: مزيج من SGD وMuon، يجلب هذا المُحسّن تحسينات الاستقرار التي شوهدت في تدريب نماذج اللغة الكبيرة (LLM) إلى الرؤية الحاسوبية، مما يضمن تقاربًا أسرع.
- التركيز على الكائنات الصغيرة: تستهدف ميزات مثل ProgLoss وتعيين التسميات الواعي للأهداف الصغيرة (STAL) على وجه التحديد تحسينات في الكشف عن الكائنات الصغيرة، وهو أمر بالغ الأهمية لتصوير الجوي وتطبيقات الطائرات بدون طيار.
PP-YOLOE+: كشف مُحسَّن بدون نقاط ارتكاز
يتبع PP-YOLOE+ نموذجًا خاليًا من المراسي، لكنه يعتمد على مسار معالجة لاحقة أكثر تقليدية مقارنة بنهج YOLO26 الشامل.
- العمود الفقري: يستخدم عمودًا فقريًا من نوع CSPRepResStage، الذي يجمع بين كتل نمط rep-vgg واتصالات CSP (Cross Stage Partial).
- تعيين التسميات: يستخدم تعلم محاذاة المهام (TAL)، الذي يواءم ديناميكيًا درجة التصنيف وجودة التوطين.
- التركيز: يركز إصدار "Plus" على تحسينات في سرعة التدريب والتقارب من خلال التهيئة بأوزان مدربة مسبقًا أفضل، غالبًا على Objects365.
لماذا يعتبر النهج الشامل مهماً
في عمليات النشر على الأجهزة الطرفية، كل جزء من الثانية مهم. يعني التصميم الخالي من NMS من طرف إلى طرف أن خرج النموذج يكون جاهزًا للاستخدام فورًا. لا توجد حاجة للفرز والتصفية المكثفة لوحدة المعالجة المركزية (CPU) لآلاف الصناديق المرشحة، وهو ما يمثل عنق زجاجة شائعًا في الكاشفات التقليدية التي تعمل على أجهزة محدودة مثل Raspberry Pi.
مقارنة مقاييس الأداء
يوضح الجدول التالي التباين بين أداء YOLO26 و PP-YOLOE+ على مجموعة بيانات COCO. يُظهر YOLO26 كفاءة فائقة، خاصة في عدد المعلمات وسرعة الاستدلال، مما يسلط الضوء على تحسينه للأجهزة الحديثة.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
النقاط الرئيسية:
- الكفاءة: يحقق YOLO26n دقة أعلى (40.9 mAP) من PP-YOLOE+t (39.9 mAP) بحوالي نصف عدد المعلمات (2.4 مليون مقابل 4.85 مليون) و ربع عدد عمليات FLOPs (5.4 مليار مقابل 19.15 مليار).
- السرعة: يُعد YOLO26 أسرع بكثير في الاستدلال على GPU (T4 TensorRT)، حيث يسجل نموذج النانو 1.7 مللي ثانية مقارنة بـ 2.84 مللي ثانية لنموذج PP-YOLOE+ المكافئ.
- تحسين وحدة المعالجة المركزية (CPU): تم تحسين YOLO26 بشكل صريح لوحدات المعالجة المركزية (CPUs)، وهو قادر على استدلال أسرع بنسبة تصل إلى 43%، مما يجعله مثاليًا للأجهزة التي تفتقر إلى مسرعات مخصصة.
التدريب والنظام البيئي
لا تُحدد تجربة المطور فقط من خلال بنية النموذج، بل من خلال الأدوات المحيطة به.
سهولة الاستخدام مع Ultralytics
تولي Ultralytics الأولوية لتجربة مستخدم سلسة. تم دمج YOLO26 في حزمة python موحدة تدعم الكشف (detect)، والتجزئة (segment)، وتقدير الوضعيات، والتصنيف، وصناديق الإحاطة الموجهة (obb).
يمكن للمطورين بدء التدريب في ثوانٍ باستخدام واجهة سطر الأوامر (CLI) البديهية أو واجهة برمجة تطبيقات python:
from ultralytics import YOLO
# Load the YOLO26s model
model = YOLO("yolo26s.pt")
# Train on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
يمتد هذا النظام البيئي ليشمل النشر السهل. الـ export يدعم وضع التحويل إلى تنسيقات مثل OpenVINO, CoreML، و TensorRT بأمر واحد.
PP-YOLOE+ وPaddlePaddle
تم دمج PP-YOLOE+ بعمق في إطار عمل PaddlePaddle. على الرغم من قوته، غالبًا ما يواجه المستخدمون منحنى تعلم أكثر حدة إذا لم يكونوا بالفعل ضمن نظام Baidu البيئي. يتضمن التدريب عادةً تكوين ملفات yaml معقدة واستخدام نصوص PaddleDetection برمجية محددة. قد يتطلب نقل النماذج إلى محركات استدلال غير Paddle أحيانًا خطوات تحويل إضافية (مثل: Paddle إلى ONNX إلى TensorRT).
حالات الاستخدام والتطبيقات
السيناريوهات المثالية لـ YOLO26
- الذكاء الاصطناعي الحافي وإنترنت الأشياء: نظرًا لانخفاض عدد عمليات FLOPs وإزالة DFL، يتفوق YOLO26 على أجهزة مثل Raspberry Pi أو NVIDIA Jetson.
- تحليلات الفيديو في الوقت الفعلي: سرعة الاستدلال العالية تجعله مثاليًا لمراقبة حركة المرور أو المراقبة الأمنية حيث تكون معدلات الإطارات حاسمة.
- صور الجو والطائرات بدون طيار: توفر وظائف STAL و ProgLoss ميزة واضحة في detect الأجسام الصغيرة من ارتفاعات عالية.
- متطلبات المهام المتعددة: يمكن للمشاريع التي تحتاج إلى تقدير الوضعيات أو تجزئة الكائنات جنبًا إلى جنب مع detect استخدام نفس واجهة برمجة التطبيقات وعائلة النماذج.
سيناريوهات مثالية لـ PP-YOLOE+
- عمليات النشر في مراكز البيانات: للسيناريوهات التي تتوفر فيها مجموعات GPU ضخمة وحيث تكون الكفاءة الخام للمعلمات أقل أهمية من التفضيلات المعمارية المحددة.
- أنظمة PaddlePaddle القديمة: ستجد المؤسسات المستثمرة بكثافة بالفعل في البنية التحتية لـ PaddlePaddle أنه من الأسهل الترقية إلى PP-YOLOE+ من التبديل إلى أطر عمل أخرى.
الخلاصة
بينما يظل PP-YOLOE+ كاشفًا كفؤًا، تقدم Ultralytics YOLO26 حلاً أكثر حداثة وكفاءة وسهولة في الاستخدام للغالبية العظمى من تطبيقات رؤية الكمبيوتر. إن تصميمه الخالي من NMS من طرف إلى طرف، جنبًا إلى جنب مع الدقة المتطورة والحد الأدنى من استخدام الموارد، يجعله الخيار الأفضل للمطورين الذين يتطلعون إلى نشر حلول ذكاء اصطناعي قوية في عام 2026.
يضمن التكامل السلس مع نظام Ultralytics البيئي أن سير العمل يظل سلسًا ومنتجًا، من تسمية البيانات إلى النشر.
مزيد من القراءة
لأولئك المهتمين باستكشاف خيارات أخرى أو الأجيال السابقة، يرجى الرجوع إلى الوثائق الخاصة بـ:
- YOLO11 - النموذج السابق المتطور.
- YOLOv10 - الرائد في الكشف عن الكائنات في الوقت الفعلي من طرف إلى طرف.
- RT-DETR - كاشف يعتمد على المحولات ويوفر دقة عالية.