تخطي إلى المحتوى

PP-YOLOE+ مقابل YOLOv10: التنقل بين بنى الكشف عن الكائنات في الوقت الفعلي

يتطور مجال الرؤية الحاسوبية باستمرار، مع ظهور نماذج جديدة توسع حدود الإمكانيات في مجال الكشف عن الأجسام في الوقت الفعلي. في هذه المقارنة التقنية الشاملة، سنقوم بفحص PP-YOLOE+ و YOLOv10، وهما بنية عالية الكفاءة مصممة لنظم بيئية مختلفة. سنستكشف أيضًا كيف يتحول المشهد الأوسع نطاقًا نحو منصات أكثر توحيدًا وسهولة في الاستخدام مثل Ultralytics ونموذج YOLO26 المتطور.

مقدمة إلى النماذج

يتطلب اختيار الأساس المناسب لمشاريع الرؤية الحاسوبية فهمًا عميقًا للمفاضلات المعمارية لكل نموذج وقيود النشر ودعم النظام البيئي.

نظرة عامة على PP-YOLOE+

تم تطوير PP-YOLOE+ بواسطة PaddlePaddle في Baidu، وهو يمثل خطوة تطورية مقارنة بالإصدارات السابقة في نظام PaddleDetection البيئي.

نقاط القوة: يتفوق PP-YOLOE+ في البيئات المتكاملة بشكل عميق مع PaddlePaddle . وهو يقدم شبكة أساسية متقدمة CSPRepResNet ويعتمد على استراتيجية قوية لتعيين التسميات (TAL) لتحقيق متوسط دقة مثير للإعجاب (mAP). وهو مُحسّن للغاية للنشر على وحدات معالجة الرسومات (GPU) من فئة الخوادم الشائعة في التطبيقات الصناعية في جميع أنحاء آسيا.

نقاط الضعف: العيب الرئيسي لـ PP-YOLOE+ هو اعتماده الكبير على PaddlePaddle ، والذي قد يكون أقل سهولة في الاستخدام للمطورين المعتادين على PyTorch. بالإضافة إلى ذلك، يتطلب هذا النظام استخدام تقنية Non-Maximum Suppression (NMS) التقليدية للمعالجة اللاحقة، مما يزيد من زمن الاستجابة وتعقيد النشر.

تعرف على المزيد حول PP-YOLOE+

YOLOv10

أطلق باحثون في جامعة تسينغهوا YOLOv10 ، YOLOv10 تحولًا جوهريًا في النموذج المعماري من خلال إزالة NMS خط أنابيب الاستدلال.

نقاط القوة: الميزة البارزة في YOLOv10 مهامه المزدوجة المتسقة للتدريب NMS. وهذا يعني أن النموذج يتنبأ بشكل أساسي بالمربعات المحيطة دون الحاجة إلى خطوة تصفية ثانوية، مما يجعل نشر النموذج أسهل وأسرع بكثير على الأجهزة الطرفية. ويحقق توازنًا ممتازًا بين عدد المعلمات المنخفض والدقة العالية.

نقاط الضعف: على الرغم من كفاءته العالية في الكشف عن الكائنات ثنائية الأبعاد القياسية، إلا أن YOLOv10 الدعم الأصلي لمهام الرؤية الحاسوبية الحيوية الأخرى مثل تجزئة المثيلات وتقدير الوضع، مما يحد من تنوعه في خطوط الإنتاج المعقدة والمتعددة المهام.

تعرف على المزيد حول YOLOv10

هل تفكر في بدائل متقدمة؟

إذا كنت تبحث عن أحدث الابتكارات في مجال الكشف في الوقت الفعلي، ننصحك بقراءة دليلنا حول YOLO11 أو RT-DETR للتطبيقات البصرية عالية الدقة.

مقارنة الأداء والمقاييس

إن فهم كيفية أداء هذه النماذج في ظل معايير قياسية موحدة أمر بالغ الأهمية لاختيار البنية المناسبة. وفيما يلي مقارنة مفصلة بين حجمها ودقتها وزمن استجابتها.

النموذجالحجم
(بالبكسل)
mAPval
50-95
السرعة
وحدة المعالجة المركزية CPU ONNX
(بالمللي ثانية)
السرعة
T4 TensorRT10
(بالمللي ثانية)
المعلمات
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

التحليل الفني

عند تحليل البيانات، تظهر بعض الاتجاهات الرئيسية. تستهدف نماذج YOLOv10 و small بشكل كبير كفاءة الحافة، حيث تفتخر YOLOv10n بـ 2.3 مليون معلمة و 6.7 مليار FLOPs فقط. هذا التصميم خفيف الوزن، جنبًا إلى جنب مع هندسته المعمارية NMS، يقلل بشكل كبير من زمن الاستجابة على المنصات التي تستخدم TensorRT و OpenVINO.

على العكس من ذلك، يُظهر PP-YOLOE+ قدرة قوية في فئات الوزن الأكبر، حيث يتفوق نسخته X-large بشكل طفيف على YOLOv10x في mAP 54.7٪ مقابل 54.4٪). ومع ذلك، يأتي ذلك على حساب ما يقرب من ضعف عدد المعلمات (98.42 مليون مقابل 56.9 مليون)، مما يجعل YOLOv10x النموذج الأكثر كفاءة بشكل ملحوظ للبيئات المحدودة الذاكرة.

ميزة النظام البيئي لـ Ultralytics

في حين أن كلا من PP-YOLOE+ و YOLOv10 إنجازات تقنية مذهلة، فإن هندسة التعلم الآلي الحديثة تتطلب أكثر من مجرد بنية أولية؛ فهي تتطلب نظامًا بيئيًا جيد الصيانة.

Ultralytics حزمة Python رائدة في الصناعة تعمل على تبسيط عملية جمع البيانات والتعليق عليها والتدريب والنشر بشكل كبير. مقارنة بأطر البحث الثقيلة أو نماذج المحولات القديمة، تتطلب Ultralytics جزءًا صغيرًا من CUDA أثناء التدريب، مما يسمح بأحجام دفعات أكبر وتكرارات أسرع. علاوة على ذلك، توفر Ultralytics تنوعًا هائلاً — حيث تدعم تصنيف الصور و OBB (Oriented Bounding Box) وتتبع الكائنات القوي فورًا.

أدخل YOLO26: الجيل التالي

صدر Ultralytics في يناير 2026، وهو يمثل قمة تطور الرؤية الحاسوبية، حيث يجمع بين أفضل الأفكار من نماذج مثل YOLOv10 معالجة أوجه قصورها.

الابتكارات الرئيسية في YOLO26:

  • تصميم شامل NMS: بناءً على المفهوم الذي ابتكرته YOLOv10 تتميز YOLO26 بأنها شاملة بطبيعتها، مما يلغي تمامًا الحاجة إلى NMS من أجل نشر أسرع وأبسط عبر أجهزة متنوعة.
  • إزالة DFL: من خلال إزالة فقدان بؤرة التوزيع (DFL)، يتم تبسيط بنية النموذج بشكل كبير للتصدير، مما يضمن توافقًا مثاليًا مع أجهزة الذكاء الاصطناعي الطرفية منخفضة الطاقة.
  • MuSGD Optimizer: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (مثل Kimi K2 من Moonshot AI)، يستخدم YOLO26 مزيجًا من SGD Muon. وهذا يوفر استقرارًا غير مسبوق في التدريب ومعدلات تقارب أسرع بشكل ملحوظ.
  • CPU أسرع بنسبة تصل إلى 43٪ CPU : تم تحسين YOLO26 بشكل كبير لسيناريوهات العالم الحقيقي، ويوفر سرعة هائلة للتطبيقات التي تعتمد على CPU ، مما يجعله مثاليًا للمراقبة الذكية وعمليات النشر المتنقلة.
  • ProgLoss + STAL: تعمل وظائف الخسارة المحسّنة هذه على زيادة الأداء بشكل كبير في التعرف على الأجسام الصغيرة، وهو عامل حاسم في التصوير الجوي والروبوتات.
  • تحسينات خاصة بالمهام: على عكس YOLOv10، يدعم YOLO26 بشكل أساسي البروتو متعدد المقاييس للتجزئة وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتقدير الوضع.

تعرف على المزيد حول YOLO26

تنفيذ عملي

تم تصميم البدء في استخدام Ultralytics بحيث يكون سلسًا. باستخدام بضع أسطر من التعليمات البرمجية، يمكنك بدء تشغيل التدريب باستخدام ضبط المعلمات الفائقة الآلي وخطوط أنابيب توسيع البيانات الحديثة.

from ultralytics import YOLO

# Load the highly recommended YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# Memory usage is highly optimized compared to transformer architectures
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Run an end-to-end NMS-free inference
inference_results = model("https://ultralytics.com/images/bus.jpg")

# Export directly to ONNX or TensorRT for deployment
model.export(format="onnx", simplify=True)

حالات الاستخدام والتوصيات

YOLOv10 الاختيار بين PP-YOLOE+ و YOLOv10 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.

متى تختار PP-YOLOE+

PP-YOLOE+ هو خيار قوي لـ:

  • تكاملPaddlePaddle : المؤسسات التي تمتلك بنية تحتية قائمة مبنية على إطار عمل وأدوات PaddlePaddle من Baidu.
  • نشر Paddle Lite Edge: النشر على الأجهزة باستخدام نوى استدلال محسّنة للغاية خصيصًا لمحرك الاستدلال Paddle Lite أو Paddle.
  • الكشف عالي الدقة من جانب الخادم: سيناريوهات تعطي الأولوية لأقصى دقة في الكشف على GPU قوية حيث لا تشكل تبعية إطار العمل مشكلة.

متى تختار YOLOv10

يوصى YOLOv10 في الحالات التالية:

  • الكشف في الوقت الفعليNMS: تطبيقات تستفيد من الكشف الشامل بدون قمع غير أقصى، مما يقلل من تعقيد النشر.
  • التوازن بين السرعة والدقة: المشاريع التي تتطلب توازناً قوياً بين سرعة الاستدلال ودقة الكشف عبر نماذج مختلفة.
  • تطبيقات ذات زمن انتقال ثابت: سيناريوهات النشر التي يكون فيها زمن الاستدلال المتوقع أمرًا بالغ الأهمية، مثل الروبوتات أو الأنظمة المستقلة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافةNMS: التطبيقات التي تتطلب استنتاجًا متسقًا ومنخفض التأخير دون تعقيدات المعالجة اللاحقة لـ Non-Maximum Suppression.
  • بيئاتCPU: الأجهزة التي لا تحتوي على GPU مخصص، حيث يوفر CPU الأسرع بنسبة تصل إلى 43٪ في YOLO26 ميزة حاسمة.
  • كشف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات إنترنت الأشياء حيث يعزز ProgLoss و STAL الدقة بشكل كبير على الأجسام الصغيرة.

الخلاصة

يظل PP-YOLOE+ خيارًا ثابتًا للفرق المرتبطة بنظام بايدو البيئي وبيئات الخوادم الصناعية. YOLOv10 إنجازًا أكاديميًا رائعًا أثبت جدوى الكشف في الوقت الفعلي NMS.

ومع ذلك، بالنسبة للمطورين الذين يبحثون عن المزيج المثالي بين الدقة وسرعة الاستدلال الفائقة وقدرات المهام المتعددة السلسة، فإن Ultralytics هو الخيار الأمثل. إن ابتكاراته في كفاءة التدريب وبنية النشر التي تركز على الحافة تضمن أنه الحل الأقوى والأكثر تنوعًا للرؤية الحاسوبية على مستوى الإنتاج في عام 2026 وما بعده.


تعليقات