PP-YOLOE+ مقابل YOLOv10: التنقل بين بنى الكشف عن الكائنات في الوقت الفعلي

يتطور مجال الرؤية الحاسوبية باستمرار، مع ظهور نماذج جديدة توسع حدود الإمكانيات في مجال الكشف عن الأجسام في الوقت الفعلي. في هذه المقارنة التقنية الشاملة، سنقوم بفحص PP-YOLOE+ و YOLOv10، وهما بنية عالية الكفاءة مصممة لنظم بيئية مختلفة. سنستكشف أيضًا كيف يتحول المشهد الأوسع نطاقًا نحو منصات أكثر توحيدًا وسهولة في الاستخدام مثل Ultralytics ونموذج YOLO26 المتطور.

مقدمة إلى النماذج

يتطلب اختيار الأساس الصحيح لمشاريع رؤية الكمبيوتر الخاصة بك فهمًا عميقًا للمفاضلات المعمارية لكل نموذج، وقيود النشر، ودعم النظام البيئي.

نظرة عامة على PP-YOLOE+

تم تطوير PP-YOLOE+ بواسطة PaddlePaddle في Baidu، وهو يمثل خطوة تطورية مقارنة بالإصدارات السابقة في نظام PaddleDetection البيئي.

المؤلفون: مؤلفو PaddlePaddle
المؤسسة:بايدو
التاريخ: 2022-04-02
أرشيف:https://arxiv.org/abs/2203.16250
GitHub:مستودع PaddleDetection
الوثائق:الوثائق الرسمية لـ PP-YOLOE+

نقاط القوة: يتفوق PP-YOLOE+ في البيئات المدمجة بعمق مع إطار عمل PaddlePaddle. يقدم بنية خلفية CSPRepResNet متقدمة ويعتمد على استراتيجية قوية لتخصيص التسميات (TAL) لتحقيق دقة متوسطة (mAP) مبهرة. إنه مُحسّن للغاية للنشر على وحدات معالجة الرسوميات (GPUs) من فئة الخوادم الشائعة في التطبيقات الصناعية في جميع أنحاء آسيا.

نقاط الضعف: العيب الرئيسي لـ PP-YOLOE+ هو اعتماده الكبير على نظام PaddlePaddle البيئي، مما قد يكون أقل بديهية للمطورين المعتادين على PyTorch. بالإضافة إلى ذلك، يتطلب قمع غير أقصى (NMS) تقليدي للمعالجة اللاحقة، مما يزيد من زمن الاستجابة وتعقيد النشر.

تعرف على المزيد حول PP-YOLOE+

YOLOv10

أطلق باحثون في جامعة تسينغهوا YOLOv10 ، YOLOv10 تحولًا جوهريًا في النموذج المعماري من خلال إزالة NMS خط أنابيب الاستدلال.

المؤلفون: Ao Wang, Hui Chen, Lihao Liu، وآخرون.
المؤسسة:جامعة تسينغ - هوا
التاريخ: 2024-05-23
أرشيف:https://arxiv.org/abs/2405.14458
GitHub:مستودع YOLOv10
الوثائق:وثائق YOLOv10

نقاط القوة: الميزة البارزة في YOLOv10 هي تعييناته المزدوجة المتسقة للتدريب الخالي من NMS. هذا يعني أن النموذج يتنبأ بالصناديق المحيطة أصلاً دون الحاجة إلى خطوة تصفية ثانوية، مما يجعل نشر النموذج أبسط وأسرع بكثير على الأجهزة الطرفية. يحقق توازنًا ممتازًا بين عدد المعلمات المنخفض والدقة العالية.

نقاط الضعف: بينما يتميز بكفاءة عالية لاكتشاف الكائنات ثنائي الأبعاد القياسي، يفتقر YOLOv10 إلى الدعم الأصلي لمهام رؤية الكمبيوتر الحيوية الأخرى مثل تجزئة الكائنات وتقدير الوضعيات، مما يحد من تنوعه في خطوط أنابيب المهام المتعددة والمعقدة.

تعرف على المزيد حول YOLOv10

هل تفكر في بدائل متقدمة؟

إذا كنت تبحث عن أحدث الابتكارات في مجال الكشف في الوقت الفعلي، ننصحك بقراءة دليلنا حول YOLO11 أو RT-DETR للتطبيقات البصرية عالية الدقة.

مقارنة الأداء والمقاييس

إن فهم كيفية أداء هذه النماذج في ظل معايير قياسية موحدة أمر بالغ الأهمية لاختيار البنية المناسبة. وفيما يلي مقارنة مفصلة بين حجمها ودقتها وزمن استجابتها.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

التحليل الفني

عند تحليل البيانات، تظهر بعض الاتجاهات الرئيسية. تستهدف نماذج YOLOv10 و small بشكل كبير كفاءة الحافة، حيث تفتخر YOLOv10n بـ 2.3 مليون معلمة و 6.7 مليار FLOPs فقط. هذا التصميم خفيف الوزن، جنبًا إلى جنب مع هندسته المعمارية NMS، يقلل بشكل كبير من زمن الاستجابة على المنصات التي تستخدم TensorRT و OpenVINO.

على العكس من ذلك، يُظهر PP-YOLOE+ قدرة قوية في فئات الأوزان الأكبر، حيث يتفوق متغيره X-large بشكل طفيف على YOLOv10x في mAP (54.7% مقابل 54.4%). ومع ذلك، يأتي هذا على حساب مضاعفة عدد المعلمات تقريبًا (98.42 مليون مقابل 56.9 مليون)، مما يجعل YOLOv10x النموذج الأكثر كفاءة بشكل ملحوظ للبيئات محدودة الذاكرة.

ميزة النظام البيئي لـ Ultralytics

في حين أن كلا من PP-YOLOE+ و YOLOv10 إنجازات تقنية مذهلة، فإن هندسة التعلم الآلي الحديثة تتطلب أكثر من مجرد بنية أولية؛ فهي تتطلب نظامًا بيئيًا جيد الصيانة.

Ultralytics حزمة Python رائدة في الصناعة تعمل على تبسيط عملية جمع البيانات والتعليق عليها والتدريب والنشر بشكل كبير. مقارنة بأطر البحث الثقيلة أو نماذج المحولات القديمة، تتطلب Ultralytics جزءًا صغيرًا من CUDA أثناء التدريب، مما يسمح بأحجام دفعات أكبر وتكرارات أسرع. علاوة على ذلك، توفر Ultralytics تنوعًا هائلاً — حيث تدعم تصنيف الصور و OBB (Oriented Bounding Box) وتتبع الكائنات القوي فورًا.

أدخل YOLO26: الجيل التالي

صدر Ultralytics في يناير 2026، وهو يمثل قمة تطور الرؤية الحاسوبية، حيث يجمع بين أفضل الأفكار من نماذج مثل YOLOv10 معالجة أوجه قصورها.

الابتكارات الرئيسية في YOLO26:

تصميم شامل خالٍ من NMS: استنادًا إلى المفهوم الرائد في YOLOv10، يتميز YOLO26 بتصميم شامل أصيل، مما يلغي تمامًا معالجة ما بعد NMS لنشر أسرع وأبسط عبر الأجهزة المتنوعة.
إزالة DFL: من خلال إزالة Distribution Focal Loss (DFL)، يتم تبسيط بنية النموذج بشكل كبير للتصدير، مما يضمن توافقًا لا تشوبه شائبة مع أجهزة الذكاء الاصطناعي الطرفية منخفضة الطاقة.
مُحسِّن MuSGD: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (مثل Kimi K2 من Moonshot AI)، يستخدم YOLO26 مزيجًا من SGD و Muon. يوفر هذا استقرارًا غير مسبوق في التدريب ومعدلات تقارب أسرع بكثير.
استدلال أسرع على CPU بنسبة تصل إلى 43%: مُحسّن بشكل كبير لسيناريوهات العالم الحقيقي، يوفر YOLO26 تسريعًا هائلاً للتطبيقات التي تعتمد على معالجة CPU، مما يجعله مثاليًا لـ المراقبة الذكية وعمليات النشر على الأجهزة المحمولة.
ProgLoss + STAL: تعمل دوال الخسارة المحسّنة هذه على زيادة الأداء بشكل كبير في التعرف على الأجسام الصغيرة، وهو عامل حاسم لـ الصور الجوية والروبوتات.
تحسينات خاصة بالمهام: على عكس YOLOv10، يدعم YOLO26 بشكل أصلي النموذج الأولي متعدد المقاييس لـ segmentation وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتقدير الوضعية.

تعرف على المزيد حول YOLO26

تنفيذ عملي

تم تصميم البدء في استخدام Ultralytics بحيث يكون سلسًا. باستخدام بضع أسطر من التعليمات البرمجية، يمكنك بدء تشغيل التدريب باستخدام ضبط المعلمات الفائقة الآلي وخطوط أنابيب توسيع البيانات الحديثة.

from ultralytics import YOLO

# Load the highly recommended YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# Memory usage is highly optimized compared to transformer architectures
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Run an end-to-end NMS-free inference
inference_results = model("https://ultralytics.com/images/bus.jpg")

# Export directly to ONNX or TensorRT for deployment
model.export(format="onnx", simplify=True)

حالات الاستخدام والتوصيات

يعتمد الاختيار بين PP-YOLOE+ وYOLOv10 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

متى تختار PP-YOLOE+

PP-YOLOE+ هو خيار قوي لـ:

تكامل منظومة PaddlePaddle: المنظمات ذات البنية التحتية الحالية المبنية على إطار عمل وأدوات PaddlePaddle من Baidu.
نشر Paddle Lite على الحوسبة الطرفية: النشر على أجهزة بنواة استدلال محسّنة للغاية خصيصًا لمحرك استدلال Paddle Lite أو Paddle.
الكشف عالي الدقة من جانب الخادم: السيناريوهات التي تعطي الأولوية لأقصى دقة detect على خوادم GPU القوية حيث لا يمثل الاعتماد على الإطار مشكلة.

متى تختار YOLOv10

يوصى YOLOv10 في الحالات التالية:

detect في الوقت الفعلي خالٍ من NMS: التطبيقات التي تستفيد من detect الشامل دون التثبيط غير الأقصى، مما يقلل من تعقيد النشر.
مقايضات متوازنة بين السرعة والدقة: المشاريع التي تتطلب توازنًا قويًا بين سرعة الاستدلال ودقة الكشف عبر مقاييس النماذج المختلفة.
تطبيقات زمن الاستجابة المتسق: سيناريوهات النشر التي تكون فيها أوقات الاستدلال المتوقعة حاسمة، مثل الروبوتات أو الأنظمة المستقلة.

متى تختار Ultralytics YOLO26)

بالنسبة لمعظم المشاريع الجديدة، يوفر Ultralytics أفضل مزيج من الأداء وتجربة المطور:

نشر طرفي خالٍ من NMS: التطبيقات التي تتطلب استدلالًا متسقًا ومنخفض زمن الوصول دون تعقيد معالجة ما بعد التثبيط غير الأقصى.
بيئات CPU فقط: الأجهزة التي لا تحتوي على تسريع GPU مخصص، حيث يوفر استدلال YOLO26 الأسرع بنسبة تصل إلى 43% على CPU ميزة حاسمة.
اكتشاف الأجسام الصغيرة: سيناريوهات صعبة مثل صور الطائرات بدون طيار الجوية أو تحليل مستشعرات إنترنت الأشياء، حيث تعزز ProgLoss و STAL الدقة بشكل كبير في الأجسام متناهية الصغر.

الخلاصة

يظل PP-YOLOE+ خيارًا ثابتًا للفرق المرتبطة بنظام بايدو البيئي وبيئات الخوادم الصناعية. YOLOv10 إنجازًا أكاديميًا رائعًا أثبت جدوى الكشف في الوقت الفعلي NMS.

ومع ذلك، بالنسبة للمطورين الذين يبحثون عن المزيج المثالي بين الدقة وسرعة الاستدلال الفائقة وقدرات المهام المتعددة السلسة، فإن Ultralytics هو الخيار الأمثل. إن ابتكاراته في كفاءة التدريب وبنية النشر التي تركز على الحافة تضمن أنه الحل الأقوى والأكثر تنوعًا للرؤية الحاسوبية على مستوى الإنتاج في عام 2026 وما بعده.