Link to this sectionPP-YOLOE+ مقابل DAMO-YOLO#
أدى التطور المستمر في الرؤية الحاسوبية إلى إنتاج مجموعة من البنيات المتخصصة للغاية لاكتشاف الأجسام في الوقت الفعلي. عند تقييم النماذج للتطبيقات الصناعية والبحثية، يبرز إطاران من عام 2022 غالبًا في المناقشات: PP-YOLOE+ من Baidu و DAMO-YOLO من Alibaba Group. دفع كلا النموذجين حدود الاكتشاف الخالي من نقاط الارتكاز (anchor-free) من خلال تقديم بنيات أساسية مبتكرة، واستراتيجيات متقدمة لتعيين التسميات، وتقنيات متخصصة لدمج الميزات.
يوفر هذا الدليل تحليلاً تقنيًا مفصلاً لكل من PP-YOLOE+ و DAMO-YOLO، مستكشفًا بنياتها، ومنهجيات التدريب الخاصة بها، ونقاط قوتها في النشر. سنقوم أيضًا بفحص كيفية مقارنة هذه الأطر بالحلول الحديثة مثل Ultralytics YOLO26 لمساعدتك في اختيار الأداة المناسبة لقيود النشر المحددة لديك.
Link to this sectionPP-YOLOE+: اكتشاف الأجسام الصناعي المحسّن#
تم تطوير PP-YOLOE+ ضمن نظام Baidu البيئي، وهو تحسين تكراري لنموذج PP-YOLOE الأصلي، ومحسّن بشكل كبير لإطار التعلم العميق PaddlePaddle. صُمم النموذج لتعظيم الدقة وسرعة الاستدلال على الأجهزة من فئة الخوادم، مما يجعله مرشحًا قويًا لتطبيقات الفحص الصناعي والتجزئة الذكية.
Link to this sectionالابتكارات المعمارية#
يقدم PP-YOLOE+ العديد من التحسينات المعمارية للارتقاء عن أجهزة الكشف السابقة الخالية من نقاط الارتكاز:
- بنية CSPRepResNet الأساسية: تستخدم هذه البنية بنية على طراز RepVGG مدمجة مع اتصالات الجزء المرحلي المتقاطع (CSP)، مما يوفر توازنًا قويًا بين قدرة استخراج الميزات وزمن انتقال الاستدلال.
- تعلم محاذاة المهام (TAL): يستخدم PP-YOLOE+ استراتيجية متقدمة لتعيين التسميات الديناميكية التي توازن بين مهام التصنيف والانحدار أثناء التدريب، مما يقلل الفجوة بين أداء التدريب وأداء الاستدلال.
- رأس المهام الموائمة بكفاءة (ET-head): رأس كشف انسيابي مصمم لمعالجة الميزات بسرعة دون التضحية بالدقة المكانية، وهو أمر مفيد للغاية للحفاظ على مقاييس mAP العالية.
تفاصيل PP-YOLOE+:
- المؤلفون: مؤلفو PaddlePaddle
- المؤسسة: Baidu
- التاريخ: 2022-04-02
- Arxiv: 2203.16250
- GitHub: PaddlePaddle/PaddleDetection
- التوثيق: توثيق PP-YOLOE+
Link to this sectionDAMO-YOLO: البحث عن البنية العصبية عند الحافة#
ابتكر فريق Alibaba DAMO Academy نموذج DAMO-YOLO متبعًا نهجًا مختلفًا تمامًا. فبدلاً من تصميم البنية الأساسية يدويًا، استخدم فريق البحث البحث عن البنية العصبية (NAS) لاكتشاف طبولوجيا شبكات عالية الكفاءة مصممة خصيصًا لقيود زمن الانتقال الصارمة.
Link to this sectionالميزات الرئيسية وخط أنابيب التدريب#
يؤكد DAMO-YOLO على زمن الانتقال المنخفض والدقة العالية من خلال منهجية آلية تعتمد بكثافة على التقطير (distillation):
- بنى MAE-NAS الأساسية: من خلال استخدام طريقة أتمتة البحث عن البنية العصبية الفعالة، يبني DAMO-YOLO بنيات أساسية محسّنة خصيصًا لـ المقايضة بين المعلمات والدقة.
- Efficient RepGFPN: شبكة هرمية للميزات عامة مُعاد تحديد معاملاتها (re-parameterized) تتيح دمجًا قويًا للميزات متعددة النطاقات، مما يساعد النموذج على اكتشاف الأجسام ذات الأحجام المتفاوتة بشكل كبير في إطار واحد.
- تصميم ZeroHead: رأس كشف مبسط للغاية يقلل بشكل كبير من العبء الحسابي أثناء مرحلة الاستدلال.
- تحسين التقطير: لتعزيز أداء المتغيرات الأصغر، يعتمد DAMO-YOLO بشكل كبير على عملية تقطير معرفية معقدة حيث يوجه نموذج معلّم أكبر نموذج الطالب.
تفاصيل DAMO-YOLO:
- المؤلفون: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, و Xiuyu Sun
- المنظمة: مجموعة Alibaba
- التاريخ: 2022-11-23
- Arxiv: 2211.15444v2
- GitHub: tinyvision/DAMO-YOLO
- Docs: توثيق DAMO-YOLO
بينما يقدم كل من PP-YOLOE+ و DAMO-YOLO ابتكارات نظرية قوية، إلا أنهما مرتبطان ارتباطًا وثيقًا بأطرهما الخاصة (PaddlePaddle وبيئات Alibaba المحددة). يمكن أن يؤدي هذا إلى احتكاك عند محاولة نقل هذه النماذج إلى عمليات نشر سحابية أو طرفية قياسية.
Link to this sectionتحليل الأداء#
عند تقييم هذه النماذج، تحدد المقايضة بين زمن الانتقال، والتعقيد الحسابي (FLOPs)، ومتوسط الدقة (mAP) بيئة النشر المثالية لها.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
يحقق DAMO-YOLO عمومًا أزمنة انتقال أقل باستخدام TensorRT على المقاييس النانوية والصغيرة (nano and tiny)، مما يجعله منافسًا قويًا لتدفقات الفيديو ذات الإنتاجية العالية. ومع ذلك، يتوسع PP-YOLOE+ بشكل جيد للغاية ليصل إلى متغيره الكبير جدًا (x)، محققًا دقة من الدرجة الأولى للصور المعقدة حيث يكون وقت الاستدلال اعتبارًا ثانويًا.
Link to this sectionميزة Ultralytics: تجاوز بنيات عام 2022#
بينما مثّل كل من PP-YOLOE+ و DAMO-YOLO معالم هامة، يتطلب التطوير الحديث تنوعًا أكبر، وخطوط أنابيب تدريب أسهل، ومتطلبات ذاكرة أقل. تعالج منصة Ultralytics هذه الاحتياجات من خلال تقديم تجربة خالية من الاحتكاك تتفوق بشكل كبير على عمليات التقطير المعقدة والإعدادات الخاصة بإطارات العمل التي تتطلبها النماذج الأقدم.
بالنسبة للمطورين الذين يتطلعون إلى تحقيق أفضل توازن في الأداء اليوم، يوفر Ultralytics YOLO26 قفزة ثورية للأمام في كفاءة النشر في العالم الحقيقي.
Link to this sectionلماذا يقود YOLO26 الصناعة#
تم إصدار YOLO26 في أوائل عام 2026، وهو يبني على إرث YOLO11 من خلال تقديم تقنيات اختراق مصممة للإنتاج:
- تصميم بدون NMS من البداية إلى النهاية: يلغي YOLO26 معالجة ما بعد الكشف غير القصوى (NMS). وهذا يترجم إلى منطق نشر أبسط وأزمنة استدلال متسقة وقابلة للتنبؤ بدرجة عالية.
- مُحسّن MuSGD: مستوحى من تقنيات تدريب النماذج اللغوية الكبيرة، يستخدم YOLO26 مُحسّن MuSGD هجين. وهذا يضمن تدريبًا مستقرًا للغاية وتقاربًا سريعًا، مما يوفر ساعات GPU ثمينة.
- استدلال متفوق على وحدة المعالجة المركزية (CPU): من خلال إزالة خسارة التوزيع البؤري (DFL) وتحسين رسم الشبكة، يحقق YOLO26 استدلالًا أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية، مما يجعله الخيار الأول لـ أجهزة الذكاء الاصطناعي الطرفية.
- ProgLoss + STAL: تحقق هذه الدوال الخسارية المتقدمة تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لـ عمليات الطائرات بدون طيار والاستشعار عن بعد.
- تنوع لا يضاهى: على عكس PP-YOLOE+ الذي يركز بدقة على الاكتشاف، يدعم YOLO26 بشكل أصلي تقدير الوضع، وتجزئة المثيلات، وتصنيف الصور، وصناديق التحديد الموجهة (OBB) بسلاسة.
Link to this sectionسهولة الاستخدام وكفاءة التدريب#
يتطلب تدريب نموذج DAMO-YOLO إدارة خط أنابيب تقطير ثقيل من المعلم والطالب. في المقابل، يتطلب تدريب نموذج Ultralytics بضعة أسطر فقط من Python، مع الحد الأدنى من استخدام ذاكرة CUDA مقارنة بالبنيات المنافسة.
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model with native MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run an end-to-end NMS-free inference
results = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")Link to this sectionحالات الاستخدام المثالية والتوصيات#
يعتمد اختيار بنية الرؤية الحاسوبية المثلى بشكل كبير على تكامل النظام البيئي لفريقك وأهداف النشر.
- اختر PP-YOLOE+ إذا كان خط أنابيب عملك بأكمله مدمجًا بعمق في نظام Baidu PaddlePaddle البيئي. يظل خيارًا ممتازًا لتحليل الصور الثابتة على خوادم قوية حيث يكون تعظيم الدقة هو الهدف الأساسي.
- اختر DAMO-YOLO إذا كنت تجري بحثًا محددًا في خوارزميات البحث عن البنية العصبية، أو إذا كان لديك الموارد الهندسية لصيانة خطوط أنابيب تقطير معقدة لتحقيق أهداف زمن انتقال صارمة باستخدام TensorRT.
- اختر Ultralytics YOLO26 لمعظم سيناريوهات الإنتاج الحديثة. يوفر نظام Ultralytics البيئي توثيقًا لا مثيل له، ومتطلبات ذاكرة أقل، وAPI انسيابي. سواء كنت تبني أنظمة مراقبة جودة آلية أو تقوم بتشغيل تتبع في الوقت الفعلي على Raspberry Pi، تضمن بنية YOLO26 الخالية من NMS نتائج سريعة ومستقرة ودقيقة للغاية منذ البداية.
بالنسبة للمطورين الذين يستكشفون حلولًا أخرى متطورة، يوفر توثيق Ultralytics أيضًا موارد واسعة النطاق حول YOLOv8 المعتمد على نطاق واسع و YOLO11 القوي، مما يضمن حصولك على النموذج المناسب لأي تحدٍ في الرؤية الحاسوبية.