Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 مقابل PP-YOLOE+#

يستمر مشهد اكتشاف الكائنات في الوقت الفعلي في التقدم بسرعة، مما يوفر لمهندسي الرؤية الحاسوبية مجموعة واسعة من الخيارات لنشر نماذج دقيقة للغاية على البنية التحتية المتطورة والسحابية. اثنان من النماذج البارزة في هذا المجال هما YOLOv9 و PP-YOLOE+. وبينما يدفع كلاهما حدود الدقة والسرعة، إلا أنهما ينبعان من سلالات بحثية وأنظمة برمجية مختلفة.

تستكشف هذه المقارنة التقنية الشاملة بنياتهما، ومنهجيات التدريب، ومقاييس الأداء، والتطبيقات الواقعية المثالية. سنستكشف أيضًا كيف يوفر نظام Ultralytics البيئي مزايا كبيرة للمطورين الذين يعطون الأولوية لسهولة الاستخدام، وكفاءة الذاكرة، والنشر متعدد الاستخدامات.

Link to this sectionأصول النماذج والمواصفات التقنية#

يساعد فهم خلفية هذه النماذج في وضع قراراتها المعمارية وتبعيات إطار العمل في سياقها الصحيح.

Link to this sectionYOLOv9: حل اختناق المعلومات#

تم تقديم YOLOv9 في أوائل عام 2024، وهو يعالج فقدان البيانات الذي يحدث أثناء تدفق المعلومات عبر الشبكات العصبية العميقة. إنه شبكة عصبية تلافيفية محسنة للغاية مصممة لزيادة كفاءة المعلمات إلى أقصى حد.

  • المؤلفون: Chien-Yao Wang, Hong-Yuan Mark Liao
  • المنظمة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان
  • التاريخ: 21 فبراير 2024
  • Arxiv: 2402.13616
  • GitHub: WongKinYiu/yolov9
  • الوثائق: وثائق Ultralytics YOLOv9

اعرف المزيد عن YOLOv9

Link to this sectionPP-YOLOE+: تطوير نظام Paddle البيئي#

تم إصدار PP-YOLOE+ بواسطة Baidu في عام 2022، وهو تحسين تكراري لـ PP-YOLOv2. يستخدم نموذجًا بدون نقاط ارتكاز (anchor-free) ويقدم استراتيجية تعيين تسميات ديناميكية لتحسين التقارب والدقة ضمن إطار عمل PaddlePaddle.

اعرف المزيد عن PP-YOLOE+

Link to this sectionمقارنة معمارية#

Link to this sectionمعلومات التدرج القابلة للبرمجة مقابل CSPRepResStage#

الابتكار الأساسي في YOLOv9 هو معلومات التدرج القابلة للبرمجة (PGI). يعمل PGI كإطار عمل إشرافي مساعد، مما يضمن الحفاظ على معلومات التدرج الحيوية ونشرها بدقة مرة أخرى إلى الطبقات الضحلة أثناء التدريب. يقترن هذا بـ شبكة تجميع الطبقات الفعالة المعممة (GELAN)، والتي تجمع بين نقاط قوة CSPNet و ELAN لتقديم دقة عالية مع تقليل التكلفة الحسابية (FLOPs) بشكل كبير.

يعتمد PP-YOLOE+ على هيكل أساسي متخصص يسمى CSPRepResStage. وهو يستفيد من تقنيات إعادة المعلمة (المشابهة لتلك الموجودة في RepVGG) لتسريع الاستدلال من خلال دمج الطبقات التلافيفية أثناء النشر. علاوة على ذلك، فإنه يستخدم رأس المهمة المتوافق الفعال (ET-head) لموازنة مهام التصنيف والانحدار.

على الرغم من قوة PP-YOLOE+، إلا أن بنية GELAN الخاصة بـ YOLOv9 تتطلب عادةً بصمة ذاكرة أصغر أثناء التدريب والاستدلال، مما يجعلها مناسبة بشكل استثنائي لـ أجهزة الذكاء الاصطناعي الطرفية.

Link to this sectionمقارنة الأداء#

عند تقييم النماذج للإنتاج، فإن المقايضة بين mAP (متوسط دقة متوسط)، وسرعة الاستدلال، وحجم النموذج أمر بالغ الأهمية.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Link to this sectionتحليل#

  • كفاءة المعلمات: يحقق YOLOv9 كفاءة أعلى بشكل ملحوظ. على سبيل المثال، يصل YOLOv9c إلى mAP بنسبة 53.0% باستخدام 25.3 مليون معلمة فقط، بينما يتطلب PP-YOLOE+l أكثر من ضعف المعلمات (52.2 مليون) لتحقيق mAP أقل قليلاً بنسبة 52.9%. وهذا يقلل بشكل كبير من متطلبات الذاكرة لـ YOLOv9.
  • سرعة الاستدلال: تُظهر نماذج YOLOv9 تحسينًا ممتازًا لمسرعات الأجهزة مثل TensorRT، مما ينتج عنه سرعات استدلال تنافسية على وحدات معالجة الرسومات NVIDIA T4 والتي تعتبر ضرورية لـ الاستدلال في الوقت الفعلي.

Link to this sectionمنهجيات التدريب والنظام البيئي#

غالبًا ما يعتمد الاختيار بين هذه النماذج على النظام البيئي للبرمجيات.

Link to this sectionPP-YOLOE+ و PaddlePaddle#

يرتبط PP-YOLOE+ ارتباطًا وثيقًا بحزمة PaddleDetection. على الرغم من قوته، فإنه يتطلب من المستخدمين التنقل في بيئة تعتمد على سطر الأوامر وتكثيف التكوين. بالنسبة للفرق المندمجة بعمق في أنظمة PyTorch أو TensorFlow البيئية، فإن الانتقال إلى PaddlePaddle يسبب احتكاكًا كبيرًا ومنحنى تعلم أكثر حدة.

Link to this sectionميزة Ultralytics: سير عمل مبسط#

في المقابل، يعمل YOLOv9 ضمن نظام Ultralytics البيئي المصقول للغاية. تم تصميم Ultralytics للمطورين والباحثين، ويعطي الأولوية لسهولة استخدام استثنائية. تجرد واجهة برمجة تطبيقات Python بالكامل كود النموذج المعقد.

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Run inference and visualize results
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for production deployment
model.export(format="onnx")

يسلط سير العمل هذا الضوء على كفاءة التدريب الفائقة لنماذج Ultralytics. الدعم الأصلي لزيادة البيانات، والتدريب الموزع، والتسجيل التلقائي في منصات مثل Weights & Biases أو MLflow يأتي بشكل قياسي.

استكشف أحدث ما في رؤية الذكاء الاصطناعي

بينما يقدم YOLOv9 أداءً استثنائيًا، نوصي بشدة بالنظر في Ultralytics YOLO26 الذي تم إصداره حديثًا للمشاريع الجديدة. يتميز YOLO26 بـ تصميم أصلي بدون NMS من البداية إلى النهاية، مما يبسط النشر بشكل كبير. مع إزالة DFL (إزالة فقدان البؤرة للتوزيع لتسهيل التصدير وتحسين التوافق مع الأجهزة الطرفية/منخفضة الطاقة)، فإنه يوفر ما يصل إلى 43% استدلال أسرع على وحدة المعالجة المركزية للحوسبة الطرفية. مدعومًا بـ محسن MuSGD، فإنه يضمن تدريبًا مستقرًا وتقاربًا سريعًا. بالإضافة إلى ذلك، توفر ProgLoss + STAL دوال خسارة محسنة مع تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو أمر بالغ الأهمية لإنترنت الأشياء، والروبوتات، والصور الجوية.

Link to this sectionتعدد الاستخدامات ودعم المهام#

نادراً ما تتوقف مشاريع الرؤية الحاسوبية الحديثة عند مربعات الإحاطة البسيطة.

تم تصميم PP-YOLOE+ في المقام الأول لاكتشاف الكائنات القياسي. يتضمن تكييف بنيته لمهام أخرى هندسة مخصصة واسعة النطاق.

وعلى العكس من ذلك، يعد إطار عمل Ultralytics قوة متعددة المهام. من خلال استخدام واجهة برمجة تطبيقات موحدة، يمكن للمطورين التبديل بسهولة من اكتشاف الكائنات القياسي إلى تجزئة المثيلات المعقدة، وتقدير الوضع عالي الدقة، واكتشاف مربع الإحاطة الموجه (OBB) للصور الجوية، وتصنيف الصور. هذا التنوع الذي لا مثيل له هو السبب في أن فرق المؤسسات تختار باستمرار نماذج Ultralytics مثل YOLOv9، وYOLO11، وYOLO26.

Link to this sectionحالات الاستخدام والتطبيقات المثالية#

  • تحليلات المدن الذكية وإدارة المرور: تجعل كفاءة المعلمات العالية وزمن الوصول المنخفض لـ YOLOv9 (وYOLO26 اللاحق) منها مثالية للنشر على الأجهزة الطرفية المقيدة (مثل أجهزة NVIDIA Jetson) لمراقبة تدفق حركة المرور والأمن الحضري.
  • أنظمة جرد التجزئة: لاكتشاف التكوينات الكثيفة للعناصر الصغيرة على الأرفف، يحافظ PGI الخاص بـ YOLOv9 بشكل فعال على تفاصيل مكانية دقيقة، متفوقًا على PP-YOLOE+ في مهام اكتشاف الكائنات الصغيرة.
  • عمليات النشر القديمة: يظل PP-YOLOE+ خيارًا قابلاً للتطبيق حصريًا للفرق الملزمة صراحةً باستخدام حزمة برامج Baidu/PaddlePaddle في البنية التحتية القديمة الحالية.

بالنسبة للباحثين الذين يستكشفون بنيات تعتمد على المحولات (Transformer)، تدعم Ultralytics أيضًا بشكل أصلي RT-DETR ضمن نفس واجهة برمجة التطبيقات سهلة الاستخدام، مما يضمن حصولك دائمًا على الوصول إلى النموذج الأمثل لمتطلبات النشر الخاصة بك.

التعليقات