YOLOv7 مقابل YOLOv9: مقارنة تقنية شاملة
اتسم تطور عائلة YOLO (أنت تنظر مرة واحدة فقط) بالابتكار المستمر في بنية الشبكة العصبية، مما أدى إلى تحقيق التوازن بين المفاضلة الحاسمة بين سرعة الاستدلال والدقة والكفاءة الحسابية. تتعمق هذه المقارنة في YOLOv7وهو إصدار بارز من عام 2022 يُعرف ب "حقيبة من الأشياء المجانية" القابلة للتدريب، و YOLOv9وهي بنية من عام 2024 تقدم معلومات التدرج القابلة للبرمجة (PGI) للتغلب على اختناقات المعلومات في الشبكات العميقة.
تحليل الأداء والكفاءة
يمثل الانتقال من YOLOv7 إلى YOLOv9 قفزة كبيرة في كفاءة المعلمات. فبينما تم تحسين YOLOv7 لدفع حدود الكشف عن الكائنات في الوقت الحقيقي باستخدام شبكات تجميع الطبقات الموسعة ذات الكفاءة الموسعة (E-ELAN)، فإن YOLOv9 يقدم تغييرات معمارية تسمح له بتحقيق متوسط دقة أعلىmAP مع عدد أقل من المعلمات وعمليات النقاط العائمة (FLOPs).
بالنسبة للمطورين الذين يركزون على نشر الذكاء الاصطناعي المتطور، تُعد هذه الكفاءة أمرًا بالغ الأهمية. كما هو موضح في الجدول أدناه، يحقق YOLOv9e نسبة 55.6% mAP متجاوزًا YOLOv7x الأكبر مع الحفاظ على بصمة حاسوبية تنافسية. على العكس من ذلك، يوفر YOLOv9t الأصغر حجماً حلاً خفيف الوزن للأجهزة المقيدة للغاية، وهي فئة لا يستهدفها YOLOv7 صراحةً بنفس الدقة.
| النموذج | الحجم (بالبكسل) | mAPفال 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
YOLOv7: تحسين حقيبة المجانية القابلة للتدريب
تم إصدار YOLOv7 في يوليو 2022، وقد أدخلت YOLOv7 العديد من الإصلاحات الهيكلية على بنية YOLO مع التركيز على تحسين عملية التدريب دون زيادة تكلفة الاستدلال.
- المؤلفون: Chien-Yao Wang و Alexey Bochkovskiy و Hong-Yuan Mark Liao
- المنظمــةمعهد علوم المعلومات، الأكاديمية الصينية للمعلومات، تايوان
- التاريخ: 2022-07-06
- اركسيفYOLOv7: حقيبة مجانية قابلة للتدريب تحدد أحدث ما توصلت إليه التكنولوجيا
- جيثب:وونغكين ييو/يولوف 7
أبرز الملامح المعمارية
يستخدم YOLOv7 شبكة تجميع الطبقات الموسّعة الفعّالة E-ELAN، والتي تتحكم في أقصر وأطول مسارات التدرج للسماح للشبكة بتعلم المزيد من الميزات بفعالية. كما أنه يشيع تحجيم النموذج للنماذج القائمة على التجميع، مما يسمح بتوسيع نطاق العمق والعرض في وقت واحد. كان من الابتكارات الرئيسية الابتكار المخطط له هو إعادة التدوير المعاد تحديده، والذي يبسط بنية النموذج أثناء الاستدلال لتعزيز السرعة.
حالة الإرث
على الرغم من أن YOLOv7 لا يزال نموذجًا قادرًا، إلا أنه يفتقر إلى الدعم الأصلي للتحسينات الأحدث الموجودة في نظامUltralytics البيئي. قد يجد المطورون التكامل مع أدوات MLOPS الحديثة أكثر صعوبة مقارنةً بالإصدارات الأحدث.
YOLOv9: حل مشكلة عنق الزجاجة المعلوماتي
يعالج YOLOv9 الذي تم تقديمه في أوائل عام 2024، مشكلة أساسية في التعلُّم العميق: فقدان المعلومات أثناء مرور البيانات عبر طبقات متتالية.
- المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
- المنظمــةمعهد علوم المعلومات، الأكاديمية الصينية للمعلومات، تايوان
- التاريخ: 2024-02-21
- Arxiv:YOLOv9: تعلم ما تريد أن تتعلمه باستخدام PGI
- جيثب:وونغكين ييو/يولوف 9
أبرز الملامح المعمارية
الابتكار الأساسي في YOLOv9 هو معلومات التدرج القابلة للبرمجة (PGI). في الشبكات العميقة، يمكن أن تُفقد المعلومات المفيدة أثناء عملية التغذية الأمامية، مما يؤدي إلى تدرجات غير موثوقة. يوفر PGI إطار إشراف مساعد يضمن الحفاظ على المعلومات الأساسية لدالة الخسارة. بالإضافة إلى ذلك، تعمل شبكة تجميع الطبقات الفعّالة المعممة (GELAN) على توسيع قدرات شبكة التجميع الفعّالة المعممة ( ELAN) من خلال السماح بالحجب التعسفي، مما يزيد من استخدام المعلمات والموارد الحسابية.
هذه البنية تجعل YOLOv9 قويًا بشكل استثنائي لمهام الكشف المعقدة، مثل الكشف عن الأجسام الصغيرة في البيئات المزدحمة أو تحليل الصور الجوية عالية الدقة.
لماذا تُعد نماذج Ultralytics YOLO11 و YOLOv8) الخيار المفضل
على الرغم من أن YOLOv7 و YOLOv9 إنجازان أكاديميان مثيران للإعجاب، فإن Ultralytics YOLO بما في ذلك YOLOv8 و YOLO11-مصممة خصيصًا لتطوير التطبيقات العملية والواقعية. تعطي هذه النماذج الأولوية لسهولة الاستخدام وتكامل النظام البيئي والكفاءة التشغيلية، مما يجعلها الخيار الأفضل لمعظم الفرق الهندسية.
تجربة مستخدم مبسطة
يتم تغليف نماذج Ultralytics في واجهة برمجة تطبيقاتPython موحّدة تستخلص تعقيدات خطوط أنابيب التدريب. لا يتطلب التبديل بين مهام اكتشاف الكائنات، وتجزئة النماذج، وتقدير الوضع، ومهام الصندوق المحيط الموجه (OBB) سوى تغيير وسيطة واحدة، وهو ما تفتقر إليه تطبيقات YOLOv7 أو YOLOv9 القياسية.
from ultralytics import YOLO
# Load a model (YOLO11 automatically handles architecture)
model = YOLO("yolo11n.pt") # Load a pretrained model
# Train the model with a single line of code
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Perform inference on an image
results = model("path/to/image.jpg")
نظام بيئي جيد الصيانة
يمنح اختيار نموذج Ultralytics إمكانية الوصول إلى نظام بيئي قوي. ويشمل ذلك التكامل السلس مع Ultralytics HUB (ومنصة Ultralytics Platform القادمة) للتدريب السحابي وإدارة مجموعة البيانات. علاوة على ذلك، يضمن المجتمع النشط والتحديثات المتكررة التوافق مع أحدث الأجهزة، مثل التصدير إلى TensorRT أو OpenVINO للحصول على سرعات استنتاج مثالية.
الذاكرة وكفاءة التدريب
تشتهر نماذج Ultralytics بكفاءتها في التدريب. على عكس النماذج القائمة على المحولات (مثل RT-DETR) التي يمكن أن تكون متعطشة للذاكرة وبطيئة في التقارب، تستخدم نماذج Ultralytics YOLO أدوات تحميل البيانات المحسّنة وزيادة الفسيفساء لتوفير أوقات تدريب سريعة مع متطلبات ذاكرة CUDA أقل. يسمح ذلك للمطورين بتدريب أحدث النماذج على وحدات معالجة الرسومات على مستوى المستهلك.
حالات الاستخدام المثالية
يعتمد اختيار النموذج المناسب على القيود المحددة لمشروعك.
تطبيقات العالم الحقيقي ل YOLOv9
- البحث والمقارنة المعيارية: مثالية للدراسات الأكاديمية التي تتطلب أعلى دقة مطلقة في مجموعة بياناتCOCO .
- مراقبة عالية الدقة: في سيناريوهات مثل أنظمة الإنذار الأمني حيث تبرر زيادة الدقة بنسبة 1-2% زيادة تعقيد التنفيذ.
تطبيقات العالم الحقيقي ل YOLOv7
- الأنظمة القديمة: المشاريع المبنية بالفعل على الشبكة المظلمة أو أنظمة PyTorch البيئية المبكرة التي تتطلب كمية مستقرة ومعروفة دون إعادة هيكلة قاعدة الشيفرة بأكملها.
تطبيقات العالم الواقعي Ultralytics YOLO11
- المدن الذكية: استخدام تعقب الأجسام لتحليل تدفق حركة المرور حيث تكون السرعة وسهولة النشر أمرًا بالغ الأهمية.
- الرعاية الصحية:تحليل الصور الطبية حيث غالبًا ما تكون هناك حاجة إلى التجزئة والكشف في وقت واحد.
- التصنيع: نشر أنظمة مراقبة الجودة على الأجهزة المتطورة مثل NVIDIA Jetson أو Raspberry Pi، والاستفادة من خيارات التصدير المباشرة إلى TFLite ONNX.
الخلاصة
يمثل كلٌ من YOLOv7 و YOLOv9 علامة فارقة في تاريخ الرؤية الحاسوبية. YOLOv9 ترقية مقنعة عن الإصدار 7 من خلال بنية PGI، مما يوفر كفاءة ودقة أفضل. ومع ذلك، بالنسبة للمطورين الذين يبحثون عن حل متعدد الاستخدامات وسهل الاستخدام ومدعوم بشكل جيد, Ultralytics YOLO11 يظل الخيار الموصى به. حيث يوفر توازن الأداء والتوثيق الشامل والقدرات متعددة المهامdetect segment classify والوضع) أسرع مسار من المفهوم إلى الإنتاج.
استكشف نماذج أخرى
للعثور على الملاءمة المثالية لمهام الرؤية الحاسوبية الخاصة بك، فكّر في استكشاف هذه المقارنات الأخرى:
- YOLOv8 مقابل YOLOv9 - قارن بين الإصدار 8 المعتمد على نطاق واسع والإصدار 9 الذي يركز على الأبحاث.
- YOLOv10 مقابل YOLOv9 - شاهد كيف يتراكم YOLOv10 من طرف إلى طرف.
- YOLO11 مقابل YOLOv8 - فهم التحسينات في أحدث إصدار من برنامج Ultralytics .
- RT-DETR مقابل YOLOv9 - نظرة على الاكتشاف القائم على المحولات مقابل CNNs.