YOLOv9 YOLOv6.0: مقارنة تقنية شاملة
تطور اكتشاف الكائنات في الوقت الفعلي مدفوع بالابتكارات المستمرة في هياكل الشبكات العصبية، مما يحسن التوازن الدقيق بين سرعة الاستدلال والدقة والكفاءة الحسابية. مع تنقل المطورين والباحثين في عالم أطر عمل الرؤية الحاسوبية المزدحم، فإن مقارنة الهياكل الرائدة أمر ضروري لاختيار الأداة المناسبة للمهمة.
يقدم هذا الدليل الفني مقارنة متعمقة بين نموذجين عاليي الأداء: YOLOv9، المشهور بقدرته على الاحتفاظ بمعلومات التعلم العميق، و YOLOv6.0، وهو نموذج مصمم خصيصًا للتطبيقات الصناعية.
YOLOv9 : تعظيم الاحتفاظ بالميزات
تم طرح YOLOv9 في أوائل عام 2024، YOLOv9 أحد التحديات الأكثر استمرارًا في الشبكات العصبية العميقة: فقدان المعلومات أثناء عملية التغذية الأمامية. من خلال ضمان موثوقية التدرجات واحتفاظ خرائط الميزات بالبيانات المهمة، فإنه يدفع حدود الدقة النظرية.
- المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
- المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
- التاريخ: 21 فبراير 2024
- روابط:ورقة Arxiv، مستودع GitHub
الهندسة المعمارية والمنهجيات
YOLOv9 مفهوم معلومات التدرج القابلة للبرمجة (PGI) إلى جانب شبكة تجميع الطبقات الفعالة المعممة (GELAN). تعالج PGI مشكلة اختناق المعلومات من خلال توفير إشراف إضافي يضمن أن الشبكة الرئيسية تتعلم ميزات قوية وموثوقة دون إضافة أعباء استدلالية. وفي الوقت نفسه، تعمل شبكة GELAN على تحسين استخدام المعلمات، مما يسمح للنموذج بتحقيق متوسط دقة متوسط (mAP) متطور مع الحفاظ على تكلفة الحوسبة في حدود معقولة. وهذا يجعلها خيارًا استثنائيًا لتحليل الصور الطبية أو اكتشاف الأجسام الصغيرة للغاية حيث تكون دقة الميزات أمرًا بالغ الأهمية.
نظرة عامة على YOLOv6.YOLOv6: مصمم للاستخدام على نطاق صناعي
تم تطوير YOLOv6. YOLOv6(يُشار إليه أيضًا باسم v3.0) بواسطة Meituan، وقد تم تصميمه من الألف إلى الياء لخدمة التطبيقات الصناعية الثقيلة. تم إصداره في أوائل عام 2023، ويركز بشكل كبير على كفاءة النشر، حيث يقدم مجموعة من النماذج الملائمة للتكمية والتي تتفوق في الأجهزة المتطورة.
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
- المنظمة: ميتوان
- التاريخ: 13 يناير 2023
- روابط:ورقة Arxiv، مستودع GitHub
الهندسة المعمارية والمنهجيات
يتميز YOLOv6.0 باستراتيجيات RepOptimizer و Anchor-Aided Training (AAT). يستخدم النموذج تصميم شبكة عصبية مدركة للأجهزة مستوحاة من RepVGG، مما يتيح له العمل بسرعة استثنائية على وحدات معالجة الرسومات (GPU) أثناء الاستدلال من خلال دمج الطبقات. وقد أدى التحديث 3.0 إلى تحسين البنية بشكل أكبر من خلال إدخال وحدة تسلسل ثنائي الاتجاه (BiC) لتحسين دقة التوطين. ونظرًا لأنه مُحسّن للغاية لتنسيقات النشر مثل TensorRT و OpenVINO، يتم اعتماد YOLOv6. YOLOv6 بشكل متكرر في مجال الخدمات اللوجستية وأتمتة التصنيع وبيئات الخوادم عالية الإنتاجية.
تعرف على المزيد حول YOLOv6-3.0
مقارنة الأداء
عند تقييم هذه النماذج على COCO القياسية، يمكننا ملاحظة تباينات واضحة بين الدقة وسرعة الاستدلال الأولية.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
التحليل الفني
بينما يتصدر YOLOv6 قائمة السرعة الخام على أجهزة T4 (1.17 مللي ثانية)، يتمكن YOLOv9t من استخراج mAP أعلى قليلاً mAP 38.3٪) مع استخدام أقل من نصف المعلمات (2.0 مليون مقابل 4.7 مليون) وعدد أقل بكثير من FLOPs. بالنسبة للمتطلبات المعقدة عالية الدقة، يرفع YOLOv9e الضخم الدقة إلى 55.6٪ mAP مما يوضح قوة بنية PGI في الشبكات العميقة.
اجعل مشروعك مستعدًا للمستقبل مع YOLO26
إذا كنت تبدأ مبادرة جديدة في مجال الرؤية الحاسوبية، فإننا نوصي بشدة باستخدام YOLO26. تم إصداره في عام 2026، ويتميز بتصميم أصلي شامل NMS يزيل تمامًا زمن انتقال المعالجة اللاحقة، مما يتيح CPU أسرع بنسبة تصل إلى 43٪ CPU .
ميزة النظام البيئي لـ Ultralytics
بغض النظر عن النموذج المعماري الذي يعجبك، فإن تطبيقه بشكل أصلي من خلال Python Ultralytics Python يوفر تجربة مطور فائقة الجودة.
سهولة الاستخدام وكفاءة التدريب
يتطلب تدريب نماذج التعلم العميق المعقدة عادةً كودًا نمطيًا ضخمًا. تعمل Ultralytics على تجريد هذه التعقيدات. سواء كنت تقوم بضبط YOLOv9 لاكتشاف العيوب أو تصدير YOLOv6 الهاتف YOLOv6 يظل سير العمل متسقًا بشكل ملحوظ.
علاوة على ذلك، تتميز Ultralytics عمومًا بمتطلباتCUDA أقل أثناء التدريب مقارنة بالنماذج الضخمة القائمة على المحولات. وهذا يتيح للمطورين استخدام أحجام دفعات أكبر على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين، مما يحسن كفاءة التدريب بشكل كبير.
from ultralytics import YOLO
# Easily swap architectures by changing the weights file string
# model = YOLO("yolov6n.pt")
model = YOLO("yolov9c.pt")
# Train the model with built-in data augmentation and caching
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")
# Export to ONNX or TensorRT seamlessly
model.export(format="engine", half=True)
تنوع لا مثيل له في مهام الرؤية
في حين أن YOLOv6. YOLOv6 مُحسّن بشكل كبير لإنشاء مربعات تحديد سريعة، فإن مشاريع الرؤية الحاسوبية الحديثة تتطلب غالبًا نهجًا متعدد المهام. تشتهر Ultralytics بتنوعها الشديد. باستخدام أدوات مثل Ultralytics YOLOv8 و YOLO26 الأحدث، يمكن لإطار عمل واحد التعامل بسلاسة مع اكتشاف الكائنات وتجزئة المثيلات وتصنيف الصور وتقدير الوضع ومربعات الحدود الموجهة (OBB).
تقديم YOLO26: المعيار الجديد
بالنسبة للمؤسسات التي تسعى إلى تعظيم الأداء وسهولة النشر، يمثل YOLO26 التوافق المثالي بين السرعة والدقة.
بناءً على نجاحات YOLO11، يقدم YOLO26 العديد من الميزات التي تغير النموذج:
- MuSGD Optimizer: مستوحى من تقنيات تدريب نماذج اللغة الكبيرة (LLM) مثل Kimi K2 من Moonshot AI، يضمن هذا المحسن الهجين تدريبًا مستقرًا للغاية وتقاربًا سريعًا.
- إزالة DFL: من خلال إزالة Distribution Focal Loss، يبسط YOLO26 الرسم البياني للتصدير، مما يجعله أكثر توافقًا بشكل كبير مع رقائق الحوسبة الطرفية منخفضة الطاقة.
- ProgLoss + STAL: توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية لعمليات الطائرات بدون طيار وتطبيقات إنترنت الأشياء.
- تحسينات خاصة بالمهام: يتضمن YOLO26 نماذج أولية متعددة المقاييس للتجزئة، وتقدير احتمالية السجل المتبقي (RLE) لتتبع الهيكل العظمي، وخوارزميات متخصصة لفقدان الزاوية لحل الحالات الحدية في الكشف عن OBB.
سيناريوهات النشر المثالية
اختيار البنية المناسبة يعتمد في النهاية على قيود الإنتاج لديك.
اختر YOLOv6.YOLOv6 إذا كان لديك خط إنتاج راسخ في مجال التصنيع الصناعي، وتعتمد بشكل كبير على التكمية، وتستخدم مسرعات استدلال متخصصة حيث تحتاج إلى أقل زمن انتقال للأجهزة على الإطلاق أقل من مللي ثانية.
اختر YOLOv9 إذا كنت تتعامل مع تشخيصات طبية معقدة أو مراقبة بعيدة المدى حيث لا يمكن تجاهل الميزات الدقيقة على مستوى البكسل.
ومع ذلك، من أجل نهج متوازن تمامًا يوفر دقة متطورة إلى جانب نشر مبسط NMS فإن Ultralytics هو التوصية النهائية لهندسة الرؤية الحاسوبية الحديثة. إن دورة التطوير النشطة والوثائق الشاملة والدعم المجتمعي النشط تجعله أداة لا غنى عنها للباحثين والمطورين على حد سواء.