Link to this sectionمقارنة بين YOLOv6-3.0 و YOLOv9#
يستمر مشهد الكشف عن الكائنات في الوقت الفعلي في التطور، مدفوعاً بمتطلبات الدقة الأعلى، وزمن انتقال أقل، واستخدام أفضل للموارد العتادية. تتناول هذه المقارنة الشاملة علامتين بارزتين في هذا المجال: YOLOv6-3.0، الذي تم تطويره لتحقيق إنتاجية صناعية، و YOLOv9، الذي قدم بنيات مبتكرة للتغلب على اختناقات المعلومات في التعلم العميق.
بينما يقدم كلا النموذجين ابتكارات معمارية فريدة، غالباً ما ينتقل المطورون الباحثون عن التوازن الأمثل بين الأداء وبساطة النشر إلى الأنظمة البيئية الحديثة. بالنسبة لأولئك الذين يبدأون مشاريع جديدة، فإن Ultralytics YOLO26 هو المعيار الموصى به كنموذج متكامل أصلاً (end-to-end)، حيث يوفر دقة متطورة مع تجربة مطور مبسطة بشكل ملحوظ.
Link to this sectionYOLOv6-3.0: تحسين الإنتاجية الصناعية#
تم تطوير YOLOv6-3.0 بواسطة قسم Vision AI في شركة Meituan، وقد تم تصميمه بعناية لتحقيق أقصى قدر من الإنتاجية في التطبيقات الصناعية، خاصة على أجهزة GPU.
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
- المنظمة: Meituan
- التاريخ: 13 يناير 2023
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
Link to this sectionالابتكارات المعمارية#
قدم YOLOv6-3.0 العديد من التعديلات الرئيسية لتحسين دمج الميزات وكفاءة العتاد. تتضمن البنية وحدة توصيل ثنائي الاتجاه (Bi-directional Concatenation - BiC) في عنق الشبكة، مما يوفر إشارات تحديد موقع أكثر دقة. كما يستخدم استراتيجية التدريب المدعوم بالمرساة (Anchor-Aided Training - AAT). يجمع هذا النهج بين التوجيه الغني للتدريب القائم على المراسي وسرعة الاستدلال للنموذج الخالي من المراسي، مما يؤدي إلى أداء أفضل دون إبطاء عملية النشر.
يعتمد العمود الفقري (backbone) على تصميم EfficientRep، الذي تم تحسينه بدقة ليكون صديقاً للعتاد من أجل استدلال GPU. وهذا يجعله مؤهلاً للغاية لسيناريوهات التصنيع الصناعي حيث تكون المعالجة بالدفعات الكبيرة هي المعيار.
Link to this sectionنقاط القوة والضعف#
تكمن القوة الأساسية لـ YOLOv6-3.0 في معدل الإطارات العالي على وحدات معالجة الرسومات مثل NVIDIA T4، مما يجعله مناسباً لبث فهم الفيديو عالي الكثافة. ومع ذلك، فإن اعتماده الكبير على تحسينات عتادية محددة يمكن أن يؤدي إلى زمن انتقال غير مثالي على أجهزة الحافة التي تعتمد على CPU فقط. علاوة على ذلك، قد يكون إعداد خط أنابيب التدريب الخاص به معقداً مقارنة بالأطر الأكثر توحيداً.
Link to this sectionYOLOv9: معلومات التدرج القابلة للبرمجة#
تم إصدار YOLOv9 بعد عام، ويركز على حل مشكلة اختناق المعلومات المتأصلة في الشبكات العصبية العميقة، مما يدفع الحدود النظرية لبنيات CNN.
- المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
- المنظمة: معهد علوم المعلومات، أكاديمية سينيكا
- التاريخ: 21 فبراير 2024
- Arxiv: 2402.13616
- GitHub: WongKinYiu/yolov9
Link to this sectionالابتكارات المعمارية#
تتمثل المساهمة الرئيسية لـ YOLOv9 في معلومات التدرج القابلة للبرمجة (Programmable Gradient Information - PGI)، والتي تضمن الاحتفاظ بالبيانات المهمة أثناء مرورها عبر طبقات الشبكة المتعددة، مما يسمح بتحديثات أوزان أكثر موثوقية. إلى جانب PGI، يتميز النموذج بـ شبكة تجميع الطبقات الفعالة المعممة (GELAN). تعمل GELAN على زيادة كفاءة المعلمات إلى أقصى حد، مما يتيح لـ YOLOv9 تحقيق دقة فائقة مع عمليات حسابية (FLOPs) أقل من العديد من سابقاته.
Link to this sectionنقاط القوة والضعف#
يحقق YOLOv9 متوسط دقة (mAP) متميزاً على مجموعات بيانات قياسية مثل COCO، مما يجعله مفضلاً للباحثين الذين يعطون الأولوية للدقة الخام. ومع ذلك، مثل YOLOv6، فإنه لا يزال يعتمد على تقنية قمع غير الأقصى (NMS) التقليدية للمعالجة اللاحقة. وهذا يضيف زمن انتقال ويعقد خط أنابيب نشر النموذج، خاصة عند النقل إلى أجهزة الحافة باستخدام تنسيقات مثل ONNX أو TensorRT.
Link to this sectionمقارنة الأداء#
عند مقارنة هذه النماذج، من الضروري النظر في التوازن بين الدقة وعدد المعلمات وسرعة الاستدلال.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Link to this sectionميزة Ultralytics: تقديم YOLO26#
بينما يوفر كل من YOLOv6-3.0 و YOLOv9 بنيات قوية، تتطلب بيئات الإنتاج نظاماً بيئياً مُداراً جيداً، ومتطلبات ذاكرة منخفضة، وسهولة استثنائية في الاستخدام. وهنا تتفوق منصة Ultralytics ونماذج مثل YOLO11 و YOLO26 المتطورة.
تم إصدار YOLO26 في أوائل عام 2026، وهو يعيد تعريف كفاءة النشر بشكل جذري من خلال القضاء على الاختناقات القديمة.
يتميز YOLO26 بتصميم خالٍ من NMS ومتكامل (End-to-End)، مما يلغي تماماً الحاجة إلى المعالجة اللاحقة لقمع غير الأقصى. وهذا يقلل بشكل كبير من تباين زمن استجابة الاستدلال ويبسط منطق نشر الحافة.
Link to this sectionابتكارات YOLO26 الرئيسية#
- مُحسِّن MuSGD: مستوحى من تدريب نماذج اللغات الكبيرة (مثل Kimi K2 من Moonshot AI)، يستخدم YOLO26 مزيجاً من SGD و Muon. وهذا يجلب استقراراً لا مثيل له في التدريب وتقارباً أسرع لمهام رؤية الكمبيوتر.
- سرعة استدلال على CPU تصل إلى 43% أسرع: على عكس تركيز YOLOv6 الكبير على GPU، تم تحسين YOLO26 بشكل كبير لأجهزة الحافة. تؤدي إزالة خسارة بؤرة التوزيع (DFL) إلى تبسيط الرأس، مما يجعله متوافقاً للغاية مع وحدات CPU منخفضة الطاقة وأجهزة الحوسبة الطرفية.
- ProgLoss + STAL: تعمل دوال الخسارة المتقدمة على تحسين اكتشاف الكائنات الصغيرة بشكل كبير، وهو أمر بالغ الأهمية لـ الصور الجوية والروبوتات.
- تعدد استخدامات لا مثيل له: بينما يعد YOLOv6 محرك اكتشاف بحت، يتعامل YOLO26 بسلاسة مع تجزئة المثيلات، والتصنيف، و تقدير الوضعية، واكتشاف مربع الإحاطة الموجه (OBB).
Link to this sectionتدريب سلس مع Ultralytics#
لا ينبغي أن يتطلب تدريب النماذج الحديثة نصوص برمجية معقدة. توفر واجهة برمجة تطبيقات Python الخاصة بـ Ultralytics تجربة مبسطة مع تحميل تلقائي للبيانات، وأدنى استخدام لذاكرة CUDA، وتتبع مدمج.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset using the robust MuSGD optimizer natively
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to ONNX with a single command
model.export(format="onnx")Link to this sectionحالات الاستخدام المثالية#
يعتمد اختيار البنية الصحيحة تماماً على بيئة النشر المستهدفة الخاصة بك:
- استخدم YOLOv6-3.0 لـ: أتمتة المصانع واكتشاف العيوب حيث تتوفر وحدات GPU بمستوى الخوادم (مثل A100s) بكثرة وتعمل المعالجة بالدفعات على زيادة الإنتاجية.
- استخدم YOLOv9 لـ: البحث الأكاديمي أو المسابقات حيث يكون الهدف الأساسي هو تحقيق أعلى mAP ممكن على مجموعات بيانات موحدة مثل COCO.
- استخدم YOLO26 لـ: جميع التطبيقات التجارية الحديثة تقريباً. بنيته الخالية من NMS، وبصمة الذاكرة المنخفضة، واستدلال CPU عالي السرعة تجعله مثالياً لـ أنظمة إنذار الأمن، والتجزئة الذكية، و تتبع الكائنات في الوقت الفعلي على الأجهزة المدمجة.
من خلال الاستفادة من النظام البيئي الشامل لـ Ultralytics، يمكن للمطورين تجربة YOLOv8 و YOLO11 و YOLO26 بسهولة للعثور على توازن الأداء المثالي لتحدياتهم الواقعية المحددة.