Link to this sectionYOLOv9 مقارنة بـ YOLOv6-3.0#
لقد كان تطور اكتشاف الكائنات في الوقت الفعلي مدفوعًا بالابتكارات المستمرة في بنيات الشبكات العصبية، مما أدى إلى تحسين التوازن الدقيق بين سرعة الاستدلال والدقة والكفاءة الحسابية. وبينما يتنقل المطورون والباحثون في المشهد المزدحم لأطر عمل رؤية الحاسوب، فإن مقارنة البنيات الرائدة أمر ضروري لاختيار الأداة المناسبة للمهمة.
يوفر هذا الدليل الفني مقارنة متعمقة بين نموذجين عاليي الأداء: YOLOv9، المشهور بقدرته على الاحتفاظ بمعلومات التعلم العميق، وYOLOv6-3.0، وهو نموذج مصمم خصيصًا للتطبيقات الصناعية.
Link to this sectionنظرة عامة على YOLOv9: تعظيم الاحتفاظ بالميزات#
تم تقديمه في أوائل عام 2024، ويعالج YOLOv9 أحد أكثر التحديات إلحاحًا في الشبكات العصبية العميقة: فقدان المعلومات أثناء عملية التغذية الأمامية. ومن خلال ضمان موثوقية التدرجات واحتفاظ خرائط الميزات بالبيانات المهمة، فإنه يدفع حدود الدقة النظرية.
- المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
- المنظمة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان
- التاريخ: 21 فبراير 2024
- روابط: ورقة بحثية على Arxiv، مستودع GitHub
Link to this sectionالهندسة المعمارية والمنهجيات#
يقدم YOLOv9 مفهوم معلومات التدرج القابلة للبرمجة (PGI) بجانب شبكة تجميع الطبقات الفعالة المعممة (GELAN). يعالج PGI عنق زجاجة المعلومات من خلال توفير إشراف مساعد يضمن تعلم الشبكة الرئيسية لميزات قوية وموثوقة دون إضافة عبء استدلال. وفي الوقت نفسه، يعمل GELAN على تحسين استخدام المعلمات، مما يسمح للنموذج بتحقيق أفضل دقة متوسطة (mAP) مع الحفاظ على التكلفة الحسابية في حدود معقولة. وهذا يجعله خيارًا استثنائيًا لـ تحليل الصور الطبية أو اكتشاف الكائنات الصغيرة للغاية حيث تكون دقة الميزات أمرًا بالغ الأهمية.
Link to this sectionنظرة عامة على YOLOv6-3.0: صُمم للمقياس الصناعي#
تم تطوير YOLOv6-3.0 (المشار إليه أيضًا بـ v3.0) بواسطة Meituan، وهو مصمم من الأساس لخدمة التطبيقات الصناعية الشاقة. تم إصداره في أوائل عام 2023، ويركز بشكل كبير على كفاءة النشر، حيث يوفر مجموعة من النماذج المتوافقة مع التكميم والتي تتفوق على أجهزة الحافة.
- المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
- المنظمة: Meituan
- التاريخ: 13 يناير 2023
- روابط: ورقة بحثية على Arxiv، مستودع GitHub
Link to this sectionالهندسة المعمارية والمنهجيات#
يتميز YOLOv6-3.0 باستراتيجياته RepOptimizer و التدريب المدعوم بالمرساة (AAT). يستخدم النموذج تصميم شبكة عصبية واعية بالأجهزة مستوحى من RepVGG، مما يسمح له بالعمل بسرعة فائقة على وحدات معالجة الرسومات (GPUs) أثناء الاستدلال عن طريق دمج الطبقات. وعمل تحديث 3.0 على تحسين البنية بشكل أكبر من خلال إدخال وحدة ربط ثنائية الاتجاه (BiC) لتحسين دقة التحديد. ونظرًا لأنه محسّن للغاية لتنسيقات النشر مثل TensorRT و OpenVINO، فإن YOLOv6-3.0 يُعتمد غالبًا في الخدمات اللوجستية، وأتمتة التصنيع، وبيئات الخوادم ذات الإنتاجية العالية.
Link to this sectionمقارنة الأداء#
عند تقييم هذه النماذج على مجموعة بيانات COCO القياسية، يمكننا ملاحظة مقايضات متميزة بين الدقة وسرعة الاستدلال الخام.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Link to this sectionتحليل تقني#
بينما يتصدر YOLOv6-3.0n من حيث السرعة الخام على أجهزة T4 (1.17 مللي ثانية)، يتمكن YOLOv9t من استخراج mAP أعلى قليلاً (38.3%) مع استخدام أقل من نصف المعلمات (2.0 مليون مقابل 4.7 مليون) وعدد أقل بكثير من FLOPs. بالنسبة للمتطلبات المعقدة وعالية الدقة، يدفع YOLOv9e الضخم الدقة إلى 55.6% mAP، مما يوضح قوة بنية PGI في الشبكات العميقة.
إذا كنت تبدأ مبادرة جديدة في رؤية الحاسوب، فإننا نوصي بشدة باستخدام YOLO26. تم إصداره في عام 2026، ويتميز بتصميم End-to-End NMS-Free أصلي يلغي زمن انتقال ما بعد المعالجة تمامًا، مما يفتح المجال لـ استدلال أسرع على وحدة المعالجة المركزية بنسبة تصل إلى 43%.
Link to this sectionميزة نظام Ultralytics البيئي#
بغض النظر عن الفلسفة المعمارية للنموذج التي تجذبك، فإن تنفيذها أصليًا من خلال Ultralytics Python API يوفر تجربة مطور فائقة.
Link to this sectionسهولة الاستخدام وكفاءة التدريب#
يتطلب تدريب نماذج التعلم العميق المعقدة تقليديًا الكثير من التعليمات البرمجية النمطية. تعمل منصة Ultralytics على تجريد هذه التعقيدات. سواء كنت تقوم بضبط YOLOv9 لـ اكتشاف العيوب أو تصدير YOLOv6 لتطبيقات الجوال، فإن سير العمل يظل متسقًا بشكل ملحوظ.
علاوة على ذلك، تتميز بنيات Ultralytics عمومًا بمتطلبات ذاكرة CUDA أقل أثناء التدريب مقارنة بنماذج المحولات الضخمة. وهذا يسمح للمطورين باستخدام أحجام دفعات أكبر على وحدات معالجة الرسومات (GPUs) المخصصة للمستهلكين، مما يحسن كفاءة التدريب بشكل كبير.
from ultralytics import YOLO
# Easily swap architectures by changing the weights file string
# model = YOLO("yolov6n.pt")
model = YOLO("yolov9c.pt")
# Train the model with built-in data augmentation and caching
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")
# Export to ONNX or TensorRT seamlessly
model.export(format="engine", quantize=16)Link to this sectionتعدد استخدامات لا مثيل له عبر مهام الرؤية#
بينما تم تحسين YOLOv6-3.0 بشكل كبير لإنشاء مربعات الإحاطة السريعة، غالبًا ما تتطلب مشاريع رؤية الحاسوب الحديثة نهجًا متعدد المهام. تحظى نماذج Ultralytics بشهرة واسعة لتعدد استخداماتها الفائق. ومع أدوات مثل Ultralytics YOLOv8 و YOLO26 الأحدث، يتعامل إطار عمل واحد بسلاسة مع اكتشاف الكائنات، وتجزئة المثيلات، وتصنيف الصور، وتقدير الوضع، ومربعات الإحاطة الموجهة (OBB).
Link to this sectionتقديم YOLO26: المعيار الجديد#
بالنسبة للمؤسسات التي تتطلع إلى زيادة الأداء وسهولة النشر إلى أقصى حد، يمثل YOLO26 التقارب النهائي بين السرعة والدقة.
بناءً على نجاحات YOLO11، يقدم YOLO26 العديد من الميزات التي تغير النموذج:
- MuSGD Optimizer: مستوحى من تقنيات تدريب نماذج اللغات الكبيرة (LLM) مثل Kimi K2 من Moonshot AI، يضمن هذا المحسن الهجين تدريبًا مستقرًا للغاية وتقاربًا سريعًا.
- إزالة DFL: من خلال إزالة Distribution Focal Loss، يبسط YOLO26 رسم بياني التصدير، مما يجعله أكثر توافقًا بشكل ملحوظ مع رقائق حوسبة الحافة منخفضة الطاقة.
- ProgLoss + STAL: تحقق دوال الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو أمر بالغ الأهمية لـ عمليات الطائرات بدون طيار وتطبيقات إنترنت الأشياء (IoT).
- تحسينات خاصة بالمهمة: يتضمن YOLO26 نماذج أولية أصلية متعددة المقاييس للتجزئة، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لتتبع الهيكل العظمي، وخوارزميات خسارة الزاوية المتخصصة لحل الحالات الحافة في اكتشاف OBB.
Link to this sectionسيناريوهات النشر المثالية#
يعتمد اختيار البنية الصحيحة في النهاية على قيود الإنتاج الخاصة بك.
اختر YOLOv6-3.0 إذا كان لديك خط أنابيب راسخ في التصنيع الصناعي، وتعتمد بشكل كبير على التكميم، وتستخدم مسرعات استدلال متخصصة حيث تحتاج إلى أقل زمن انتقال للأجهزة على مستوى الميلي ثانية.
اختر YOLOv9 إذا كنت تتعامل مع تشخيصات الرعاية الصحية المعقدة أو المراقبة بعيدة المدى حيث لا يكون فقدان الميزات الدقيقة على مستوى البكسل خيارًا مقبولًا.
ومع ذلك، بالنسبة لنهج متوازن تمامًا يوفر دقة متطورة جنبًا إلى جنب مع نشر مبسط خالٍ من NMS، تبرز Ultralytics YOLO26 كالتوصية النهائية لهندسة رؤية الحاسوب الحديثة. إن دورة تطويرها النشطة، وتوثيقها الشامل، ودعم المجتمع الحيوي يجعلها أداة لا غنى عنها للباحثين والمطورين على حد سواء.