YOLOv6.0 مقابل YOLOv9: التطورات في مجال الكشف عن الأجسام عالي الأداء

تميز تطور بنى الكشف عن الأجسام بالسعي المستمر لتحقيق التوازن الأمثل بين سرعة الاستدلال ودقة الكشف. تتعمق هذه المقارنة في YOLOv6.YOLOv6، وهو نموذج قوي على مستوى صناعي طورته Meituan، و YOLOv9، وهي بنية تركز على البحث وتقدم مفاهيم جديدة في إدارة معلومات التدرج. من خلال تحليل البنى ومقاييس الأداء وحالات الاستخدام المثالية، يمكن للمطورين اتخاذ قرارات مستنيرة بشأن خطوط إنتاج الرؤية الحاسوبية الخاصة بهم.

مقارنة مقاييس الأداء

يعرض الجدول التالي مقارنة مباشرة بين مؤشرات الأداء الرئيسية. YOLOv9 تقدم دقة أعلى (mAP) بشكل عام لنماذج ذات أحجام مماثلة، مستفيدة من تقنيات تجميع الميزات المتقدمة، بينما تظل YOLOv6.YOLOv6 قادرة على المنافسة في بيئات معينة GPU.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLOv6-3.0n	640	37.5	-	1.17	4.7	11.4
YOLOv6-3.0s	640	45.0	-	2.66	18.5	45.3
YOLOv6-3.0m	640	50.0	-	5.28	34.9	85.8
YOLOv6-3.0l	640	52.8	-	8.95	59.6	150.7

YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

YOLOv6.0: الدقة الصناعية

YOLOv6، ولا سيما الإصدار 3.0، تم تصميمه مع التركيز بشكل واضح على التطبيقات الصناعية حيث غالبًا ما يتضمن نشر الأجهزة وحدات معالجة الرسومات مثل NVIDIA T4. ويؤكد على سهولة النشر من خلال التحسين القوي للتكمية TensorRT .

المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
المؤسسة:Meituan
التاريخ: 2023-01-13
Arxiv:YOLOv6 v3.0: A Full-Scale Reloading
GitHub:meituan/YOLOv6

الهيكلة ونقاط القوة

يستخدم YOLOv6 هيكل أساسي من نوع RepVGG، يُعرف باسم EfficientRep، والذي يستخدم إعادة تحديد المعلمات الهيكلية. أثناء التدريب، يستخدم النموذج كتل متعددة الفروع لتعلم الميزات المعقدة، ولكن أثناء الاستدلال، تنهار هذه الكتل إلى تلافيف مفردة بحجم 3×3. هذه البنية سهلة الاستخدام للغاية GPU حيث تزيد من إنتاجية الذاكرة وتقلل من زمن الاستجابة.

تشمل الميزات الرئيسية ما يلي:

الاندماج ثنائي الاتجاه: يعزز انتشار الميزات عبر مستويات مختلفة، مما يحسن من اكتشاف الأجسام ذات الأحجام المتنوعة.
التدريب بمساعدة المرجع (AAT): يجمع بين مزايا النماذج القائمة على المرجع والنماذج الخالية من المرجع أثناء التدريب لتثبيت التقارب.
الاستعداد للتكمية: مصمم خصيصًا لتقليل فقدان الدقة عند التكمية إلى INT8، وهو مطلب أساسي لأجهزة الذكاء الاصطناعي المتطورة في أتمتة التصنيع.

تعرف على المزيد حول YOLOv6

YOLOv9: معالجة Information Bottlenecks

YOLOv9 يتبع نهجًا نظريًا لتحسين كفاءة التعلم العميق من خلال معالجة مشكلة "اختناق المعلومات"، حيث يتم فقدان البيانات أثناء مرورها عبر الشبكات العميقة. ويقدم آليات للحفاظ على معلومات التدرج الحرجة طوال عملية التدريب.

المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
المنظمة: معهد علوم المعلومات، أكاديميا سينيكا، تايوان
التاريخ: 2024-02-21
Arxiv:YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
GitHub:WongKinYiu/yolov9

الهيكلة ونقاط القوة

YOLOv9 الابتكار الأساسي لـ YOLOv9 في مكونين رئيسيين:

GELAN (شبكة تجميع الطبقات العامة الفعالة): بنية جديدة تجمع بين مزايا CSPNet و ELAN لتعظيم كفاءة المعلمات وسرعة الحساب. تتيح هذه البنية للنموذج تعلم ميزات أكثر قوة باستخدام معلمات أقل مقارنة بالأجيال السابقة مثل YOLOv8.
PGI (معلومات التدرج القابلة للبرمجة): إطار عمل إضافي للإشراف يضمن حصول الطبقات العميقة للشبكة على معلومات تدرج موثوقة أثناء التدريب. وهذا مفيد بشكل خاص للمهام التي تتطلب دقة عالية، مثل تحليل الصور الطبية.

YOLOv9 أداءً فائقًا من حيث كفاءة المعلمات، حيث يحقق mAP أعلى mAP معلمات أقل من العديد من المنافسين، مما يجعله خيارًا ممتازًا للبحوث والسيناريوهات التي يمثل فيها حجم وزن النموذج قيدًا.

تعرف على المزيد حول YOLOv9

المقارنة التقنية وحالات الاستخدام

YOLOv9 يعتمد الاختيار بين YOLOv6.0 و YOLOv9 على الأجهزة المستهدفة المحددة وطبيعة التطبيق.

متى تختار YOLOv6-3.0

يتميز YOLOv6.YOLOv6 في البيئاتGPU. تم تحسين هيكل RepVGG الخاص به للمعالجة المتوازية، مما يجعله أسرع على أجهزة مثل NVIDIA أو Jetson Orin عند استخدام TensorRT. وهو مثالي لـ:

التصنيع عالي السرعة: أنظمة مراقبة الجودة على خطوط التجميع حيث الإنتاجية أمر بالغ الأهمية.
تحليلات الفيديو: معالجة تدفقات فيديو متعددة في وقت واحد في عمليات نشر المدن الذكية.
التكامل القديم: أنظمة تم تحسينها بالفعل لتناسب البنى الهندسية من نوع RepVGG.

متى تختار YOLOv9

YOLOv9 في التطبيقات والأبحاث التي تتطلب دقة عالية. فهيكلته المتطورة تحافظ على التفاصيل الدقيقة بشكل أفضل من العديد من سابقاتها. وهو مناسب للاستخدام في:

البحث الأكاديمي: أساس قوي لدراسة تجميع الميزات وتدفق التدرج.
الكشف عن الأجسام الصغيرة: يساعد إطار عمل PGI في الاحتفاظ بالمعلومات المتعلقة بالأهداف الصغيرة التي قد تضيع في الطبقات العميقة، وهو أمر مفيد للصور الجوية.
الأجهزة المقيدة بالمعلمات: عندما تكون مساحة التخزين محدودة، فإن نسبة الدقة العالية إلى المعلمات YOLOv9 تعتبر ميزة.

مرونة النشر

في حين أن كلا النموذجين لهما نقاط قوة محددة، إلا أن تحويلهما للنشر قد يختلف في درجة تعقيده. تتطلب خطوة إعادة تحديد معلمات YOLOv6 معالجة دقيقة أثناء التصدير، في حين يتم إزالة الفروع الإضافية YOLOv9 الخاصة بـ PGI أثناء الاستدلال، مما يبسط بنية النموذج النهائي.

ميزة النظام البيئي لـ Ultralytics

في حين YOLOv9 YOLOv6 YOLOv9 معلمين هامين، فإن Ultralytics منصة موحدة تبسط دورة حياة التعلم الآلي بأكملها. سواء كنت تستخدم YOLOv6 أو YOLOv9 أو YOLO26 المتطور، Ultralytics تجربة متسقة وقوية.

لماذا التطوير مع Ultralytics؟

سهولة الاستخدام: تقومPython Ultralytics Python بتلخيص حلقات التدريب المعقدة في بضع أسطر من التعليمات البرمجية. يمكنك التبديل بين البنى ببساطة عن طريق تغيير سلسلة اسم النموذج، على سبيل المثال، من yolov6n.pt إلى yolo26n.pt.
نظام بيئي جيد الصيانة: على عكس مستودعات الأبحاث التي غالبًا ما تصبح غير نشطة بعد النشر، يتم صيانة Ultralytics بشكل نشط. وهذا يضمن التوافق مع أحدث إصدارات PyTorchو CUDA وتنسيقات التصدير مثل ONNX.
تعدد الاستخدامات: Ultralytics مجموعة واسعة من مهام الرؤية الحاسوبية. بينما يركز YOLOv6 YOLOv9 على الكشف، فإن Ultralytics نطاق القدرات ليشمل تقسيم المثيلات وتقدير الوضع وكشف الكائنات الموجهة (OBB).
كفاءة التدريب: تم تحسين مسارات Ultralytics من أجل كفاءة الذاكرة، مما يسمح للمطورين بتدريب نماذج أكبر على وحدات معالجة الرسومات (GPU) المخصصة للمستهلكين مقارنةً بالهجينة المحولة التي تستهلك الكثير من الذاكرة.

مثال على الكود: تدريب سلس

تدريب أي من هذه النماذج ضمن Ultralytics متطابق، مما يقلل من منحنى التعلم لفريقك.

from ultralytics import YOLO

# Load a model: Switch between 'yolov6n.pt', 'yolov9c.pt', or 'yolo26n.pt'
model = YOLO("yolo26n.pt")

# Train on a dataset (e.g., COCO8)
# The system handles data augmentation, logging, and checkpointing automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

الترقية إلى YOLO26: الجيل التالي

بالنسبة للمطورين الذين يبحثون عن الأفضل على الإطلاق في الأداء والكفاءة وسهولة النشر، يمثل YOLO26 قمة YOLO . تم إصداره في يناير 2026، وهو يعتمد على الدروس المستفادة من YOLOv6 و YOLOv9 و YOLOv10 لتقديم تجربة فائقة الجودة.

المزايا الرئيسية لـ YOLO26

تصميم شامل NMS: على عكس YOLOv6 YOLOv9 اللذين يتطلبان معالجة لاحقة لـ Non-Maximum Suppression (NMS)، فإن YOLO26 شامل بطبيعته. وهذا يزيل تقلب زمن الاستجابة ويبسط خطوط الإنتاج، خاصة على الأجهزة الطرفية.
MuSGD Optimizer: مستوحى من الابتكارات في تدريب LLM، يعمل MuSGD Optimizer (مزيج من SGD Muon) على استقرار التدريب وتسريع التقارب، مما يقلل من الوقت والموارد الحاسوبية اللازمة لتدريب النماذج المخصصة.
أداء محسّن على الحافة: بفضل إزالة Distribution Focal Loss (DFL) والتحسينات المعمارية، يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU مقارنةً بالأجيال السابقة. وهذا يجعله الخيار المثالي للبيئات CPU مثل Raspberry Pi أو الهواتف المحمولة.
وظائف الخسارة المتقدمة: يؤدي دمج ProgLoss و STAL إلى تحسين التعرف على الأجسام الصغيرة ودقة مربع الحدود بشكل كبير، مما يعالج نقاط الضعف الشائعة في YOLO السابقة YOLO .
إتقان مهام محددة: لا يقتصر دور YOLO26 على الكشف فحسب، بل يتميز بتحسينات متخصصة مثل فقدان التجزئة الدلالية لمهام التجزئة وتقدير الاحتمالية المتبقية (RLE) لتقدير الوضع بدقة عالية.

استكشف وثائق YOLO26

الخلاصة

YOLOv9 كل من YOLOv6. YOLOv6 و YOLOv9 مزايا مميزة لمجالات محددة —YOLOv6 الإنتاج الصناعية GPU و YOLOv9 عالية الدقة. ومع ذلك، بالنسبة للحلول المستقبلية التي توازن بين السرعة والدقة وسهولة النشر عبر جميع أنواع الأجهزة، يبرز Ultralytics كخيار موصى به لتطوير الرؤية الحاسوبية الحديثة.

YOLOv6.0 مقابل YOLOv9: التطورات في مجال الكشف عن الأجسام عالي الأداء

مقارنة مقاييس الأداء

YOLOv6.0: الدقة الصناعية

الهيكلة ونقاط القوة

YOLOv9: معالجة Information Bottlenecks

الهيكلة ونقاط القوة

المقارنة التقنية وحالات الاستخدام

متى تختار YOLOv6-3.0

متى تختار YOLOv9

ميزة النظام البيئي لـ Ultralytics

لماذا التطوير مع Ultralytics؟

مثال على الكود: تدريب سلس

الترقية إلى YOLO26: الجيل التالي

المزايا الرئيسية لـ YOLO26

الخلاصة

تعليقات